Zgradite filmski klepetalni robot za TV/OTT platforme z uporabo Retrieval Augmented Generation v Amazon Bedrock

Ponovno objavil Platon

Spremljevalci: 0

Izboljšanje tega, kako uporabniki odkrivajo nove vsebine, je ključnega pomena za povečanje angažiranosti in zadovoljstva uporabnikov na medijskih platformah. Samo iskanje po ključnih besedah ima težave pri zajemanju semantike in namena uporabnika, kar vodi do rezultatov brez ustreznega konteksta; na primer iskanje večernih zmenkov ali filmov z božično tematiko. To lahko povzroči nižje stopnje zadrževanja, če uporabniki ne morejo zanesljivo najti želene vsebine. Vendar pa s veliki jezikovni modeli (LLM), obstaja priložnost za rešitev teh semantičnih izzivov in izzivov namena uporabnika. S kombiniranjem vgradnje ki zajemajo semantiko s tehniko, imenovano Retrieval Augmented Generation (RAG), lahko ustvarite ustreznejše odgovore na podlagi pridobljenega konteksta iz lastnih podatkovnih virov.

V tej objavi vam pokažemo, kako varno ustvarite filmski chatbot z implementacijo RAG z uporabo lastnih podatkov Baze znanja za Amazon Bedrock. Uporabljamo nabor podatkov IMDb in Box Office Mojo za simulacijo kataloga za stranke v medijih in zabavi ter predstavimo, kako lahko zgradite svojo lastno rešitev RAG v samo nekaj korakih.

Pregled rešitev

O IMDb in Box Office Mojo Movies/TV/OTT licenčni podatkovni paket ponuja širok nabor zabavnih metapodatkov, vključno z več kot 1.6 milijardo uporabniških ocen; zasluge za več kot 13 milijonov igralcev in članov ekipe; 10 milijonov filmov, TV in razvedrilnih naslovov; in podatki o svetovnih blagajnah iz več kot 60 držav. Številne stranke medijev in zabave AWS licencirajo podatke IMDb Izmenjava podatkov AWS izboljšati odkrivanje vsebine ter povečati sodelovanje in zadrževanje strank.

Uvod v baze znanja za Amazon Bedrock

Da bi LLM opremili s posodobljenimi lastniškimi informacijami, organizacije uporabljajo RAG, tehniko, ki vključuje pridobivanje podatkov iz podatkovnih virov podjetja in obogatitev poziva s temi podatki za zagotavljanje ustreznejših in natančnejših odgovorov. Baze znanja za Amazon Bedrock omogočajo popolnoma upravljano zmogljivost RAG, ki vam omogoča prilagajanje LLM odzivov s kontekstualnimi in ustreznimi podatki podjetja. Baze znanja avtomatizirajo potek dela RAG od konca do konca, vključno z zaužitjem, priklicem, hitrim dopolnjevanjem in navedbami, pri čemer vam ni treba pisati kode po meri za integracijo virov podatkov in upravljanje poizvedb. Baze znanja za Amazon Bedrock omogočajo tudi večkratne pogovore, tako da lahko LLM odgovori na zapletena uporabniška vprašanja s pravilnim odgovorom.

Kot del te rešitve uporabljamo naslednje storitve:

Sprehodimo se skozi naslednje korake na visoki ravni:

Vnaprej obdelajte podatke IMDb, da ustvarite dokumente iz vsakega filmskega zapisa in naložite podatke v Preprosta storitev shranjevanja Amazon (Amazon S3) vedro.
Ustvarite bazo znanja.
Sinhronizirajte svojo bazo znanja z virom podatkov.
Uporabite bazo znanja, da odgovorite na semantične poizvedbe o filmskem katalogu.

Predpogoji

Podatki IMDb, uporabljeni v tej objavi, zahtevajo licenco za komercialno vsebino in plačano naročnino na IMDb in licenčni paket Box Office Mojo Movies/TV/OTT na AWS Data Exchange. Za povpraševanje o licenci in dostop do vzorčnih podatkov obiščite developer.imdb.com. Za dostop do nabora podatkov glejte Priporočilo moči in iskanje z uporabo grafikona znanja IMDb – 1. del in sledite navodilom Dostop do podatkov IMDb oddelek.

Vnaprej obdelajte podatke IMDb

Preden ustvarimo bazo znanja, moramo vnaprej obdelati nabor podatkov IMDb v besedilne datoteke in jih naložiti v vedro S3. V tej objavi simuliramo katalog strank z uporabo nabora podatkov IMDb. Za katalog vzamemo 10,000 priljubljenih filmov iz nabora podatkov IMDb in sestavimo nabor podatkov.

Uporabite naslednje prenosnik ustvarite nabor podatkov z dodatnimi informacijami, kot so imena igralcev, režiserjev in producentov. Z naslednjo kodo ustvarimo eno datoteko za film z vsemi informacijami, shranjenimi v datoteki, v nestrukturiranem besedilu, ki ga lahko razumejo LLM:

def create_txt_files_imdb(row): full_text = "" full_text += f"{row['originalTitle']} ({row['titleId']}) was shot in year {int(row['year'])} with rating {row['rating']} and poster url {row['poster_url']}.nn" full_text += f"{row['originalTitle']} has genres {', '.join(row['genres'])}.nn" full_text += f"{row['originalTitle']} has actors {', '.join(row['Actors'])}.nn" full_text += f"{row['originalTitle']} has directors {', '.join(row['Directors'])}.nn" full_text += f"{row['originalTitle']} has producers {', '.join(row['Producers'])}.nn" full_text += f"{row['originalTitle']} has keyword {', '.join([x.replace('-',' ') for x in row['keyword']])}.nn" full_text += f"{row['originalTitle']} has location {', '.join(row['location'])}.nn" full_text += f"{row['originalTitle']} has plot {row['plot']}.nn" with open(f"<path>/data/imdb_data/{row['titleId']}.txt","w") as f: f.write(full_text) return full_text

Ko imate podatke v formatu .txt, jih lahko naložite v Amazon S3 z naslednjim ukazom:

aws s3 cp <path to local data> s3://<bucket-name>/<path>/ --recursive

Ustvari bazo znanja IMDb

Izvedite naslednje korake, da ustvarite svojo bazo znanja:

Na konzoli Amazon Bedrock izberite Baza znanja v podoknu za krmarjenje.
Izberite Ustvarite bazo znanja.
za Ime baze znanja, vnesite imdb.
za Opis baze znanja, vnesite izbirni opis, kot je baza znanja za vnos in shranjevanje podatkov imdb.
za IAM dovoljenjatako, da izberete Ustvarite in uporabite novo storitveno vlogo, nato pa vnesite ime za svojo novo storitveno vlogo.
Izberite Naslednji.

stran konzole s podrobnostmi zbirke znanja

za Ime vira podatkov, vnesite imdb-s3.
za S3 URI, vnesite URI S3, v katerega ste naložili podatke.
v Napredne nastavitve – neobvezno odsek, za Strategija drobljenja, izberite Brez drobljenja.
Izberite Naslednji.

Baze znanja vam omogočajo, da svoje dokumente razdelite na manjše segmente, da vam olajša obdelavo velikih dokumentov. V našem primeru smo podatke že razdelili v dokument manjše velikosti (po enega na film).

konzola baze znanja 2

v Vektorska baza podatkov izberite, izberite Hitro ustvarite novo vektorsko trgovino.

Amazon Bedrock bo samodejno ustvaril popolnoma upravljano zbirko vektorskega iskanja OpenSearch Serverless in konfiguriral nastavitve za vdelavo vaših virov podatkov z uporabo izbranega modela Titan Embedding G1 – Text embedding.

vektorska stran zbirke znanja

Izberite Naslednji.

Zgradite filmski chatbot za TV/OTT platforme z uporabo Retrieval Augmented Generation v Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai.

Preglejte svoje nastavitve in izberite Ustvarite bazo znanja.

Sinhronizirajte svoje podatke z bazo znanja

Zdaj, ko ste ustvarili bazo znanja, jo lahko sinhronizirate s svojimi podatki.

Na konzoli Amazon Bedrock se pomaknite do svoje baze znanja.
v Vir podatkov oddelek, izberite Sinhronizacija.

sinhronizacija baze znanja

Ko je vir podatkov sinhroniziran, ste pripravljeni na poizvedbo po podatkih.

Izboljšajte iskanje z uporabo semantičnih rezultatov

Izvedite naslednje korake, da preizkusite rešitev in izboljšate iskanje z uporabo semantičnih rezultatov:

Na konzoli Amazon Bedrock se pomaknite do svoje baze znanja.
Izberite svojo bazo znanja in izberite Preizkusite bazo znanja.
Izberite Izberite model, in izberite Antropični Claude v2.1.
Izberite Uporabi.

Zdaj ste pripravljeni na poizvedovanje po podatkih.

Postavimo lahko nekaj semantičnih vprašanj, na primer "Priporočite mi nekaj filmov z božično tematiko."

poizvedba Priporočite mi nekaj filmov z božično tematiko.

Odgovori baze znanja vsebujejo citate, ki jih lahko raziščete za pravilnost in dejanskost odgovorov.

citati baze znanja

Iz teh filmov se lahko tudi poglobite v informacije, ki jih potrebujete. V naslednjem primeru se vprašamo "kdo je režiral nočno moro pred božičem?"

"kdo je režiral nočno moro pred božičem?"

Postavite lahko tudi bolj specifična vprašanja v zvezi z žanri in ocenami, na primer »pokaži mi klasične animirane filme z ocenami nad 7?«

mi pokaže klasične animirane filme z ocenami nad 7?

Povečajte svojo bazo znanja z agenti

Zastopniki za Amazon Bedrock vam pomaga avtomatizirati zapletene naloge. Agenti lahko uporabniško poizvedbo razdelijo na manjše naloge in pokličejo API-je po meri ali baze znanja, da dopolnijo informacije za izvajanje dejanj. Z agenti za Amazon Bedrock lahko razvijalci integrirajo inteligentne agente v svoje aplikacije, pospešijo dostavo aplikacij, ki jih poganja AI in prihranijo tedne časa za razvoj. Z agenti lahko razširite svojo bazo znanja tako, da dodate več funkcij, kot so priporočila iz Amazonska prilagoditev za priporočila za posamezne uporabnike ali izvajanje dejanj, kot je filtriranje filmov glede na potrebe uporabnikov.

zaključek

V tej objavi smo pokazali, kako z uporabo Amazon Bedrock v nekaj korakih zgraditi pogovornega filmskega klepetalnika za odgovor na semantično iskanje in pogovorne izkušnje na podlagi vaših lastnih podatkov ter nabora podatkov IMDb in Box Office Mojo Movies/TV/OTT. V naslednji objavi bomo šli skozi postopek dodajanja več funkcionalnosti vaši rešitvi z uporabo agentov za Amazon Bedrock. Če želite začeti z bazami znanja na Amazon Bedrock, glejte Baze znanja za Amazon Bedrock.

O avtorjih

Zgradite filmski chatbot za TV/OTT platforme z uporabo Retrieval Augmented Generation v Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Gaurav Rele je višji podatkovni znanstvenik v Generative AI Innovation Center, kjer sodeluje s strankami AWS v različnih vertikalah, da bi pospešil njihovo uporabo generativne umetne inteligence in storitev AWS Cloud za reševanje njihovih poslovnih izzivov.

Zgradite filmski chatbot za TV/OTT platforme z uporabo Retrieval Augmented Generation v Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Divya Bhargavi je višja vodja uporabnih znanstvenikov v Generative AI Innovation Center, kjer rešuje pomembne poslovne probleme za stranke AWS z uporabo generativnih metod AI. Ukvarja se z razumevanjem in iskanjem slik/videoposnetkov, velikimi jezikovnimi modeli z razširjenim grafom znanja in prilagojenimi primeri uporabe oglaševanja.

Zgradite filmski chatbot za TV/OTT platforme z uporabo Retrieval Augmented Generation v Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Suren Gunturu je Data Scientist, ki dela v Generative AI Innovation Center, kjer sodeluje z različnimi strankami AWS pri reševanju poslovnih problemov visoke vrednosti. Specializiran je za gradnjo cevovodov ML z uporabo velikih jezikovnih modelov, predvsem prek Amazon Bedrock in drugih storitev AWS Cloud.

Zgradite filmski chatbot za TV/OTT platforme z uporabo Retrieval Augmented Generation v Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Navpično iskanje. Ai. Vidya Sagar Ravipati je znanstveni vodja v Generative AI Innovation Center, kjer izkorišča svoje bogate izkušnje v obsežnih porazdeljenih sistemih in svojo strast do strojnega učenja, da pomaga strankam AWS v različnih industrijskih vertikalah pospešiti njihovo umetno inteligenco in sprejemanje v oblaku.

Distribucija vsebine in PR s pomočjo SEO. Okrepite se še danes.
PlatoData.Network Vertical Generative Ai. Opolnomočite se. Dostopite tukaj.
PlatoAiStream. Web3 Intelligence. Razširjeno znanje. Dostopite tukaj.
PlatoESG. Ogljik, CleanTech, Energija, Okolje, sončna energija, Ravnanje z odpadki. Dostopite tukaj.
PlatoHealth. Obveščanje o biotehnologiji in kliničnih preskušanjih. Dostopite tukaj.
vir: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/

Časovni žig: Januar 31, 2024

Časovni žig: December 22, 2023

Ponovno objavil Platon

Zaznavanje anomalij z Amazon SageMaker Edge Manager z uporabo AWS IoT Greengrass V2

Izvedite analize kaj če z Amazon Forecast, do 80 % hitreje kot prej

InformedIQ avtomatizira preverjanja za samodejno posojanje podjetja Origence s pomočjo strojnega učenja

Izdelajte generativne agente AI z Amazon Bedrock, Amazon DynamoDB, Amazon Kendra, Amazon Lex in LangChain | Spletne storitve Amazon

O nas

Navpično iskanje in Ai

Platforma

Ostanite povezani

Račun