Bouw een filmchatbot voor TV/OTT-platforms met behulp van Retrieval Augmented Generation in Amazon Bedrock

Heruitgegeven door Plato

volgers: 0

Het verbeteren van de manier waarop gebruikers nieuwe inhoud ontdekken is van cruciaal belang om de betrokkenheid en tevredenheid van gebruikers op mediaplatforms te vergroten. Alleen het zoeken op trefwoorden levert problemen op bij het vastleggen van de semantiek en de intentie van de gebruiker, wat leidt tot resultaten zonder relevante context; bijvoorbeeld het vinden van films met een date night of kerstthema. Dit kan leiden tot lagere retentiepercentages als gebruikers de gewenste inhoud niet op betrouwbare wijze kunnen vinden. Echter, met grote taalmodellen (LLM's) bestaat er een mogelijkheid om deze semantische en gebruikersintentieproblemen op te lossen. Door te combineren inbedding die semantiek vastleggen met een techniek genaamd Ophalen van Augmented Generation (RAG), kunt u relevantere antwoorden genereren op basis van de opgehaalde context uit uw eigen gegevensbronnen.

In dit bericht laten we u zien hoe u veilig een filmchatbot kunt maken door RAG te implementeren met uw eigen gegevens kennisbanken For Amazonebodem. We gebruiken de IMDb- en Box Office Mojo-dataset om een catalogus voor media- en entertainmentklanten te simuleren en te laten zien hoe u in slechts een paar stappen uw eigen RAG-oplossing kunt bouwen.

Overzicht oplossingen

De IMDb en Box Office Mojo Movies/TV/OTT licentieerbaar datapakket biedt een breed scala aan entertainmentmetadata, waaronder meer dan 1.6 miljard gebruikersbeoordelingen; credits voor meer dan 13 miljoen cast- en crewleden; 10 miljoen film-, tv- en amusementstitels; en wereldwijde box office-rapportagegegevens uit meer dan 60 landen. Veel AWS media- en entertainmentklanten geven licenties voor IMDb-gegevens via AWS-gegevensuitwisseling om de ontdekking van inhoud te verbeteren en de betrokkenheid en retentie van klanten te vergroten.

Inleiding tot kennisbanken voor Amazon Bedrock

Om een LLM uit te rusten met actuele bedrijfseigen informatie, gebruiken organisaties RAG, een techniek waarbij gegevens uit bedrijfsgegevensbronnen worden opgehaald en de prompt met die gegevens wordt verrijkt om relevantere en nauwkeurigere antwoorden te geven. Knowledge Bases voor Amazon Bedrock maken een volledig beheerde RAG-mogelijkheid mogelijk waarmee u LLM-reacties kunt aanpassen met contextuele en relevante bedrijfsgegevens. Knowledge Bases automatiseren de end-to-end RAG-workflow, inclusief opname, ophalen, promptvergroting en citaties, waardoor u geen aangepaste code hoeft te schrijven om gegevensbronnen te integreren en query's te beheren. Knowledge Bases voor Amazon Bedrock maken ook gesprekken met meerdere beurten mogelijk, zodat de LLM complexe gebruikersvragen met het juiste antwoord kan beantwoorden.

We gebruiken de volgende diensten als onderdeel van deze oplossing:

We doorlopen de volgende stappen op hoog niveau:

Verwerk de IMDb-gegevens voor om documenten van elke filmopname te maken en upload de gegevens naar een Amazon eenvoudige opslagservice (Amazon S3) emmer.
Creëer een kennisbank.
Synchroniseer uw kennisbank met uw gegevensbron.
Gebruik de kennisbank om semantische vragen over de filmcatalogus te beantwoorden.

Voorwaarden

De IMDb-gegevens die in dit bericht worden gebruikt, vereisen een commerciële inhoudslicentie en een betaald abonnement op IMDb en Box Office Mojo Movies/TV/OTT-licentiepakket op AWS Data Exchange. Voor informatie over een licentie en toegang tot voorbeeldgegevens gaat u naar ontwikkelaar.imdb.com. Om toegang te krijgen tot de dataset, zie Vermogensaanbeveling en zoeken met behulp van een IMDb-kennisgrafiek - Deel 1 en volg de Toegang tot de IMDb-gegevens pagina.

Verwerk de IMDb-gegevens voor

Voordat we een kennisbank creëren, moeten we de IMDb-dataset voorverwerken in tekstbestanden en deze uploaden naar een S3-bucket. In dit bericht simuleren we een klantencatalogus met behulp van de IMDb-dataset. We nemen 10,000 populaire films uit de IMDb-dataset voor de catalogus en bouwen de dataset.

Gebruik het volgende notitieboekje om de dataset te maken met aanvullende informatie, zoals namen van acteurs, regisseurs en producenten. We gebruiken de volgende code om één bestand voor een film te maken, waarbij alle informatie in het bestand is opgeslagen in een ongestructureerde tekst die kan worden begrepen door LLM's:

def create_txt_files_imdb(row): full_text = "" full_text += f"{row['originalTitle']} ({row['titleId']}) was shot in year {int(row['year'])} with rating {row['rating']} and poster url {row['poster_url']}.nn" full_text += f"{row['originalTitle']} has genres {', '.join(row['genres'])}.nn" full_text += f"{row['originalTitle']} has actors {', '.join(row['Actors'])}.nn" full_text += f"{row['originalTitle']} has directors {', '.join(row['Directors'])}.nn" full_text += f"{row['originalTitle']} has producers {', '.join(row['Producers'])}.nn" full_text += f"{row['originalTitle']} has keyword {', '.join([x.replace('-',' ') for x in row['keyword']])}.nn" full_text += f"{row['originalTitle']} has location {', '.join(row['location'])}.nn" full_text += f"{row['originalTitle']} has plot {row['plot']}.nn" with open(f"<path>/data/imdb_data/{row['titleId']}.txt","w") as f: f.write(full_text) return full_text

Nadat u de gegevens in .txt-indeling hebt, kunt u de gegevens uploaden naar Amazon S3 met behulp van de volgende opdracht:

aws s3 cp <path to local data> s3://<bucket-name>/<path>/ --recursive

Creëer de IMDb-kennisbank

Voer de volgende stappen uit om uw kennisbank te maken:

Kies op de Amazon Bedrock-console Kennisbank in het navigatievenster.
Kies Creëer kennisbasis.
Voor Naam kennisbank, ga naar binnen imdb.
Voor Beschrijving van de kennisbankVoer een optionele beschrijving in, zoals Kennisbank voor het opnemen en opslaan van imdb-gegevens.
Voor IAM-machtigingenselecteer Maak en gebruik een nieuwe servicerolen voer vervolgens een naam in voor uw nieuwe servicerol.
Kies Volgende.

consolepagina met kennisbankdetails

Voor Naam gegevensbron, ga naar binnen imdb-s3.
Voor S3-URIVoer de S3-URI in waarnaar u de gegevens hebt geüpload.
In het Geavanceerde instellingen – optioneel sectie, voor Chunking-strategie, kiezen Geen chunking.
Kies Volgende.

Met kennisbanken kunt u uw documenten in kleinere segmenten opdelen, zodat u grote documenten eenvoudig kunt verwerken. In ons geval hebben we de gegevens al in een kleiner document opgedeeld (één per film).

kennisbankconsole 2

In het Vector-database sectie, selecteer Maak snel een nieuwe vectorwinkel.

Amazon Bedrock maakt automatisch een volledig beheerde OpenSearch Serverless vectorzoekcollectie en configureert de instellingen voor het insluiten van uw gegevensbronnen met behulp van het gekozen Titan Embedding G1 – Tekstinsluitingsmodel.

kennisbank vectorwinkelpagina

Kies Volgende.

Bouw een filmchatbot voor TV/OTT-platforms met behulp van Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Controleer uw instellingen en kies Creëer kennisbasis.

Synchroniseer uw gegevens met de kennisbank

Nu u uw kennisbank heeft gemaakt, kunt u de kennisbank synchroniseren met uw gegevens.

Navigeer op de Amazon Bedrock-console naar uw kennisbank.
In het Databron sectie, kies Synchroniseren.

kennisbanksynchronisatie

Nadat de gegevensbron is gesynchroniseerd, bent u klaar om de gegevens op te vragen.

Verbeter de zoekopdracht met behulp van semantische resultaten

Voer de volgende stappen uit om de oplossing te testen en uw zoekopdracht te verbeteren met behulp van semantische resultaten:

Navigeer op de Amazon Bedrock-console naar uw kennisbank.
Selecteer uw kennisbank en kies Kennisbank testen.
Kies Selecteer een modelen kies Antropische Claude v2.1.
Kies Solliciteer.

Nu bent u klaar om de gegevens op te vragen.

We kunnen een aantal semantische vragen stellen, zoals 'Beveel me een aantal films met kerstthema aan.'

query Beveel mij een aantal films met kerstthema aan.

Reacties in de kennisbank bevatten citaten die u kunt onderzoeken op juistheid en feitelijkheid van de antwoorden.

citaten uit de kennisbank

U kunt ook alle informatie uit deze films bekijken die u nodig heeft. In het volgende voorbeeld vragen we ons af: “wie regisseerde de nachtmerrie vóór Kerstmis?”

“Wie regisseerde de nachtmerrie vóór Kerstmis?”

Je kunt ook specifiekere vragen stellen over de genres en beoordelingen, zoals 'Laat me klassieke animatiefilms zien met beoordelingen groter dan 7?'

laat mij klassieke animatiefilms zien met beoordelingen hoger dan 7?

Breid uw kennisbank uit met agenten

Agenten voor Amazon Bedrock helpen u complexe taken te automatiseren. Agenten kunnen de gebruikersquery opsplitsen in kleinere taken en aangepaste API's of kennisbanken aanroepen om informatie aan te vullen voor actieve acties. Met Agents voor Amazon Bedrock kunnen ontwikkelaars intelligente agenten in hun apps integreren, waardoor de levering van AI-aangedreven applicaties wordt versneld en weken aan ontwikkeltijd worden bespaard. Met agenten kunt u uw kennisbank uitbreiden door meer functionaliteit toe te voegen, zoals aanbevelingen uit Amazon personaliseren voor gebruikersspecifieke aanbevelingen of het uitvoeren van acties zoals het filteren van films op basis van gebruikersbehoeften.

Conclusie

In dit bericht hebben we laten zien hoe je in een paar stappen een conversatiefilmchatbot kunt bouwen met Amazon Bedrock om semantische zoek- en gesprekservaringen te beantwoorden op basis van je eigen gegevens en de door IMDb en Box Office Mojo Movies/TV/OTT gelicentieerde dataset. In het volgende bericht doorlopen we het proces van het toevoegen van meer functionaliteit aan uw oplossing met behulp van Agents voor Amazon Bedrock. Raadpleeg om aan de slag te gaan met kennisbanken op Amazon Bedrock Kennisbanken voor Amazon Bedrock.

Over de auteurs

Bouw een filmchatbot voor TV/OTT-platforms met behulp van Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. Gaurav Rele is Senior Data Scientist bij het Generative AI Innovation Center, waar hij samenwerkt met AWS-klanten in verschillende branches om hun gebruik van generatieve AI en AWS Cloud-services te versnellen om hun zakelijke uitdagingen op te lossen.

Bouw een filmchatbot voor TV/OTT-platforms met behulp van Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. Divya Bhargavi is Senior Applied Scientist Lead bij het Genative AI Innovation Center, waar ze hoogwaardige zakelijke problemen voor AWS-klanten oplost met behulp van generatieve AI-methoden. Ze werkt aan het begrijpen en ophalen van afbeeldingen/video's, kennisgrafieken, grote taalmodellen en gepersonaliseerde reclamegebruiksscenario's.

Bouw een filmchatbot voor TV/OTT-platforms met behulp van Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. Suren Gunturu is een datawetenschapper die werkt in het Genative AI Innovation Center, waar hij met verschillende AWS-klanten samenwerkt om hoogwaardige zakelijke problemen op te lossen. Hij is gespecialiseerd in het bouwen van ML-pijplijnen met behulp van grote taalmodellen, voornamelijk via Amazon Bedrock en andere AWS Cloud-services.

Bouw een filmchatbot voor TV/OTT-platforms met behulp van Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai. Vidya Sagar Ravipati is Science Manager bij het Genative AI Innovation Center, waar hij zijn enorme ervaring in grootschalige gedistribueerde systemen en zijn passie voor machine learning inzet om AWS-klanten in verschillende verticale sectoren te helpen hun AI- en cloud-adoptie te versnellen.

Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
Bron: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/

Tijdstempel: 31 januari 2024

Tijdstempel: December 22, 2023

Heruitgegeven door Plato

Anomaliedetectie met Amazon SageMaker Edge Manager met AWS IoT Greengrass V2

Voer wat-als-analyses uit met Amazon Forecast, tot 80% sneller dan voorheen

InformedIQ automatiseert verificaties voor automatische leningen van Origence met behulp van machine learning

Bouw generatieve AI-agents met Amazon Bedrock, Amazon DynamoDB, Amazon Kendra, Amazon Lex en LangChain | Amazon-webservices

Over Ons

Verticaal zoeken & Ai

Platform

Blijf verbonden

Account