Het verbeteren van de manier waarop gebruikers nieuwe inhoud ontdekken is van cruciaal belang om de betrokkenheid en tevredenheid van gebruikers op mediaplatforms te vergroten. Alleen het zoeken op trefwoorden levert problemen op bij het vastleggen van de semantiek en de intentie van de gebruiker, wat leidt tot resultaten zonder relevante context; bijvoorbeeld het vinden van films met een date night of kerstthema. Dit kan leiden tot lagere retentiepercentages als gebruikers de gewenste inhoud niet op betrouwbare wijze kunnen vinden. Echter, met grote taalmodellen (LLM's) bestaat er een mogelijkheid om deze semantische en gebruikersintentieproblemen op te lossen. Door te combineren inbedding die semantiek vastleggen met een techniek genaamd Ophalen van Augmented Generation (RAG), kunt u relevantere antwoorden genereren op basis van de opgehaalde context uit uw eigen gegevensbronnen.
In dit bericht laten we u zien hoe u veilig een filmchatbot kunt maken door RAG te implementeren met uw eigen gegevens kennisbanken For Amazonebodem. We gebruiken de IMDb- en Box Office Mojo-dataset om een โโcatalogus voor media- en entertainmentklanten te simuleren en te laten zien hoe u in slechts een paar stappen uw eigen RAG-oplossing kunt bouwen.
Overzicht oplossingen
De IMDb en Box Office Mojo Movies/TV/OTT licentieerbaar datapakket biedt een breed scala aan entertainmentmetadata, waaronder meer dan 1.6 miljard gebruikersbeoordelingen; credits voor meer dan 13 miljoen cast- en crewleden; 10 miljoen film-, tv- en amusementstitels; en wereldwijde box office-rapportagegegevens uit meer dan 60 landen. Veel AWS media- en entertainmentklanten geven licenties voor IMDb-gegevens via AWS-gegevensuitwisseling om de ontdekking van inhoud te verbeteren en de betrokkenheid en retentie van klanten te vergroten.
Inleiding tot kennisbanken voor Amazon Bedrock
Om een โโLLM uit te rusten met actuele bedrijfseigen informatie, gebruiken organisaties RAG, een techniek waarbij gegevens uit bedrijfsgegevensbronnen worden opgehaald en de prompt met die gegevens wordt verrijkt om relevantere en nauwkeurigere antwoorden te geven. Knowledge Bases voor Amazon Bedrock maken een volledig beheerde RAG-mogelijkheid mogelijk waarmee u LLM-reacties kunt aanpassen met contextuele en relevante bedrijfsgegevens. Knowledge Bases automatiseren de end-to-end RAG-workflow, inclusief opname, ophalen, promptvergroting en citaties, waardoor u geen aangepaste code hoeft te schrijven om gegevensbronnen te integreren en query's te beheren. Knowledge Bases voor Amazon Bedrock maken ook gesprekken met meerdere beurten mogelijk, zodat de LLM complexe gebruikersvragen met het juiste antwoord kan beantwoorden.
We gebruiken de volgende diensten als onderdeel van deze oplossing:
We doorlopen de volgende stappen op hoog niveau:
- Verwerk de IMDb-gegevens voor om documenten van elke filmopname te maken en upload de gegevens naar een Amazon eenvoudige opslagservice (Amazon S3) emmer.
- Creรซer een kennisbank.
- Synchroniseer uw kennisbank met uw gegevensbron.
- Gebruik de kennisbank om semantische vragen over de filmcatalogus te beantwoorden.
Voorwaarden
De IMDb-gegevens die in dit bericht worden gebruikt, vereisen een commerciรซle inhoudslicentie en een betaald abonnement op IMDb en Box Office Mojo Movies/TV/OTT-licentiepakket op AWS Data Exchange. Voor informatie over een licentie en toegang tot voorbeeldgegevens gaat u naar ontwikkelaar.imdb.com. Om toegang te krijgen tot de dataset, zie Vermogensaanbeveling en zoeken met behulp van een IMDb-kennisgrafiek - Deel 1 en volg de Toegang tot de IMDb-gegevens pagina.
Verwerk de IMDb-gegevens voor
Voordat we een kennisbank creรซren, moeten we de IMDb-dataset voorverwerken in tekstbestanden en deze uploaden naar een S3-bucket. In dit bericht simuleren we een klantencatalogus met behulp van de IMDb-dataset. We nemen 10,000 populaire films uit de IMDb-dataset voor de catalogus en bouwen de dataset.
Gebruik het volgende notitieboekje om de dataset te maken met aanvullende informatie, zoals namen van acteurs, regisseurs en producenten. We gebruiken de volgende code om รฉรฉn bestand voor een film te maken, waarbij alle informatie in het bestand is opgeslagen in een ongestructureerde tekst die kan worden begrepen door LLM's:
Nadat u de gegevens in .txt-indeling hebt, kunt u de gegevens uploaden naar Amazon S3 met behulp van de volgende opdracht:
Creรซer de IMDb-kennisbank
Voer de volgende stappen uit om uw kennisbank te maken:
- Kies op de Amazon Bedrock-console Kennisbank in het navigatievenster.
- Kies Creรซer kennisbasis.
- Voor Naam kennisbank, ga naar binnen
imdb
. - Voor Beschrijving van de kennisbankVoer een optionele beschrijving in, zoals Kennisbank voor het opnemen en opslaan van imdb-gegevens.
- Voor IAM-machtigingenselecteer Maak en gebruik een nieuwe servicerolen voer vervolgens een naam in voor uw nieuwe servicerol.
- Kies Volgende.
- Voor Naam gegevensbron, ga naar binnen
imdb-s3
. - Voor S3-URIVoer de S3-URI in waarnaar u de gegevens hebt geรผpload.
- In het Geavanceerde instellingen โ optioneel sectie, voor Chunking-strategie, kiezen Geen chunking.
- Kies Volgende.
Met kennisbanken kunt u uw documenten in kleinere segmenten opdelen, zodat u grote documenten eenvoudig kunt verwerken. In ons geval hebben we de gegevens al in een kleiner document opgedeeld (รฉรฉn per film).
- In het Vector-database sectie, selecteer Maak snel een nieuwe vectorwinkel.
Amazon Bedrock maakt automatisch een volledig beheerde OpenSearch Serverless vectorzoekcollectie en configureert de instellingen voor het insluiten van uw gegevensbronnen met behulp van het gekozen Titan Embedding G1 โ Tekstinsluitingsmodel.
- Kies Volgende.
- Controleer uw instellingen en kies Creรซer kennisbasis.
Synchroniseer uw gegevens met de kennisbank
Nu u uw kennisbank heeft gemaakt, kunt u de kennisbank synchroniseren met uw gegevens.
- Navigeer op de Amazon Bedrock-console naar uw kennisbank.
- In het Databron sectie, kies Synchroniseren.
Nadat de gegevensbron is gesynchroniseerd, bent u klaar om de gegevens op te vragen.
Verbeter de zoekopdracht met behulp van semantische resultaten
Voer de volgende stappen uit om de oplossing te testen en uw zoekopdracht te verbeteren met behulp van semantische resultaten:
- Navigeer op de Amazon Bedrock-console naar uw kennisbank.
- Selecteer uw kennisbank en kies Kennisbank testen.
- Kies Selecteer een modelen kies Antropische Claude v2.1.
- Kies Solliciteer.
Nu bent u klaar om de gegevens op te vragen.
We kunnen een aantal semantische vragen stellen, zoals 'Beveel me een aantal films met kerstthema aan.'
Reacties in de kennisbank bevatten citaten die u kunt onderzoeken op juistheid en feitelijkheid van de antwoorden.
U kunt ook alle informatie uit deze films bekijken die u nodig heeft. In het volgende voorbeeld vragen we ons af: โwie regisseerde de nachtmerrie vรณรณr Kerstmis?โ
Je kunt ook specifiekere vragen stellen over de genres en beoordelingen, zoals 'Laat me klassieke animatiefilms zien met beoordelingen groter dan 7?'
Breid uw kennisbank uit met agenten
Agenten voor Amazon Bedrock helpen u complexe taken te automatiseren. Agenten kunnen de gebruikersquery opsplitsen in kleinere taken en aangepaste API's of kennisbanken aanroepen om informatie aan te vullen voor actieve acties. Met Agents voor Amazon Bedrock kunnen ontwikkelaars intelligente agenten in hun apps integreren, waardoor de levering van AI-aangedreven applicaties wordt versneld en weken aan ontwikkeltijd worden bespaard. Met agenten kunt u uw kennisbank uitbreiden door meer functionaliteit toe te voegen, zoals aanbevelingen uit Amazon personaliseren voor gebruikersspecifieke aanbevelingen of het uitvoeren van acties zoals het filteren van films op basis van gebruikersbehoeften.
Conclusie
In dit bericht hebben we laten zien hoe je in een paar stappen een conversatiefilmchatbot kunt bouwen met Amazon Bedrock om semantische zoek- en gesprekservaringen te beantwoorden op basis van je eigen gegevens en de door IMDb en Box Office Mojo Movies/TV/OTT gelicentieerde dataset. In het volgende bericht doorlopen we het proces van het toevoegen van meer functionaliteit aan uw oplossing met behulp van Agents voor Amazon Bedrock. Raadpleeg om aan de slag te gaan met kennisbanken op Amazon Bedrock Kennisbanken voor Amazon Bedrock.
Over de auteurs
Gaurav Rele is Senior Data Scientist bij het Generative AI Innovation Center, waar hij samenwerkt met AWS-klanten in verschillende branches om hun gebruik van generatieve AI en AWS Cloud-services te versnellen om hun zakelijke uitdagingen op te lossen.
Divya Bhargavi is Senior Applied Scientist Lead bij het Genative AI Innovation Center, waar ze hoogwaardige zakelijke problemen voor AWS-klanten oplost met behulp van generatieve AI-methoden. Ze werkt aan het begrijpen en ophalen van afbeeldingen/video's, kennisgrafieken, grote taalmodellen en gepersonaliseerde reclamegebruiksscenario's.
Suren Gunturu is een datawetenschapper die werkt in het Genative AI Innovation Center, waar hij met verschillende AWS-klanten samenwerkt om hoogwaardige zakelijke problemen op te lossen. Hij is gespecialiseerd in het bouwen van ML-pijplijnen met behulp van grote taalmodellen, voornamelijk via Amazon Bedrock en andere AWS Cloud-services.
Vidya Sagar Ravipati is Science Manager bij het Genative AI Innovation Center, waar hij zijn enorme ervaring in grootschalige gedistribueerde systemen en zijn passie voor machine learning inzet om AWS-klanten in verschillende verticale sectoren te helpen hun AI- en cloud-adoptie te versnellen.
- Door SEO aangedreven content en PR-distributie. Word vandaag nog versterkt.
- PlatoData.Network Verticale generatieve AI. Versterk jezelf. Toegang hier.
- PlatoAiStream. Web3-intelligentie. Kennis versterkt. Toegang hier.
- PlatoESG. carbon, CleanTech, Energie, Milieu, Zonne, Afvalbeheer. Toegang hier.
- Plato Gezondheid. Intelligentie op het gebied van biotech en klinische proeven. Toegang hier.
- Bron: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- : heeft
- :is
- :waar
- $ 10 miljoen
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- Over
- versnellen
- versnellen
- toegang
- accuraat
- over
- acties
- actoren
- toe te voegen
- Extra
- Adoptie
- ADVERTISING
- agenten
- AI
- AI-powered
- Alles
- toestaat
- alleen
- al
- ook
- Amazone
- Amazon Web Services
- an
- en
- beantwoorden
- antwoorden
- elke
- APIs
- toepassingen
- toegepast
- apps
- ZIJN
- AS
- vragen
- At
- vergroten
- aangevuld
- automatiseren
- webmaster.
- AWS
- AWS-gegevensuitwisseling
- baseren
- gebaseerde
- BE
- vaardigheden
- Miljard
- Box camera's
- box office
- Breken
- bouw
- Gebouw
- bedrijfsdeskundigen
- by
- Bellen
- Dit betekent dat we onszelf en onze geliefden praktisch vergiftigen.
- CAN
- bekwaamheid
- vangen
- Het vastleggen
- geval
- gevallen
- catalogus
- Centreren
- uitdagingen
- Chatbot
- Kies
- uitgekozen
- Kerstmis
- klassiek
- Cloud
- cloud adoptie
- cloud-diensten
- code
- Collectie
- combineren
- commercieel
- afstand
- complex
- troosten
- bevatten
- content
- verband
- contextual
- spraakzaam
- conversaties
- te corrigeren
- landen
- Koppel
- en je merk te creรซren
- aangemaakt
- credits
- bemanning
- kritisch
- gewoonte
- klant
- Klantbinding
- Klanten
- aan te passen
- gegevens
- Gegevensuitwisseling
- data scientist
- Datum
- leveren
- levering
- beschrijving
- gegevens
- ontwikkelaars
- Ontwikkeling
- anders
- gerichte
- Director
- Raad van bestuur
- Onthul Nu
- ontdekking
- verdeeld
- gedistribueerde systemen
- document
- documenten
- beneden
- rit
- elimineren
- inbedding
- in staat stellen
- eind tot eind
- engagement
- verrijkende
- Enter
- Onstpanning
- Alle
- voorbeeld
- uitwisseling
- ervaring
- Ervaringen
- Verken
- weinig
- Dien in
- Bestanden
- filtering
- VIND DE PLEK DIE PERFECT VOOR JOU IS
- het vinden van
- volgen
- volgend
- Voor
- formaat
- oppompen van
- geheel
- functionaliteit
- g1
- voortbrengen
- generatie
- generatief
- generatieve AI
- genres
- krijgen
- Globaal
- Go
- diagram
- meer
- Hebben
- he
- hulp
- high-level
- zijn
- Hoe
- How To
- Echter
- HTML
- http
- HTTPS
- if
- uitvoering
- verbeteren
- in
- Inclusief
- Laat uw omzet
- -industrie
- info
- informatie
- Innovatie
- informeren
- integreren
- Intelligent
- aandachtig
- in
- gaat
- IT
- jpg
- voor slechts
- kennis
- Kennis Grafiek
- Gebrek
- taal
- Groot
- grootschalig
- leiden
- leidend
- leren
- hefbomen
- Vergunning
- Erkend
- Licenties
- als
- LLM
- lokaal
- plaats
- te verlagen
- machine
- machine learning
- maken
- beheer
- beheerd
- manager
- veel
- me
- Media
- Leden
- Metadata
- methoden
- miljoen
- ML
- model
- modellen
- meer
- filmpje
- Films
- naam
- namen
- OP DEZE WEBSITE VIND JE
- Navigatie
- Noodzaak
- behoeften
- New
- volgende
- nacht
- of
- Kantoor
- on
- EEN
- kansen
- or
- organisaties
- Overige
- onze
- over
- het te bezitten.
- pakket
- pagina
- betaald
- brood
- deel
- passie
- pad
- voor
- uitvoerend
- Gepersonaliseerde
- platforms
- Plato
- Plato gegevensintelligentie
- PlatoData
- perceel
- Populair
- Post
- in de eerste plaats
- problemen
- producent
- Producenten
- gepatenteerd
- biedt
- queries
- vraag
- Contact
- doek
- reeks
- Tarieven
- waardering
- waarderingen
- klaar
- adviseren
- Aanbeveling
- aanbevelingen
- record
- verwijzen
- verwant
- relevante
- Rapportage
- vereist
- antwoord
- reacties
- Resultaten
- behoud
- ophalen
- terugkeer
- Rol
- RIJ
- lopend
- tevredenheid
- besparing
- Wetenschap
- Wetenschapper
- Ontdek
- sectie
- vast
- segmenten
- kiezen
- semantisch
- semantiek
- senior
- Serverless
- service
- Diensten
- settings
- ze
- schot
- tonen
- showcase
- vertoonde
- Eenvoudig
- simuleren
- single
- Maat
- kleinere
- So
- oplossing
- OPLOSSEN
- Lost op
- sommige
- bron
- bronnen
- specialiseert
- specifiek
- gestart
- Stappen
- mediaopslag
- shop
- opgeslagen
- bewaartemperatuur
- eenvoudig
- abonnement
- dergelijk
- aanvullen
- synchroniseren.
- Systems
- Nemen
- taken
- techniek
- proef
- tekst
- neem contact
- dat
- De
- de informatie
- hun
- Ze
- themed
- harte
- Er.
- Deze
- ze
- dit
- Door
- niet de tijd of
- Titan
- titels
- naar
- tv
- begrip
- begrijpelijk
- ongestructureerd
- up-to-date
- geรผpload
- URL
- .
- gebruikt
- Gebruiker
- gebruikers
- gebruik
- divers
- groot
- verticals
- Bezoek
- W
- lopen
- willen
- was
- we
- web
- webservices
- weken
- breed
- Grote range
- wil
- Met
- workflow
- werkzaam
- Bedrijven
- schrijven
- X
- jaar
- You
- Your
- zephyrnet