Erstellen Sie einen Film-Chatbot für TV-/OTT-Plattformen mit Retrieval Augmented Generation in Amazon Bedrock

Neuauflage von Plato

Verfolger: 0

Die Verbesserung der Art und Weise, wie Benutzer neue Inhalte entdecken, ist entscheidend, um das Engagement und die Zufriedenheit der Benutzer auf Medienplattformen zu steigern. Allein die Suche nach Schlüsselwörtern stellt die Erfassung von Semantik und Benutzerabsicht vor Herausforderungen und führt zu Ergebnissen, denen der relevante Kontext fehlt. Suchen Sie zum Beispiel nach einem Date-Abend oder nach Filmen zum Thema Weihnachten. Dies kann zu niedrigeren Bindungsraten führen, wenn Benutzer die gewünschten Inhalte nicht zuverlässig finden können. Allerdings mit große Sprachmodelle (LLMs) besteht die Möglichkeit, diese semantischen und Benutzerabsichtsherausforderungen zu lösen. Durch Kombinieren Einbettungen die Semantik mit einer Technik namens erfassen Retrieval Augmented Generation (RAG)können Sie relevantere Antworten basierend auf dem abgerufenen Kontext aus Ihren eigenen Datenquellen generieren.

In diesem Beitrag zeigen wir Ihnen, wie Sie einen Film-Chatbot sicher erstellen, indem Sie RAG mit Ihren eigenen Daten implementieren Wissensbasen für Amazonas Grundgestein. Wir verwenden den IMDb- und Box Office Mojo-Datensatz, um einen Katalog für Medien- und Unterhaltungskunden zu simulieren und zeigen, wie Sie in nur wenigen Schritten Ihre eigene RAG-Lösung erstellen können.

Lösungsüberblick

Das IMDb und Box Office Mojo Movies/TV/OTT lizenzierbares Datenpaket bietet eine breite Palette von Unterhaltungsmetadaten, darunter über 1.6 Milliarde Benutzerbewertungen; Credits für mehr als 13 Millionen Besetzungs- und Crewmitglieder; 10 Millionen Film-, Fernseh- und Unterhaltungstitel; und globale Kassenberichtsdaten aus mehr als 60 Ländern. Viele AWS-Kunden aus den Bereichen Medien und Unterhaltung lizenzieren IMDb-Daten durch AWS-Datenaustausch um das Auffinden von Inhalten zu verbessern und die Kundenbindung und -bindung zu erhöhen.

Einführung in Wissensdatenbanken für Amazon Bedrock

Um ein LLM mit aktuellen proprietären Informationen auszustatten, verwenden Unternehmen RAG, eine Technik, bei der Daten aus Unternehmensdatenquellen abgerufen und die Eingabeaufforderung mit diesen Daten angereichert werden, um relevantere und genauere Antworten zu liefern. Wissensdatenbanken für Amazon Bedrock ermöglichen eine vollständig verwaltete RAG-Funktion, mit der Sie LLM-Antworten mit kontextbezogenen und relevanten Unternehmensdaten anpassen können. Wissensdatenbanken automatisieren den End-to-End-RAG-Workflow, einschließlich Aufnahme, Abruf, Eingabeaufforderungserweiterung und Zitierungen, sodass Sie keinen benutzerdefinierten Code schreiben müssen, um Datenquellen zu integrieren und Abfragen zu verwalten. Wissensdatenbanken für Amazon Bedrock ermöglichen auch Multi-Turn-Konversationen, sodass das LLM komplexe Benutzeranfragen mit der richtigen Antwort beantworten kann.

Wir verwenden die folgenden Dienste im Rahmen dieser Lösung:

Wir durchlaufen die folgenden High-Level-Schritte:

Verarbeiten Sie die IMDb-Daten vor, um Dokumente aus jeder Filmaufzeichnung zu erstellen, und laden Sie die Daten in eine hoch Amazon Simple Storage-Service (Amazon S3) Eimer.
Erstellen Sie eine Wissensdatenbank.
Synchronisieren Sie Ihre Wissensdatenbank mit Ihrer Datenquelle.
Nutzen Sie die Wissensdatenbank, um semantische Fragen zum Filmkatalog zu beantworten.

Voraussetzungen:

Die in diesem Beitrag verwendeten IMDb-Daten erfordern eine kommerzielle Inhaltslizenz und ein kostenpflichtiges Abonnement für IMDb und das Box Office Mojo Movies/TV/OTT-Lizenzpaket auf AWS Data Exchange. Um sich nach einer Lizenz zu erkundigen und auf Beispieldaten zuzugreifen, besuchen Sie Developer.imdb.com. Informationen zum Zugriff auf den Datensatz finden Sie unter Leistungsempfehlung und Suche mit einem IMDb Knowledge Graph – Teil 1 und folgen Sie den Greifen Sie auf die IMDb-Daten zu .

Verarbeiten Sie die IMDb-Daten vor

Bevor wir eine Wissensdatenbank erstellen, müssen wir den IMDb-Datensatz in Textdateien vorverarbeiten und diese in einen S3-Bucket hochladen. In diesem Beitrag simulieren wir einen Kundenkatalog mithilfe des IMDb-Datensatzes. Wir nehmen 10,000 beliebte Filme aus dem IMDb-Datensatz für den Katalog und erstellen den Datensatz.

Verwenden Sie Folgendes Notizbuch um den Datensatz mit zusätzlichen Informationen wie Namen von Schauspielern, Regisseuren und Produzenten zu erstellen. Wir verwenden den folgenden Code, um eine einzelne Datei für einen Film zu erstellen, in der alle in der Datei gespeicherten Informationen in einem unstrukturierten Text gespeichert sind, der von LLMs verstanden werden kann:

def create_txt_files_imdb(row): full_text = "" full_text += f"{row['originalTitle']} ({row['titleId']}) was shot in year {int(row['year'])} with rating {row['rating']} and poster url {row['poster_url']}.nn" full_text += f"{row['originalTitle']} has genres {', '.join(row['genres'])}.nn" full_text += f"{row['originalTitle']} has actors {', '.join(row['Actors'])}.nn" full_text += f"{row['originalTitle']} has directors {', '.join(row['Directors'])}.nn" full_text += f"{row['originalTitle']} has producers {', '.join(row['Producers'])}.nn" full_text += f"{row['originalTitle']} has keyword {', '.join([x.replace('-',' ') for x in row['keyword']])}.nn" full_text += f"{row['originalTitle']} has location {', '.join(row['location'])}.nn" full_text += f"{row['originalTitle']} has plot {row['plot']}.nn" with open(f"<path>/data/imdb_data/{row['titleId']}.txt","w") as f: f.write(full_text) return full_text

Nachdem Sie die Daten im TXT-Format haben, können Sie sie mit dem folgenden Befehl in Amazon S3 hochladen:

aws s3 cp <path to local data> s3://<bucket-name>/<path>/ --recursive

Erstellen Sie die IMDb-Wissensdatenbank

Führen Sie die folgenden Schritte aus, um Ihre Wissensdatenbank zu erstellen:

Wählen Sie auf der Amazon Bedrock-Konsole Wissensbasis im Navigationsbereich.
Auswählen Wissensbasis schaffen.
Aussichten für Name der Wissensdatenbank, eingeben imdb.
Aussichten für Beschreibung der WissensdatenbankGeben Sie eine optionale Beschreibung ein, z. B. Wissensdatenbank zum Erfassen und Speichern von IMDB-Daten.
Aussichten für IAM-BerechtigungenWählen Erstellen und verwenden Sie eine neue Servicerolleund geben Sie dann einen Namen für Ihre neue Servicerolle ein.
Auswählen Weiter.

Konsolenseite mit Details zur Wissensdatenbank

Aussichten für Name der Datenquelle, eingeben imdb-s3.
Aussichten für S3-URIGeben Sie den S3-URI ein, auf den Sie die Daten hochgeladen haben.
Im Erweiterte Einstellungen – optional Abschnitt, für Chunking-Strategie, wählen Kein Chunking.
Auswählen Weiter.

Mithilfe von Wissensdatenbanken können Sie Ihre Dokumente in kleinere Segmente unterteilen, um die Verarbeitung großer Dokumente einfacher zu gestalten. In unserem Fall haben wir die Daten bereits in ein kleineres Dokument aufgeteilt (eins pro Film).

Wissensdatenbankkonsole 2

Im Vektordatenbank Abschnitt auswählen Erstellen Sie schnell einen neuen Vektorspeicher.

Amazon Bedrock erstellt automatisch eine vollständig verwaltete OpenSearch Serverless-Vektorsuchsammlung und konfiguriert die Einstellungen für die Einbettung Ihrer Datenquellen mithilfe des ausgewählten Titan Embedding G1 – Texteinbettungsmodells.

Wissensdatenbank-Vektor-Store-Seite

Auswählen Weiter.

Erstellen Sie einen Film-Chatbot für TV-/OTT-Plattformen mit Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Überprüfen Sie Ihre Einstellungen und wählen Sie Wissensbasis schaffen.

Synchronisieren Sie Ihre Daten mit der Wissensdatenbank

Nachdem Sie nun Ihre Wissensdatenbank erstellt haben, können Sie die Wissensdatenbank mit Ihren Daten synchronisieren.

Navigieren Sie in der Amazon Bedrock-Konsole zu Ihrer Wissensdatenbank.
Im Datenquelle Wählen Sie im Abschnitt Synchronisierung.

Wissensdatenbank-Synchronisierung

Nachdem die Datenquelle synchronisiert wurde, können Sie die Daten abfragen.

Verbessern Sie die Suche mithilfe semantischer Ergebnisse

Führen Sie die folgenden Schritte aus, um die Lösung zu testen und Ihre Suche mithilfe semantischer Ergebnisse zu verbessern:

Navigieren Sie in der Amazon Bedrock-Konsole zu Ihrer Wissensdatenbank.
Wählen Sie Ihre Wissensdatenbank aus und wählen Sie Testen Sie die Wissensdatenbank.
Auswählen Modell auswählen, und wähle Anthropischer Claude v2.1.
Auswählen Bewerben.

Jetzt können Sie die Daten abfragen.

Wir können einige semantische Fragen stellen, wie zum Beispiel „Empfehlen Sie mir ein paar Weihnachtsfilme.“

Anfrage Empfehlen Sie mir einige Weihnachtsfilme.

Antworten in der Wissensdatenbank enthalten Zitate, die Sie auf Richtigkeit und Sachlichkeit der Antworten untersuchen können.

Zitate aus Wissensdatenbanken

Sie können auch alle benötigten Informationen aus diesen Filmen aufschlüsseln. Im folgenden Beispiel fragen wir: „Wer hat bei Nightmare Before Christmas Regie geführt?“

„Wer hat bei Nightmare Before Christmas Regie geführt?“

Sie können auch spezifischere Fragen zu den Genres und Bewertungen stellen, z. B. „Zeigen Sie mir klassische Animationsfilme mit Bewertungen über 7?“

Zeigen Sie mir klassische Animationsfilme mit einer Bewertung von mehr als 7?

Erweitern Sie Ihre Wissensdatenbank mit Agenten

Agenten für Amazon Bedrock helfen Ihnen, komplexe Aufgaben zu automatisieren. Agenten können die Benutzerabfrage in kleinere Aufgaben aufteilen und benutzerdefinierte APIs oder Wissensdatenbanken aufrufen, um Informationen für die Ausführung von Aktionen zu ergänzen. Mit Agents for Amazon Bedrock können Entwickler intelligente Agenten in ihre Apps integrieren, wodurch die Bereitstellung KI-gestützter Anwendungen beschleunigt und wochenlange Entwicklungszeit eingespart wird. Mit Agenten können Sie Ihre Wissensdatenbank erweitern, indem Sie weitere Funktionen wie Empfehlungen von hinzufügen Amazon personalisieren für benutzerspezifische Empfehlungen oder die Durchführung von Aktionen wie das Filtern von Filmen basierend auf Benutzeranforderungen.

Zusammenfassung

In diesem Beitrag haben wir gezeigt, wie Sie mit Amazon Bedrock in wenigen Schritten einen Konversationsfilm-Chatbot erstellen, um semantische Such- und Konversationserlebnisse basierend auf Ihren eigenen Daten und dem von IMDb und Box Office Mojo Movies/TV/OTT lizenzierten Datensatz zu beantworten. Im nächsten Beitrag gehen wir den Prozess durch, wie Sie Ihrer Lösung mithilfe von Agents für Amazon Bedrock weitere Funktionen hinzufügen. Informationen zu den ersten Schritten mit Wissensdatenbanken auf Amazon Bedrock finden Sie unter Wissensdatenbanken für Amazon Bedrock.

Über die Autoren

Erstellen Sie einen Film-Chatbot für TV-/OTT-Plattformen mit Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai. Gaurav Rele ist Senior Data Scientist am Generative AI Innovation Center, wo er mit AWS-Kunden aus verschiedenen Branchen zusammenarbeitet, um deren Nutzung generativer KI und AWS Cloud-Services zur Lösung ihrer geschäftlichen Herausforderungen zu beschleunigen.

Erstellen Sie einen Film-Chatbot für TV-/OTT-Plattformen mit Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai. Divya Bhargavi ist Senior Applied Scientist Lead am Generative AI Innovation Center, wo sie hochwertige Geschäftsprobleme für AWS-Kunden mithilfe generativer KI-Methoden löst. Sie beschäftigt sich mit dem Verstehen und Abrufen von Bildern/Videos, mit Wissensgraphen erweiterten großen Sprachmodellen und Anwendungsfällen für personalisierte Werbung.

Erstellen Sie einen Film-Chatbot für TV-/OTT-Plattformen mit Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai. Suren Gunturu ist ein Datenwissenschaftler, der im Generative AI Innovation Center arbeitet, wo er mit verschiedenen AWS-Kunden an der Lösung hochwertiger Geschäftsprobleme arbeitet. Er ist auf den Aufbau von ML-Pipelines mithilfe großer Sprachmodelle spezialisiert, hauptsächlich über Amazon Bedrock und andere AWS Cloud-Dienste.

Erstellen Sie einen Film-Chatbot für TV-/OTT-Plattformen mit Retrieval Augmented Generation in Amazon Bedrock | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai. Vidya Sagar Ravipati ist Wissenschaftsmanager am Generative AI Innovation Center, wo er seine umfangreiche Erfahrung mit großen verteilten Systemen und seine Leidenschaft für maschinelles Lernen nutzt, um AWS-Kunden in verschiedenen Branchen dabei zu helfen, ihre KI- und Cloud-Einführung zu beschleunigen.

SEO-gestützte Content- und PR-Distribution. Holen Sie sich noch heute Verstärkung.
PlatoData.Network Vertikale generative KI. Motiviere dich selbst. Hier zugreifen.
PlatoAiStream. Web3-Intelligenz. Wissen verstärkt. Hier zugreifen.
PlatoESG. Kohlenstoff, CleanTech, Energie, Umwelt, Solar, Abfallwirtschaft. Hier zugreifen.
PlatoHealth. Informationen zu Biotechnologie und klinischen Studien. Hier zugreifen.
Quelle: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/

Zeitstempel: 31. Januar 2024

Zeitstempel: 6. April 2023

Neuauflage von Plato

Code-Server auf Amazon SageMaker hosten

AWS bietet neue Leitfäden für künstliche Intelligenz, maschinelles Lernen und generative KI zur Planung Ihrer KI-Strategie | Amazon Web Services

Alida gewinnt mit Amazon Bedrock | ein tieferes Verständnis des Kundenfeedbacks Amazon Web Services

Verbessern Sie die Skalierbarkeit für zustandslose Amazon Rekognition-APIs mit mehreren Regionen

Erstellen Sie wissensbasierte Konversationsanwendungen mit LlamaIndex und Llama 2-Chat | Amazon Web Services

„ID + Selfie“ – Verbesserung der digitalen Identitätsprüfung mit AWS

Verbesserung der Inhaltsmoderation mit Amazon Rekognition-Massenanalyse und benutzerdefinierter Moderation | Amazon Web Services

Die automatische Modelloptimierung von Amazon SageMaker wählt jetzt automatisch Optimierungskonfigurationen aus, um die Benutzerfreundlichkeit und Kosteneffizienz zu verbessern Amazon Web Services

Importieren Sie Daten aus über 40 Datenquellen für maschinelles Lernen ohne Code mit Amazon SageMaker Canvas

Über uns

Vertikale Suche & Ai

Plattform

Bleiben Sie in Verbindung

Konto