Meningkatkan cara pengguna menemukan konten baru sangat penting untuk meningkatkan keterlibatan dan kepuasan pengguna di platform media. Pencarian kata kunci saja memiliki tantangan dalam menangkap semantik dan maksud pengguna, sehingga menghasilkan hasil yang kurang relevan; misalnya mencari kencan malam atau film bertema Natal. Hal ini dapat menurunkan tingkat retensi jika pengguna tidak dapat menemukan konten yang mereka inginkan dengan pasti. Namun, dengan model bahasa besar (LLM), ada peluang untuk memecahkan tantangan semantik dan maksud pengguna ini. Dengan menggabungkan pernikahan yang menangkap semantik dengan teknik yang disebut Pengambilan Augmented Generation (RAG), Anda dapat menghasilkan jawaban yang lebih relevan berdasarkan konteks yang diambil dari sumber data Anda sendiri.
Dalam postingan ini, kami menunjukkan cara membuat chatbot film dengan aman dengan mengimplementasikan RAG menggunakan data Anda sendiri Basis Pengetahuan untuk Batuan Dasar Amazon. Kami menggunakan kumpulan data IMDb dan Box Office Mojo untuk menyimulasikan katalog bagi pelanggan media dan hiburan dan menunjukkan bagaimana Anda dapat membangun solusi RAG Anda sendiri hanya dalam beberapa langkah.
Ikhtisar solusi
Grafik Film IMDb dan Box Office Mojo/TV/OTT paket data yang dapat dilisensikan menyediakan berbagai metadata hiburan, termasuk lebih dari 1.6 miliar peringkat pengguna; kredit untuk lebih dari 13 juta pemain dan kru; 10 juta judul film, TV, dan hiburan; dan data pelaporan box office global dari lebih dari 60 negara. Banyak pelanggan media dan hiburan AWS melisensikan data IMDb melalui Pertukaran Data AWS untuk meningkatkan penemuan konten dan meningkatkan keterlibatan dan retensi pelanggan.
Pengantar Basis Pengetahuan untuk Amazon Bedrock
Untuk melengkapi LLM dengan informasi kepemilikan terkini, organisasi menggunakan RAG, sebuah teknik yang melibatkan pengambilan data dari sumber data perusahaan dan memperkaya permintaan dengan data tersebut untuk memberikan respons yang lebih relevan dan akurat. Basis Pengetahuan untuk Amazon Bedrock mengaktifkan kemampuan RAG yang dikelola sepenuhnya yang memungkinkan Anda menyesuaikan respons LLM dengan data perusahaan yang kontekstual dan relevan. Basis Pengetahuan mengotomatiskan alur kerja RAG ujung ke ujung, termasuk penyerapan, pengambilan, augmentasi cepat, dan kutipan, sehingga Anda tidak perlu menulis kode khusus untuk mengintegrasikan sumber data dan mengelola kueri. Basis Pengetahuan untuk Amazon Bedrock juga memungkinkan percakapan multi-putaran sehingga LLM dapat menjawab pertanyaan pengguna yang kompleks dengan jawaban yang benar.
Kami menggunakan layanan berikut sebagai bagian dari solusi ini:
Kami berjalan melalui langkah-langkah tingkat tinggi berikut:
- Proses awal data IMDb untuk membuat dokumen dari setiap rekaman film dan mengunggah data ke dalam Layanan Penyimpanan Sederhana Amazon (Amazon S3).
- Ciptakan basis pengetahuan.
- Sinkronkan basis pengetahuan Anda dengan sumber data Anda.
- Gunakan basis pengetahuan untuk menjawab pertanyaan semantik tentang katalog film.
Prasyarat
Data IMDb yang digunakan dalam postingan ini memerlukan lisensi konten komersial dan langganan berbayar ke paket lisensi IMDb dan Box Office Mojo Movies/TV/OTT di AWS Data Exchange. Untuk menanyakan tentang lisensi dan mengakses data sampel, kunjungi pengembang.imdb.com. Untuk mengakses kumpulan data, lihat Rekomendasi daya dan pencarian menggunakan grafik pengetahuan IMDb โ Bagian 1 dan ikuti Akses data IMDb bagian.
Praproses data IMDb
Sebelum membuat basis pengetahuan, kita perlu memproses terlebih dahulu kumpulan data IMDb menjadi file teks dan mengunggahnya ke bucket S3. Dalam postingan ini, kami mensimulasikan katalog pelanggan menggunakan dataset IMDb. Kami mengambil 10,000 film populer dari kumpulan data IMDb untuk katalog dan membuat kumpulan data tersebut.
Gunakan yang berikut ini buku catatan untuk membuat kumpulan data dengan informasi tambahan seperti nama aktor, sutradara, dan produser. Kami menggunakan kode berikut untuk membuat satu file untuk film dengan semua informasi yang disimpan dalam file dalam teks tidak terstruktur yang dapat dipahami oleh LLM:
Setelah Anda memiliki data dalam format .txt, Anda dapat mengunggah data tersebut ke Amazon S3 menggunakan perintah berikut:
Buat Basis Pengetahuan IMDb
Selesaikan langkah-langkah berikut untuk membuat basis pengetahuan Anda:
- Di konsol Amazon Bedrock, pilih Dasar pengetahuan di panel navigasi.
- Pilih Buat basis pengetahuan.
- Untuk Nama basis pengetahuan, Masuk
imdb
. - Untuk Deskripsi basis pengetahuan, masukkan deskripsi opsional, seperti Basis pengetahuan untuk menyerap dan menyimpan data imdb.
- Untuk izin IAM, pilih Buat dan gunakan peran layanan baru, lalu masukkan nama untuk peran layanan baru Anda.
- Pilih Selanjutnya.
- Untuk Nama sumber data, Masuk
imdb-s3
. - Untuk URI S3, masukkan URI S3 tempat Anda mengunggah data.
- Dalam majalah Pengaturan lanjutan โ opsional bagian, untuk Strategi pemotongan, pilih Tidak ada potongan.
- Pilih Selanjutnya.
Basis pengetahuan memungkinkan Anda membagi dokumen menjadi segmen yang lebih kecil untuk memudahkan Anda memproses dokumen berukuran besar. Dalam kasus kami, kami telah mengelompokkan data ke dalam dokumen berukuran lebih kecil (satu per film).
- Dalam majalah Basis data vektor bagian, pilih Buat toko vektor baru dengan cepat.
Amazon Bedrock akan secara otomatis membuat koleksi pencarian vektor OpenSearch Tanpa Server yang terkelola sepenuhnya dan mengonfigurasi pengaturan untuk menyematkan sumber data Anda menggunakan Titan Embedding G1 โ model penyematan teks yang dipilih.
- Pilih Selanjutnya.
- Tinjau pengaturan Anda dan pilih Buat basis pengetahuan.
Sinkronkan data Anda dengan basis pengetahuan
Sekarang setelah Anda membuat basis pengetahuan, Anda dapat menyinkronkan basis pengetahuan dengan data Anda.
- Di konsol Amazon Bedrock, navigasikan ke basis pengetahuan Anda.
- Dalam majalah Sumber data bagian, pilih Sync.
Setelah sumber data disinkronkan, Anda siap mengkueri data.
Tingkatkan pencarian menggunakan hasil semantik
Selesaikan langkah-langkah berikut untuk menguji solusi dan meningkatkan pencarian Anda menggunakan hasil semantik:
- Di konsol Amazon Bedrock, navigasikan ke basis pengetahuan Anda.
- Pilih basis pengetahuan Anda dan pilih Uji basis pengetahuan.
- Pilih Pilih model, dan pilih Claude Antropik v2.1.
- Pilih Mendaftar.
Sekarang Anda siap untuk menanyakan data.
Kita dapat mengajukan beberapa pertanyaan semantik, seperti โRekomendasikan saya beberapa film bertema Natal.โ
Respons basis pengetahuan berisi kutipan yang dapat Anda jelajahi untuk mengetahui kebenaran dan faktualitas respons.
Anda juga dapat menelusuri informasi apa pun yang Anda perlukan dari film-film ini. Dalam contoh berikut, kita bertanya โsiapa yang mengarahkan mimpi buruk sebelum Natal?โ
Anda juga dapat mengajukan pertanyaan yang lebih spesifik terkait genre dan rating, seperti โtunjukkan film animasi klasik dengan rating lebih dari 7?โ
Tingkatkan basis pengetahuan Anda dengan agen
Agen untuk Amazon Bedrock membantu Anda mengotomatiskan tugas-tugas kompleks. Agen dapat memecah kueri pengguna menjadi tugas-tugas yang lebih kecil dan memanggil API khusus atau basis pengetahuan untuk melengkapi informasi untuk tindakan yang sedang berjalan. Dengan Agen untuk Amazon Bedrock, pengembang dapat mengintegrasikan agen cerdas ke dalam aplikasi mereka, mempercepat pengiriman aplikasi yang didukung AI dan menghemat waktu pengembangan selama berminggu-minggu. Dengan agen, Anda dapat menambah basis pengetahuan Anda dengan menambahkan lebih banyak fungsi seperti rekomendasi dari Amazon Personalisasi untuk rekomendasi khusus pengguna atau melakukan tindakan seperti memfilter film berdasarkan kebutuhan pengguna.
Kesimpulan
Dalam postingan ini, kami menunjukkan cara membuat chatbot film percakapan menggunakan Amazon Bedrock dalam beberapa langkah untuk menjawab pencarian semantik dan pengalaman percakapan berdasarkan data Anda sendiri dan kumpulan data berlisensi IMDb dan Box Office Mojo Movies/TV/OTT. Di postingan berikutnya, kami membahas proses penambahan lebih banyak fungsi ke solusi Anda menggunakan Agen untuk Amazon Bedrock. Untuk memulai basis pengetahuan di Amazon Bedrock, lihat Basis Pengetahuan untuk Batuan Dasar Amazon.
Tentang Penulis
Rele Gaurav adalah Ilmuwan Data Senior di Pusat Inovasi AI Generatif, tempat ia bekerja dengan pelanggan AWS di berbagai sektor untuk mempercepat penggunaan AI generatif dan layanan AWS Cloud guna memecahkan tantangan bisnis mereka.
Divya Bhargavi adalah Senior Applied Scientist Lead di Generative AI Innovation Center, tempat dia memecahkan masalah bisnis bernilai tinggi bagi pelanggan AWS menggunakan metode AI generatif. Dia mengerjakan pemahaman & pengambilan gambar/video, grafik pengetahuan yang ditambah dengan model bahasa besar, dan kasus penggunaan periklanan yang dipersonalisasi.
Suren Gunturu adalah Ilmuwan Data yang bekerja di Pusat Inovasi AI Generatif, tempat dia bekerja dengan berbagai pelanggan AWS untuk memecahkan masalah bisnis bernilai tinggi. Dia berspesialisasi dalam membangun pipeline ML menggunakan Model Bahasa Besar, terutama melalui Amazon Bedrock dan layanan AWS Cloud lainnya.
Vidya Sagar Ravipati adalah Manajer Sains di Pusat Inovasi AI Generatif, di mana ia memanfaatkan pengalamannya yang luas dalam sistem terdistribusi berskala besar dan hasratnya terhadap pembelajaran mesin untuk membantu pelanggan AWS di berbagai vertikal industri mempercepat adopsi AI dan cloud mereka.
- Konten Bertenaga SEO & Distribusi PR. Dapatkan Amplifikasi Hari Ini.
- PlatoData.Jaringan Vertikal Generatif Ai. Berdayakan Diri Anda. Akses Di Sini.
- PlatoAiStream. Intelijen Web3. Pengetahuan Diperkuat. Akses Di Sini.
- PlatoESG. Karbon, teknologi bersih, energi, Lingkungan Hidup, Tenaga surya, Penanganan limbah. Akses Di Sini.
- PlatoHealth. Kecerdasan Uji Coba Biotek dan Klinis. Akses Di Sini.
- Sumber: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :memiliki
- :adalah
- :Di mana
- $ 10 juta
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- Tentang Kami
- mempercepat
- mempercepat
- mengakses
- tepat
- di seluruh
- tindakan
- aktor
- menambahkan
- Tambahan
- Adopsi
- pengiklanan
- agen
- AI
- Bertenaga AI
- Semua
- memungkinkan
- sendirian
- sudah
- juga
- Amazon
- Amazon Web Services
- an
- dan
- menjawab
- jawaban
- Apa pun
- Lebah
- aplikasi
- terapan
- aplikasi
- ADALAH
- AS
- meminta
- At
- menambah
- ditambah
- mengotomatisasikan
- secara otomatis
- AWS
- Pertukaran Data AWS
- mendasarkan
- berdasarkan
- BE
- sebelum
- Milyar
- Kotak
- Film laris
- Istirahat
- membangun
- Bangunan
- bisnis
- by
- panggilan
- bernama
- CAN
- kemampuan
- menangkap
- Menangkap
- kasus
- kasus
- katalog
- pusat
- tantangan
- ChatBot
- Pilih
- terpilih
- hari Natal
- klasik
- awan
- adopsi cloud
- layanan cloud
- kode
- koleksi
- menggabungkan
- komersial
- perusahaan
- kompleks
- konsul
- mengandung
- Konten
- konteks
- kontekstual
- percakapan
- percakapan
- benar
- negara
- sepasang
- membuat
- dibuat
- Kredit
- awak kapal
- kritis
- adat
- pelanggan
- Keterlibatan pelanggan
- pelanggan
- menyesuaikan
- data
- Pertukaran data
- ilmuwan data
- Tanggal
- menyampaikan
- pengiriman
- deskripsi
- rincian
- pengembang
- Pengembangan
- berbeda
- diarahkan
- Kepala
- Direksi
- menemukan
- penemuan
- didistribusikan
- sistem terdistribusi
- dokumen
- dokumen
- turun
- mendorong
- menghilangkan
- embedding
- aktif
- ujung ke ujung
- interaksi
- memperkaya
- Enter
- Menghibur
- Setiap
- contoh
- Pasar Valas
- pengalaman
- Pengalaman
- menyelidiki
- beberapa
- File
- File
- penyaringan
- Menemukan
- temuan
- mengikuti
- berikut
- Untuk
- format
- dari
- sepenuhnya
- fungsi
- g1
- menghasilkan
- generasi
- generatif
- AI generatif
- genre
- mendapatkan
- Aksi
- Go
- grafik
- lebih besar
- Memiliki
- he
- membantu
- tingkat tinggi
- -nya
- Seterpercayaapakah Olymp Trade? Kesimpulan
- How To
- Namun
- HTML
- http
- HTTPS
- if
- mengimplementasikan
- memperbaiki
- in
- Termasuk
- Meningkatkan
- industri
- Info
- informasi
- Innovation
- menanyakan
- mengintegrasikan
- Cerdas
- maksud
- ke
- melibatkan
- IT
- jpg
- hanya
- pengetahuan
- Pengetahuan Grafik
- Kekurangan
- bahasa
- besar
- besar-besaran
- memimpin
- terkemuka
- pengetahuan
- memanfaatkan
- Lisensi
- Izin
- Perizinan
- 'like'
- LLM
- lokal
- tempat
- menurunkan
- mesin
- Mesin belajar
- membuat
- mengelola
- berhasil
- manajer
- banyak
- me
- Media
- Anggota
- Metadata
- metode
- juta
- ML
- model
- model
- lebih
- film
- bioskop
- nama
- nama
- Arahkan
- Navigasi
- Perlu
- kebutuhan
- New
- berikutnya
- malam
- of
- Office
- on
- ONE
- Kesempatan
- or
- organisasi
- Lainnya
- kami
- lebih
- sendiri
- paket
- halaman
- dibayar
- pane
- bagian
- gairah
- path
- untuk
- melakukan
- Personalized
- Platform
- plato
- Kecerdasan Data Plato
- Data Plato
- alur
- Populer
- Pos
- terutama
- masalah
- proses
- produsen
- Produsen
- hak milik
- menyediakan
- query
- pertanyaan
- Pertanyaan
- lap
- jarak
- Tarif
- penilaian
- peringkat
- siap
- sarankan
- Rekomendasi
- rekomendasi
- catatan
- lihat
- terkait
- relevan
- Pelaporan
- membutuhkan
- tanggapan
- tanggapan
- Hasil
- penyimpanan
- pengambilan
- kembali
- Peran
- BARIS
- berjalan
- kepuasan
- penghematan
- Ilmu
- ilmuwan
- Pencarian
- Bagian
- aman
- segmen
- memilih
- semantik
- semantik
- senior
- Tanpa Server
- layanan
- Layanan
- pengaturan
- dia
- tembakan
- Menunjukkan
- menampilkan
- menunjukkan
- Sederhana
- mensimulasikan
- tunggal
- Ukuran
- lebih kecil
- So
- larutan
- MEMECAHKAN
- Memecahkan
- beberapa
- sumber
- sumber
- spesialisasi
- tertentu
- mulai
- Tangga
- penyimpanan
- menyimpan
- tersimpan
- menyimpan
- mudah
- berlangganan
- seperti itu
- suplemen
- sinkronisasi.
- sistem
- Mengambil
- tugas
- teknik
- uji
- teks
- dari
- bahwa
- Grafik
- informasi
- mereka
- Mereka
- Bertema
- kemudian
- Sana.
- Ini
- mereka
- ini
- Melalui
- waktu
- titan
- judul
- untuk
- tv
- pemahaman
- dipahami
- tidak terstruktur
- mutakhir
- upload
- URL
- menggunakan
- bekas
- Pengguna
- Pengguna
- menggunakan
- berbagai
- Luas
- vertikal
- Mengunjungi
- W
- berjalan
- ingin
- adalah
- we
- jaringan
- layanan web
- minggu
- lebar
- Rentang luas
- akan
- dengan
- alur kerja
- kerja
- bekerja
- menulis
- X
- tahun
- Kamu
- Anda
- zephyrnet.dll