मीडिया प्लेटफ़ॉर्म पर उपयोगकर्ता की सहभागिता और संतुष्टि बढ़ाने के लिए उपयोगकर्ताओं द्वारा नई सामग्री खोजने के तरीके में सुधार करना महत्वपूर्ण है। अकेले कीवर्ड खोज में शब्दार्थ और उपयोगकर्ता के इरादे को पकड़ने में चुनौतियाँ होती हैं, जिससे ऐसे परिणाम मिलते हैं जिनमें प्रासंगिक संदर्भ का अभाव होता है; उदाहरण के लिए, डेट नाइट या क्रिसमस-थीम वाली फिल्में ढूंढना। यदि उपयोगकर्ता विश्वसनीय रूप से अपनी इच्छित सामग्री नहीं ढूंढ पाते हैं तो इससे प्रतिधारण दर कम हो सकती है। हालाँकि, साथ बड़े भाषा मॉडल (एलएलएम), इन अर्थ संबंधी और उपयोगकर्ता अभिप्राय चुनौतियों को हल करने का अवसर है। जोड़ने से घात लगाना जो शब्दार्थ को एक तकनीक से पकड़ता है जिसे कहा जाता है पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी), आप अपने स्वयं के डेटा स्रोतों से प्राप्त संदर्भ के आधार पर अधिक प्रासंगिक उत्तर उत्पन्न कर सकते हैं।
इस पोस्ट में, हम आपको दिखाते हैं कि अपने स्वयं के डेटा का उपयोग करके RAG को लागू करके सुरक्षित रूप से मूवी चैटबॉट कैसे बनाएं ज्ञानकोष एसटी अमेज़ॅन बेडरॉक. हम मीडिया और मनोरंजन ग्राहकों के लिए एक कैटलॉग का अनुकरण करने के लिए आईएमडीबी और बॉक्स ऑफिस मोजो डेटासेट का उपयोग करते हैं और दिखाते हैं कि आप कुछ ही चरणों में अपना खुद का आरएजी समाधान कैसे बना सकते हैं।
समाधान अवलोकन
RSI आईएमडीबी और बॉक्स ऑफिस मोजो मूवीज/टीवी/ओटीटी लाइसेंस योग्य डेटा पैकेज मनोरंजन मेटाडेटा की एक विस्तृत श्रृंखला प्रदान करता है, जिसमें 1.6 बिलियन से अधिक उपयोगकर्ता रेटिंग शामिल हैं; 13 मिलियन से अधिक कलाकारों और चालक दल के सदस्यों के लिए क्रेडिट; 10 मिलियन फिल्म, टीवी और मनोरंजन शीर्षक; और 60 से अधिक देशों से वैश्विक बॉक्स ऑफिस रिपोर्टिंग डेटा। कई AWS मीडिया और मनोरंजन ग्राहक IMDb डेटा को लाइसेंस देते हैं AWS डेटा एक्सचेंज सामग्री की खोज में सुधार करने और ग्राहक जुड़ाव और प्रतिधारण बढ़ाने के लिए।
अमेज़ॅन बेडरॉक के लिए ज्ञानकोष का परिचय
एलएलएम को अद्यतन मालिकाना जानकारी से लैस करने के लिए, संगठन आरएजी का उपयोग करते हैं, एक ऐसी तकनीक जिसमें कंपनी डेटा स्रोतों से डेटा प्राप्त करना और अधिक प्रासंगिक और सटीक प्रतिक्रिया देने के लिए उस डेटा के साथ प्रॉम्प्ट को समृद्ध करना शामिल है। अमेज़ॅन बेडरॉक के लिए ज्ञानकोष पूरी तरह से प्रबंधित आरएजी क्षमता को सक्षम करता है जो आपको प्रासंगिक और प्रासंगिक कंपनी डेटा के साथ एलएलएम प्रतिक्रियाओं को अनुकूलित करने की अनुमति देता है। नॉलेज बेस अंत-से-अंत आरएजी वर्कफ़्लो को स्वचालित करता है, जिसमें अंतर्ग्रहण, पुनर्प्राप्ति, त्वरित वृद्धि और उद्धरण शामिल हैं, जिससे डेटा स्रोतों को एकीकृत करने और प्रश्नों को प्रबंधित करने के लिए कस्टम कोड लिखने की आवश्यकता समाप्त हो जाती है। अमेज़ॅन बेडरॉक के लिए नॉलेज बेस मल्टी-टर्न वार्तालापों को भी सक्षम बनाता है ताकि एलएलएम जटिल उपयोगकर्ता प्रश्नों का सही उत्तर दे सके।
हम इस समाधान के भाग के रूप में निम्नलिखित सेवाओं का उपयोग करते हैं:
हम निम्नलिखित उच्च-स्तरीय चरणों से गुजरते हैं:
- प्रत्येक मूवी रिकॉर्ड से दस्तावेज़ बनाने और डेटा को एक में अपलोड करने के लिए IMDb डेटा को प्रीप्रोसेस करें अमेज़न सरल भंडारण सेवा (अमेज़न S3) बाल्टी।
- एक ज्ञान आधार बनाएँ.
- अपने ज्ञानकोष को अपने डेटा स्रोत के साथ समन्वयित करें।
- मूवी कैटलॉग के बारे में अर्थ संबंधी प्रश्नों का उत्तर देने के लिए ज्ञानकोष का उपयोग करें।
.. पूर्वापेक्षाएँ
इस पोस्ट में उपयोग किए गए IMDb डेटा के लिए व्यावसायिक सामग्री लाइसेंस और IMDb की सशुल्क सदस्यता और AWS डेटा एक्सचेंज पर बॉक्स ऑफिस मोजो मूवीज़/टीवी/ओटीटी लाइसेंसिंग पैकेज की आवश्यकता होती है। लाइसेंस के बारे में पूछताछ करने और नमूना डेटा तक पहुंचने के लिए, यहां जाएं Developer.imdb.com. डेटासेट तक पहुंचने के लिए, देखें IMDb नॉलेज ग्राफ़ का उपयोग करके पावर अनुशंसा और खोज - भाग 1 और का पालन करें आईएमडीबी डेटा तक पहुंचें अनुभाग।
IMDb डेटा को प्रीप्रोसेस करें
ज्ञानकोष बनाने से पहले, हमें IMDb डेटासेट को टेक्स्ट फ़ाइलों में प्रीप्रोसेस करना होगा और उन्हें S3 बकेट में अपलोड करना होगा। इस पोस्ट में, हम IMDb डेटासेट का उपयोग करके एक ग्राहक कैटलॉग का अनुकरण करते हैं। हम कैटलॉग के लिए IMDb डेटासेट से 10,000 लोकप्रिय फिल्में लेते हैं और डेटासेट बनाते हैं।
निम्न का उपयोग करें नोटबुक अभिनेताओं, निर्देशक और निर्माता के नाम जैसी अतिरिक्त जानकारी के साथ डेटासेट बनाने के लिए। हम किसी फिल्म के लिए एकल फ़ाइल बनाने के लिए निम्नलिखित कोड का उपयोग करते हैं, जिसमें फ़ाइल में सभी जानकारी एक असंरचित पाठ में संग्रहीत होती है जिसे एलएलएम द्वारा समझा जा सकता है:
आपके पास .txt प्रारूप में डेटा होने के बाद, आप निम्न कमांड का उपयोग करके डेटा को Amazon S3 में अपलोड कर सकते हैं:
IMDb नॉलेज बेस बनाएं
अपना ज्ञानकोष बनाने के लिए निम्नलिखित चरणों को पूरा करें:
- अमेज़ॅन बेडरॉक कंसोल पर, चुनें नॉलेज बेस नेविगेशन फलक में
- चुनें ज्ञान का आधार बनाएं.
- के लिए ज्ञान आधार नाम, दर्ज
imdb
. - के लिए ज्ञान आधार विवरण, एक वैकल्पिक विवरण दर्ज करें, जैसे आईएमडीबी डेटा को अंतर्ग्रहण और संग्रहीत करने के लिए ज्ञान आधार।
- के लिए आईएएम अनुमतियां, चुनते हैं एक नई सेवा भूमिका बनाएं और उसका उपयोग करें, फिर अपनी नई सेवा भूमिका के लिए एक नाम दर्ज करें।
- चुनें अगला.
- के लिए डेटा स्रोत का नाम, दर्ज
imdb-s3
. - के लिए एस३ यूआरआई, वह S3 URI दर्ज करें जिस पर आपने डेटा अपलोड किया था।
- में उन्नत सेटिंग्स - वैकल्पिक अनुभाग, के लिए टुकड़े-टुकड़े करने की रणनीति, चुनें कोई खंडन नहीं.
- चुनें अगला.
ज्ञान का आधार आपको अपने दस्तावेज़ों को छोटे-छोटे खंडों में विभाजित करने में सक्षम बनाता है, जिससे आपके लिए बड़े दस्तावेज़ों को संसाधित करना आसान हो जाता है। हमारे मामले में, हमने पहले ही डेटा को छोटे आकार के दस्तावेज़ (प्रति मूवी एक) में विभाजित कर दिया है।
- में वेक्टर डेटाबेस अनुभाग चुनें शीघ्रता से एक नया वेक्टर स्टोर बनाएं.
अमेज़ॅन बेडरॉक स्वचालित रूप से एक पूरी तरह से प्रबंधित ओपनसर्च सर्वर रहित वेक्टर खोज संग्रह बनाएगा और चुने हुए टाइटन एंबेडिंग जी 1 - टेक्स्ट एम्बेडिंग मॉडल का उपयोग करके आपके डेटा स्रोतों को एम्बेड करने के लिए सेटिंग्स कॉन्फ़िगर करेगा।
- चुनें अगला.
- अपनी सेटिंग्स की समीक्षा करें और चुनें ज्ञान का आधार बनाएं.
अपने डेटा को नॉलेज बेस के साथ सिंक करें
अब जब आपने अपना ज्ञानकोष बना लिया है, तो आप उस ज्ञानकोष को अपने डेटा के साथ सिंक कर सकते हैं।
- अमेज़ॅन बेडरॉक कंसोल पर, अपने ज्ञान आधार पर नेविगेट करें।
- में डेटा स्रोत अनुभाग चुनते हैं, सिंक.
डेटा स्रोत समन्वयित होने के बाद, आप डेटा से पूछताछ करने के लिए तैयार हैं।
सिमेंटिक परिणामों का उपयोग करके खोज में सुधार करें
समाधान का परीक्षण करने और सिमेंटिक परिणामों का उपयोग करके अपनी खोज को बेहतर बनाने के लिए निम्नलिखित चरणों को पूरा करें:
- अमेज़ॅन बेडरॉक कंसोल पर, अपने ज्ञान आधार पर नेविगेट करें।
- अपना ज्ञानकोष चुनें और चुनें ज्ञान आधार का परीक्षण करें.
- चुनें मॉडल का चयन करें, और चुनें एंथ्रोपिक क्लाउड v2.1.
- चुनें लागू करें.
अब आप डेटा को क्वेरी करने के लिए तैयार हैं।
हम कुछ अर्थ संबंधी प्रश्न पूछ सकते हैं, जैसे "मुझे कुछ क्रिसमस थीम वाली फिल्मों की अनुशंसा करें।"
ज्ञान आधारित प्रतिक्रियाओं में उद्धरण शामिल होते हैं जिन्हें आप प्रतिक्रिया की शुद्धता और तथ्यात्मकता के लिए तलाश सकते हैं।
आप इन फिल्मों से अपनी जरूरत की कोई भी जानकारी प्राप्त कर सकते हैं। निम्नलिखित उदाहरण में, हम पूछते हैं "क्रिसमस से पहले दुःस्वप्न का निर्देशन किसने किया?"
आप शैलियों और रेटिंग से संबंधित अधिक विशिष्ट प्रश्न भी पूछ सकते हैं, जैसे "मुझे 7 से अधिक रेटिंग वाली क्लासिक एनिमेटेड फिल्में दिखाएं?"
एजेंटों के साथ अपना ज्ञान आधार बढ़ाएं
अमेज़ॅन बेडरॉक के लिए एजेंट जटिल कार्यों को स्वचालित करने में आपकी सहायता करें। एजेंट उपयोगकर्ता की क्वेरी को छोटे-छोटे कार्यों में तोड़ सकते हैं और चल रही कार्रवाइयों के लिए जानकारी के पूरक के लिए कस्टम एपीआई या नॉलेज बेस को कॉल कर सकते हैं। एजेंटों के लिए अमेज़ॅन बेडरॉक के साथ, डेवलपर्स बुद्धिमान एजेंटों को अपने ऐप्स में एकीकृत कर सकते हैं, एआई-संचालित अनुप्रयोगों की डिलीवरी में तेजी ला सकते हैं और विकास के समय की बचत कर सकते हैं। एजेंटों के साथ, आप अनुशंसाओं जैसी अधिक कार्यक्षमता जोड़कर अपने ज्ञान के आधार को बढ़ा सकते हैं अमेज़न निजीकृत उपयोगकर्ता-विशिष्ट अनुशंसाओं के लिए या उपयोगकर्ता की ज़रूरतों के आधार पर फ़िल्मों को फ़िल्टर करने जैसी कार्रवाइयां करने के लिए।
निष्कर्ष
इस पोस्ट में, हमने दिखाया है कि आपके अपने डेटा और IMDb और बॉक्स ऑफिस मोजो मूवीज़/टीवी/ओटीटी लाइसेंस प्राप्त डेटासेट के आधार पर सिमेंटिक सर्च और संवादात्मक अनुभवों का उत्तर देने के लिए कुछ चरणों में अमेज़ॅन बेडरॉक का उपयोग करके एक संवादी मूवी चैटबॉट कैसे बनाया जाए। अगली पोस्ट में, हम एजेंटों फॉर अमेज़ॅन बेडरॉक का उपयोग करके आपके समाधान में अधिक कार्यक्षमता जोड़ने की प्रक्रिया के बारे में जानेंगे। अमेज़ॅन बेडरॉक पर नॉलेज बेस के साथ शुरुआत करने के लिए, देखें अमेज़ॅन बेडरॉक के लिए ज्ञानकोष.
लेखक के बारे में
गौरव रेले जेनरेटिव एआई इनोवेशन सेंटर में एक वरिष्ठ डेटा वैज्ञानिक हैं, जहां वह विभिन्न क्षेत्रों में एडब्ल्यूएस ग्राहकों के साथ काम करते हैं ताकि उनकी व्यावसायिक चुनौतियों को हल करने के लिए जेनरेटिव एआई और एडब्ल्यूएस क्लाउड सेवाओं के उपयोग में तेजी लाई जा सके।
दिव्या भार्गवी जेनेरेटिव एआई इनोवेशन सेंटर में एक वरिष्ठ एप्लाइड साइंटिस्ट लीड हैं, जहां वह जेनेरेटिव एआई तरीकों का उपयोग करके एडब्ल्यूएस ग्राहकों के लिए उच्च-मूल्य वाली व्यावसायिक समस्याओं का समाधान करती हैं। वह छवि/वीडियो समझ और पुनर्प्राप्ति, ज्ञान ग्राफ संवर्धित बड़े भाषा मॉडल और वैयक्तिकृत विज्ञापन उपयोग मामलों पर काम करती है।
सुरेन गुंटुरु जेनेरेटिव एआई इनोवेशन सेंटर में काम करने वाला एक डेटा वैज्ञानिक है, जहां वह उच्च-मूल्य वाली व्यावसायिक समस्याओं को हल करने के लिए विभिन्न एडब्ल्यूएस ग्राहकों के साथ काम करता है। वह मुख्य रूप से अमेज़ॅन बेडरॉक और अन्य एडब्ल्यूएस क्लाउड सेवाओं के माध्यम से बड़े भाषा मॉडल का उपयोग करके एमएल पाइपलाइन बनाने में माहिर हैं।
विद्या सागर रविपति जेनेरेटिव एआई इनोवेशन सेंटर में एक विज्ञान प्रबंधक हैं, जहां वह बड़े पैमाने पर वितरित सिस्टम में अपने विशाल अनुभव और मशीन लर्निंग के प्रति अपने जुनून का लाभ उठाते हुए विभिन्न उद्योग क्षेत्रों में एडब्ल्यूएस ग्राहकों को उनके एआई और क्लाउड अपनाने में तेजी लाने में मदद करते हैं।
- एसईओ संचालित सामग्री और पीआर वितरण। आज ही प्रवर्धित हो जाओ।
- प्लेटोडेटा.नेटवर्क वर्टिकल जेनरेटिव एआई। स्वयं को शक्तिवान बनाएं। यहां पहुंचें।
- प्लेटोआईस्ट्रीम। Web3 इंटेलिजेंस। ज्ञान प्रवर्धित। यहां पहुंचें।
- प्लेटोईएसजी. कार्बन, क्लीनटेक, ऊर्जा, पर्यावरण, सौर, कचरा प्रबंधन। यहां पहुंचें।
- प्लेटोहेल्थ। बायोटेक और क्लिनिकल परीक्षण इंटेलिजेंस। यहां पहुंचें।
- स्रोत: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :हैस
- :है
- :कहाँ
- 10 $ मिलियन
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- About
- में तेजी लाने के
- तेज
- पहुँच
- सही
- के पार
- कार्रवाई
- अभिनेताओं
- जोड़ने
- अतिरिक्त
- दत्तक ग्रहण
- विज्ञापन
- एजेंटों
- AI
- ऐ संचालित
- सब
- की अनुमति देता है
- अकेला
- पहले ही
- भी
- वीरांगना
- अमेज़ॅन वेब सेवा
- an
- और
- जवाब
- जवाब
- कोई
- एपीआई
- अनुप्रयोगों
- लागू
- क्षुधा
- हैं
- AS
- पूछना
- At
- बढ़ाना
- संवर्धित
- को स्वचालित रूप से
- स्वतः
- एडब्ल्यूएस
- AWS डेटा एक्सचेंज
- आधार
- आधारित
- BE
- से पहले
- बिलियन
- मुक्केबाज़ी
- बॉक्स ऑफिस
- टूटना
- निर्माण
- इमारत
- व्यापार
- by
- कॉल
- बुलाया
- कर सकते हैं
- क्षमता
- कब्जा
- कैप्चरिंग
- मामला
- मामलों
- सूची
- केंद्र
- चुनौतियों
- chatbot
- चुनें
- करने के लिए चुना
- क्रिसमस
- क्लासिक
- बादल
- बादल को गोद लेना
- क्लाउड सेवाएं
- कोड
- संग्रह
- संयोजन
- वाणिज्यिक
- कंपनी
- जटिल
- कंसोल
- शामिल
- सामग्री
- प्रसंग
- प्रासंगिक
- संवादी
- बातचीत
- सही
- देशों
- युगल
- बनाना
- बनाया
- क्रेडिट्स
- कर्मी दल
- महत्वपूर्ण
- रिवाज
- ग्राहक
- ग्राहक अनुबंध
- ग्राहक
- अनुकूलित
- तिथि
- आंकडों का आदान प्रदान
- आँकड़े वाला वैज्ञानिक
- तारीख
- उद्धार
- प्रसव
- विवरण
- विवरण
- डेवलपर्स
- विकास
- विभिन्न
- निर्देशित
- निदेशक
- निदेशकों
- अन्य वायरल पोस्ट से
- खोज
- वितरित
- वितरित प्रणाली
- दस्तावेज़
- दस्तावेजों
- नीचे
- ड्राइव
- नष्ट
- embedding
- सक्षम
- शुरू से अंत तक
- सगाई
- समृद्ध
- दर्ज
- मनोरंजन
- प्रत्येक
- उदाहरण
- एक्सचेंज
- अनुभव
- अनुभव
- का पता लगाने
- कुछ
- पट्टिका
- फ़ाइलें
- छानने
- खोज
- खोज
- का पालन करें
- निम्नलिखित
- के लिए
- प्रारूप
- से
- पूरी तरह से
- कार्यक्षमता
- g1
- उत्पन्न
- पीढ़ी
- उत्पादक
- जनरेटिव एआई
- शैलियों
- मिल
- वैश्विक
- Go
- ग्राफ
- अधिक से अधिक
- है
- he
- मदद
- उच्च स्तर
- उसके
- कैसे
- How To
- तथापि
- एचटीएमएल
- http
- HTTPS
- if
- कार्यान्वयन
- में सुधार
- in
- सहित
- बढ़ना
- उद्योग
- पता
- करें-
- नवोन्मेष
- पूछताछ
- एकीकृत
- बुद्धिमान
- इरादा
- में
- शामिल
- IT
- जेपीजी
- केवल
- ज्ञान
- ज्ञान ग्राफ
- रंग
- भाषा
- बड़ा
- बड़े पैमाने पर
- नेतृत्व
- प्रमुख
- सीख रहा हूँ
- leverages
- लाइसेंस
- लाइसेंस - प्राप्त
- लाइसेंसिंग
- पसंद
- एलएलएम
- स्थानीय
- स्थान
- कम
- मशीन
- यंत्र अधिगम
- बनाना
- प्रबंधन
- कामयाब
- प्रबंधक
- बहुत
- me
- मीडिया
- सदस्य
- मेटाडाटा
- तरीकों
- दस लाख
- ML
- आदर्श
- मॉडल
- अधिक
- चलचित्र
- चलचित्र
- नाम
- नामों
- नेविगेट करें
- पथ प्रदर्शन
- आवश्यकता
- की जरूरत है
- नया
- अगला
- रात
- of
- Office
- on
- ONE
- अवसर
- or
- संगठनों
- अन्य
- हमारी
- के ऊपर
- अपना
- पैकेज
- पृष्ठ
- प्रदत्त
- फलक
- भाग
- जुनून
- पथ
- प्रति
- प्रदर्शन
- निजीकृत
- प्लेटफार्म
- प्लेटो
- प्लेटो डेटा इंटेलिजेंस
- प्लेटोडाटा
- भूखंड
- लोकप्रिय
- पद
- मुख्यत
- समस्याओं
- प्रक्रिया
- उत्पादक
- प्रोड्यूसर्स
- मालिकाना
- प्रदान करता है
- प्रश्नों
- सवाल
- प्रशन
- खपरैल
- रेंज
- दरें
- दर्ज़ा
- रेटिंग
- तैयार
- की सिफारिश
- सिफारिश
- सिफारिशें
- रिकॉर्ड
- उल्लेख
- सम्बंधित
- प्रासंगिक
- रिपोर्टिंग
- की आवश्यकता होती है
- प्रतिक्रिया
- प्रतिक्रियाएं
- परिणाम
- प्रतिधारण
- बहाली
- वापसी
- भूमिका
- आरओडब्ल्यू
- दौड़ना
- संतोष
- बचत
- विज्ञान
- वैज्ञानिक
- Search
- अनुभाग
- सुरक्षित रूप से
- खंड
- चयन
- अर्थ
- अर्थ विज्ञान
- वरिष्ठ
- serverless
- सेवा
- सेवाएँ
- सेटिंग्स
- वह
- शॉट
- दिखाना
- प्रदर्शन
- पता चला
- सरल
- अनुकरण करना
- एक
- आकार
- छोटे
- So
- समाधान
- हल
- हल करती है
- कुछ
- स्रोत
- सूत्रों का कहना है
- माहिर
- विशिष्ट
- शुरू
- कदम
- भंडारण
- की दुकान
- संग्रहित
- भंडारण
- सरल
- अंशदान
- ऐसा
- परिशिष्ट
- सिंक।
- सिस्टम
- लेना
- कार्य
- तकनीक
- परीक्षण
- टेक्स्ट
- से
- कि
- RSI
- जानकारी
- लेकिन हाल ही
- उन
- थीम्ड
- फिर
- वहाँ।
- इन
- वे
- इसका
- यहाँ
- पहर
- टाइटन
- खिताब
- सेवा मेरे
- tv
- समझ
- समझ लिया
- असंरचित
- आधुनिकतम
- अपलोड की गई
- यूआरएल
- उपयोग
- प्रयुक्त
- उपयोगकर्ता
- उपयोगकर्ताओं
- का उपयोग
- विभिन्न
- व्यापक
- कार्यक्षेत्र
- भेंट
- W
- चलना
- करना चाहते हैं
- था
- we
- वेब
- वेब सेवाओं
- सप्ताह
- चौड़ा
- विस्तृत श्रृंखला
- मर्जी
- साथ में
- वर्कफ़्लो
- काम कर रहे
- कार्य
- लिखना
- X
- वर्ष
- आप
- आपका
- जेफिरनेट