שיפור האופן שבו משתמשים מגלים תוכן חדש הוא קריטי כדי להגביר את מעורבות המשתמש ושביעות הרצון בפלטפורמות המדיה. לחיפוש מילות מפתח לבדו יש אתגרים בלכידת הסמנטיקה וכוונת המשתמש, מה שמוביל לתוצאות חסרות הקשר רלוונטי; לדוגמה, מציאת סרטים בנושאי לילה או חג המולד. זה יכול לגרום לשיעורי שמירה נמוכים יותר אם משתמשים לא יכולים למצוא בצורה מהימנה את התוכן שהם רוצים. עם זאת, עם מודלים גדולים לשפה (LLMs), יש הזדמנות לפתור את האתגרים הסמנטיים וכוונת המשתמש הללו. על ידי שילוב הטבעות הלוכדים סמנטיקה בטכניקה הנקראת Generation Augmented של אחזור (RAG), תוכל ליצור תשובות רלוונטיות יותר על סמך הקשר שאוחזר ממקורות הנתונים שלך.
בפוסט זה, אנו מראים לך כיצד ליצור בצורה מאובטחת צ'אטבוט סרט על ידי הטמעת RAG עם הנתונים שלך באמצעות מאגרי ידע ל סלע אמזון. אנו משתמשים במערך הנתונים של IMDb ו-Box Office Mojo כדי לדמות קטלוג ללקוחות מדיה ובידור ולהציג כיצד אתה יכול לבנות פתרון RAG משלך בכמה שלבים בלבד.
סקירת פתרונות
השמיים IMDb וקופות Mojo Movies/TV/OTT חבילת נתונים ברישיון מספקת מגוון רחב של מטא נתונים בידוריים, כולל למעלה ממיליארד דירוגי משתמשים; קרדיטים ליותר מ-1.6 מיליון חברי צוות וצוות; 13 מיליון כותרי סרטים, טלוויזיה ובידור; ונתוני דיווח קופות גלובליים מיותר מ-10 מדינות. לקוחות מדיה ובידור רבים של AWS נותנים רישיון לנתוני IMDb באמצעות חילופי נתונים AWS כדי לשפר את גילוי התוכן ולהגדיל את המעורבות והשימור של הלקוחות.
מבוא לבסיסי ידע עבור אמזון
כדי לצייד LLM במידע קנייני עדכני, ארגונים משתמשים ב-RAG, טכניקה הכוללת שליפת נתונים ממקורות נתונים של החברה והעשרת ההנחיות בנתונים אלה כדי לספק תגובות רלוונטיות ומדויקות יותר. בסיסי ידע עבור Amazon Bedrock מאפשרים יכולת RAG מנוהלת במלואה המאפשרת לך להתאים אישית תגובות LLM עם נתוני חברה הקשריים ורלוונטיים. בסיסי ידע הופכים את זרימת העבודה של RAG מקצה לקצה, כולל הטמעה, אחזור, הגדלה מהירה וציטוטים, ומבטלים את הצורך בכתיבת קוד מותאם אישית כדי לשלב מקורות נתונים ולנהל שאילתות. בסיסי הידע עבור Amazon Bedrock מאפשרים גם שיחות מרובות פניות כך שה-LLM יוכל לענות על שאילתות משתמשים מורכבות עם התשובה הנכונה.
אנו משתמשים בשירותים הבאים כחלק מפתרון זה:
אנו עוברים את השלבים הבאים ברמה גבוהה:
- עבד מראש את נתוני ה-IMDb כדי ליצור מסמכים מכל רשומת סרט ולהעלות את הנתונים לתוך שירות אחסון פשוט של אמזון (אמזון S3) דלי.
- צור בסיס ידע.
- סנכרן את בסיס הידע שלך עם מקור הנתונים שלך.
- השתמש במאגר הידע כדי לענות על שאילתות סמנטיות לגבי קטלוג הסרטים.
תנאים מוקדמים
נתוני IMDb המשמשים בפוסט זה דורשים רישיון תוכן מסחרי ומנוי בתשלום לחבילת הרישוי של IMDb ו-Box Office Mojo Movies/TV/OTT ב-AWS Data Exchange. לבירור לגבי רישיון וגישה לנתונים לדוגמה, בקר developer.imdb.com. כדי לגשת למערך הנתונים, עיין ב המלצת כוח וחיפוש באמצעות גרף ידע IMDb - חלק 1 ובצע את גש לנתוני IMDb סָעִיף.
עבד מראש את נתוני IMDb
לפני שניצור בסיס ידע, עלינו לעבד מראש את מערך הנתונים של IMDb לקובצי טקסט ולהעלות אותם לדלי S3. בפוסט זה, אנו מדמים קטלוג לקוחות באמצעות מערך הנתונים של IMDb. אנו לוקחים 10,000 סרטים פופולריים ממערך הנתונים של IMDb עבור הקטלוג ובונים את מערך הנתונים.
השתמש באפשרויות הבאות מחברה כדי ליצור את מערך הנתונים עם מידע נוסף כמו שחקנים, במאים ומפיקים. אנו משתמשים בקוד הבא כדי ליצור קובץ בודד לסרט עם כל המידע המאוחסן בקובץ בטקסט לא מובנה שניתן להבין על ידי LLMs:
לאחר שיש לך את הנתונים בפורמט txt, תוכל להעלות את הנתונים לאמזון S3 באמצעות הפקודה הבאה:
צור את מאגר הידע של IMDb
השלם את השלבים הבאים כדי ליצור את בסיס הידע שלך:
- בקונסולת Amazon Bedrock, בחר בסיס ידע בחלונית הניווט.
- בחרו צור בסיס ידע.
- בעד שם מאגר הידע, להיכנס
imdb
. - בעד תיאור מאגר הידע, הזן תיאור אופציונלי, כגון Knowledge Base להטמעה ואחסון של נתוני imdb.
- בעד הרשאות IAM, בחר צור תפקיד שירות חדש והשתמש בו, ולאחר מכן הזן שם עבור תפקיד השירות החדש שלך.
- בחרו הַבָּא.
- בעד שם מקור הנתונים, להיכנס
imdb-s3
. - בעד S3 URI, הזן את URI S3 שאליו העלית את הנתונים.
- ב הגדרות מתקדמות - אופציונלי קטע, עבור אסטרטגיית נתחים, בחר בלי חתיכות.
- בחרו הַבָּא.
מאגרי ידע מאפשרים לך לחלק את המסמכים שלך למקטעים קטנים יותר כדי שיהיה לך קל לעבד מסמכים גדולים. במקרה שלנו, כבר חיברנו את הנתונים למסמך בגודל קטן יותר (אחד לכל סרט).
- ב מסד נתונים וקטורי בחר, בחר צור במהירות חנות וקטורית חדשה.
Amazon Bedrock תיצור אוטומטית אוסף חיפוש וקטור ללא שרת OpenSearch מנוהל במלואו ותגדיר את ההגדרות להטמעת מקורות הנתונים שלך באמצעות המודל הנבחר Titan Embedding G1 - Text Embedding.
- בחרו הַבָּא.
- בדוק את ההגדרות שלך ובחר צור בסיס ידע.
סנכרן את הנתונים שלך עם בסיס הידע
כעת, לאחר שיצרת את בסיס הידע שלך, תוכל לסנכרן את בסיס הידע עם הנתונים שלך.
- במסוף Amazon Bedrock, נווט אל מאגר הידע שלך.
- ב מקור נתונים סעיף, בחר לסנכרן.
לאחר סנכרון מקור הנתונים, אתה מוכן לבצע שאילתה על הנתונים.
שפר את החיפוש באמצעות תוצאות סמנטיות
השלם את השלבים הבאים כדי לבדוק את הפתרון ולשפר את החיפוש שלך באמצעות תוצאות סמנטיות:
- במסוף Amazon Bedrock, נווט אל מאגר הידע שלך.
- בחר את בסיס הידע שלך ובחר מבחן בסיס ידע.
- בחרו בחר דגם, ולבחור קלוד האנתרופי v2.1.
- בחרו החל.
כעת אתה מוכן לבצע שאילתה על הנתונים.
אנחנו יכולים לשאול כמה שאלות סמנטיות, כמו "המליץ לי על כמה סרטים בנושא חג המולד".
תגובות מאגר הידע מכילות ציטוטים שאתה יכול לחקור על נכונות התגובה והעובדות.
אתה יכול גם להתעמק בכל מידע שאתה צריך מהסרטים האלה. בדוגמה הבאה, אנו שואלים "מי ביים סיוט לפני חג המולד?"
אתה יכול גם לשאול שאלות ספציפיות יותר הקשורות לז'אנרים ולדירוגים, כגון "הראה לי סרטי אנימציה קלאסיים עם דירוגים גבוהים מ-7?"
הגדל את בסיס הידע שלך עם סוכנים
סוכנים עבור Amazon Bedrock לעזור לך להפוך משימות מורכבות לאוטומטיות. סוכנים יכולים לפרק את שאילתת המשתמש למשימות קטנות יותר ולקרוא לממשקי API מותאמים אישית או לבסיסי ידע כדי להשלים מידע להפעלת פעולות. עם Agents for Amazon Bedrock, מפתחים יכולים לשלב סוכנים חכמים באפליקציות שלהם, להאיץ את האספקה של יישומים המופעלים על ידי בינה מלאכותית ולחסוך שבועות של זמן פיתוח. עם סוכנים, אתה יכול להגדיל את בסיס הידע שלך על ידי הוספת פונקציונליות נוספת כמו המלצות מאת אמזון להתאים אישית עבור המלצות ספציפיות למשתמש או ביצוע פעולות כגון סינון סרטים בהתאם לצרכי המשתמש.
סיכום
בפוסט זה, הראינו כיצד לבנות צ'אטבוט של סרטי שיחה באמצעות Amazon Bedrock בכמה שלבים כדי לענות על חוויות חיפוש סמנטיות וחוויות שיחה בהתבסס על הנתונים שלך ומערך הנתונים המורשים של IMDb ו-Box Office Mojo Movies/TV/OTT. בפוסט הבא, אנו עוברים על תהליך הוספת פונקציונליות נוספת לפתרון שלך באמצעות Agents for Amazon Bedrock. כדי להתחיל עם בסיסי ידע על Amazon Bedrock, עיין ב בסיסי ידע עבור Amazon Bedrock.
על הכותבים
גאורב רלה הוא מדען נתונים בכיר במרכז החדשנות של AI Generative, שם הוא עובד עם לקוחות AWS בתחומים שונים כדי להאיץ את השימוש שלהם בשירותי AI גנרטיבי ובשירותי ענן AWS כדי לפתור את האתגרים העסקיים שלהם.
דיוויה בהרגאווי היא מובילה בכירה של מדענית יישומית במרכז החדשנות של AI Generative, שם היא פותרת בעיות עסקיות בעלות ערך גבוה עבור לקוחות AWS תוך שימוש בשיטות AI גנרטיביות. היא עובדת על הבנה ושליפה של תמונות/וידאו, גרף ידע מוגדל מודלים של שפות גדולות ומקרי שימוש בפרסומות מותאמות אישית.
סורן גונטורו הוא מדען נתונים שעובד במרכז החדשנות של AI Generative, שם הוא עובד עם לקוחות AWS שונים כדי לפתור בעיות עסקיות בעלות ערך גבוה. הוא מתמחה בבניית צינורות ML באמצעות Large Language Models, בעיקר באמצעות Amazon Bedrock ושירותי AWS Cloud אחרים.
וידיה סגר רביפאטי הוא מנהל מדע במרכז החדשנות של AI Generative, שם הוא ממנף את ניסיונו הרב במערכות מבוזרות בקנה מידה גדול ואת התשוקה שלו ללמידת מכונה כדי לעזור ללקוחות AWS במגוון רחב של ענפים להאיץ את אימוץ הבינה המלאכותית והענן שלהם.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/build-a-movie-chatbot-for-tv-ott-platforms-using-retrieval-augmented-generation-in-amazon-bedrock/
- :יש ל
- :הוא
- :איפה
- $ 10 מיליון
- 000
- 1
- 10
- 100
- 11
- 118
- 12
- 13
- 360
- 385
- 60
- 7
- a
- אודות
- להאיץ
- מאיצה
- גישה
- מדויק
- לרוחב
- פעולות
- שחקנים
- מוסיף
- נוסף
- אימוץ
- פרסום
- סוכנים
- AI
- מונע AI
- תעשיות
- מאפשר
- לבד
- כְּבָר
- גם
- אמזון בעברית
- אמזון שירותי אינטרנט
- an
- ו
- לענות
- תשובות
- כל
- ממשקי API
- יישומים
- יישומית
- אפליקציות
- ARE
- AS
- לשאול
- At
- לְהַגדִיל
- מוגבר
- אוטומטי
- באופן אוטומטי
- AWS
- חילופי נתונים AWS
- בסיס
- מבוסס
- BE
- לפני
- B
- אריזה מקורית
- קופה
- לשבור
- לִבנוֹת
- בִּניָן
- עסקים
- by
- שיחה
- נקרא
- CAN
- יכולת
- ללכוד
- לכידה
- מקרה
- מקרים
- קטלוג
- מרכז
- האתגרים
- chatbot
- בחרו
- נבחר
- חַג הַמוֹלָד
- קלאסי
- ענן
- אימוץ ענן
- שירותי ענן
- קוד
- אוסף
- שילוב
- מסחרי
- חברה
- מורכב
- קונסול
- להכיל
- תוכן
- הקשר
- קשר
- שיחה
- שיחות
- לתקן
- מדינות
- זוג
- לִיצוֹר
- נוצר
- קרדיטים
- צוות
- קריטי
- מנהג
- לקוח
- מעורבות לקוחות
- לקוחות
- אישית
- נתונים
- חילופי נתונים
- מדען נתונים
- תַאֲרִיך
- למסור
- מסירה
- תיאור
- פרטים
- מפתחים
- צעצועי התפתחות
- אחר
- מְכוּוָן
- מְנַהֵל
- דירקטורים
- לגלות
- תגלית
- מופץ
- מערכות מבוזרות
- מסמך
- מסמכים
- מטה
- נהיגה
- חיסול
- הטבעה
- לאפשר
- מקצה לקצה
- התעסקות
- מעשיר
- זן
- בידור
- כל
- דוגמה
- חליפין
- ניסיון
- חוויות
- לחקור
- מעטים
- שלח
- קבצים
- סינון
- מציאת
- לעקוב
- הבא
- בעד
- פוּרמָט
- החל מ-
- לגמרי
- פונקציונלי
- g1
- ליצור
- דור
- גנרטטיבית
- AI Generative
- ז'אנרים
- לקבל
- גלוֹבָּלִי
- Go
- גרף
- יותר
- יש
- he
- לעזור
- ברמה גבוהה
- שֶׁלוֹ
- איך
- איך
- אולם
- HTML
- http
- HTTPS
- if
- יישום
- לשפר
- in
- כולל
- להגדיל
- תעשייה
- מידע
- מידע
- חדשנות
- לברר
- לשלב
- אינטליגנטי
- כוונה
- אל תוך
- כרוך
- IT
- jpg
- רק
- ידע
- גרף ידע
- חוסר
- שפה
- גָדוֹל
- בקנה מידה גדול
- עוֹפֶרֶת
- מוביל
- למידה
- מנופים
- רישיון
- מורשה
- רישוי
- כמו
- LLM
- מקומי
- מיקום
- להוריד
- מכונה
- למידת מכונה
- לעשות
- לנהל
- הצליח
- מנהל
- רב
- me
- מדיה
- להרשם/להתחבר
- מידע נוסף
- שיטות
- מִילִיוֹן
- ML
- מודל
- מודלים
- יותר
- סרט
- סרטים
- שם
- שמות
- נווט
- ניווט
- צורך
- צרכי
- חדש
- הבא
- לילה
- of
- Office
- on
- ONE
- הזדמנות
- or
- ארגונים
- אחר
- שלנו
- יותר
- שֶׁלוֹ
- חבילה
- עמוד
- נפרע
- זגוגית
- חלק
- תשוקה
- נתיב
- עבור
- ביצוע
- אישית
- פלטפורמות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- עלילה
- פופולרי
- הודעה
- בראש ובראשונה
- בעיות
- תהליך
- יַצרָן
- מפיק
- קניינית
- מספק
- שאילתות
- שאלה
- שאלות
- סמרטוט
- רכס
- תעריפים
- דירוג
- דירוגים
- מוכן
- להמליץ
- המלצה
- המלצות
- שיא
- להתייחס
- קָשׁוּר
- רלוונטי
- דווח
- דורש
- תגובה
- תגובות
- תוצאות
- שייר
- שליפה
- לַחֲזוֹר
- תפקיד
- שׁוּרָה
- ריצה
- שביעות רצון
- חסכת
- מדע
- מַדְעָן
- חיפוש
- סעיף
- מאובטח
- מגזרים
- בחר
- סמנטי
- סמנטיקה
- לחצני מצוקה לפנסיונרים
- ללא שרת
- שרות
- שירותים
- הגדרות
- היא
- בְּעִיטָה
- לְהַצִיג
- ראווה
- הראה
- פָּשׁוּט
- לדמות
- יחיד
- מידה
- קטן יותר
- So
- פִּתָרוֹן
- לפתור
- פותר
- כמה
- מָקוֹר
- מקורות
- מתמחה
- ספציפי
- החל
- צעדים
- אחסון
- חנות
- מאוחסן
- אחסון
- פשוט
- מִנוּיים
- כזה
- תוספת
- סינכרון.
- מערכות
- לקחת
- משימות
- טכניקה
- מבחן
- טֶקסט
- מֵאֲשֶׁר
- זֶה
- השמיים
- המידע
- שֶׁלָהֶם
- אותם
- נושאים
- אז
- שם.
- אלה
- הֵם
- זֶה
- דרך
- זמן
- עֲנָק
- כותרות
- ל
- tv
- הבנה
- הבין
- לא מובנה
- עדכן
- נטען
- כתובת האתר
- להשתמש
- מְשׁוּמָשׁ
- משתמש
- משתמשים
- באמצעות
- שונים
- Vast
- אנכיות
- לְבַקֵר
- W
- ללכת
- רוצה
- היה
- we
- אינטרנט
- שירותי אינטרנט
- שבועות
- רָחָב
- טווח רחב
- יצטרך
- עם
- זרימת עבודה
- עובד
- עובד
- לכתוב
- X
- שנה
- אתה
- זפירנט