AI Generative למודלים יש פוטנציאל לחולל מהפכה בפעילות הארגונית, אך עסקים חייבים לשקול היטב כיצד לרתום את כוחם תוך התגברות על אתגרים כמו שמירה על נתונים והבטחת איכות התוכן שנוצר בינה מלאכותית.
מסגרת ה-Retrieval-Augmented Generation (RAG) מגדילה הנחיות עם נתונים חיצוניים ממקורות מרובים, כגון מאגרי מסמכים, מסדי נתונים או ממשקי API, כדי להפוך את דגמי היסוד ליעילים עבור משימות ספציפיות לתחום. פוסט זה מציג את היכולות של מודל RAG ומדגיש את הפוטנציאל הטרנספורמטיבי של MongoDB Atlas עם תכונת החיפוש הווקטורית שלו.
MongoDB אטלס היא חבילה משולבת של שירותי נתונים המאיצים ומפשטים את הפיתוח של יישומים מונעי נתונים. מאגר הנתונים הווקטוריים שלו משתלב בצורה חלקה עם אחסון נתונים תפעולי, ומבטל את הצורך במסד נתונים נפרד. אינטגרציה זו מאפשרת יכולות חיפוש סמנטי רב עוצמה באמצעות חיפוש וקטור, דרך מהירה לבנות חיפוש סמנטי ויישומים המונעים בינה מלאכותית.
אמזון SageMaker מאפשר לארגונים לבנות, לאמן ולפרוס מודלים של למידת מכונה (ML). אמזון SageMaker JumpStart מספק מודלים ונתונים מאומנים מראש כדי לעזור לך להתחיל עם ML. אתה יכול לגשת, להתאים אישית ולפרוס מודלים ונתונים מאומנים מראש דרך דף הנחיתה של SageMaker JumpStart ב סטודיו SageMaker של אמזון בכמה לחיצות בלבד.
אמזון לקס הוא ממשק שיחה שעוזר לעסקים ליצור צ'אטבוטים ובוטים קוליים שעוסקים באינטראקציות טבעיות ומציאותיות. על ידי שילוב של Amazon Lex עם AI גנרטיבי, עסקים יכולים ליצור מערכת אקולוגית הוליסטית שבה קלט המשתמש עובר בצורה חלקה לתגובות קוהרנטיות ורלוונטיות מבחינה הקשרית.
סקירת פתרונות
התרשים הבא ממחיש את ארכיטקטורת הפתרונות.
בסעיפים הבאים, נעבור על השלבים ליישום פתרון זה ומרכיביו.
הגדר אשכול MongoDB
כדי ליצור אשכול MongoDB Atlas בחינם, עקוב אחר ההוראות ב צור אשכול. הגדר את מסד הנתונים גישה ורשת גישה.
פרוס את מודל ההטמעה של SageMaker
אתה יכול לבחור את דגם ההטמעה (ALL MiniLM L6 v2) על SageMaker JumpStart מודלים, מחברות, פתרונות עמוד.
בחרו לפרוס לפרוס את המודל.
ודא שהמודל פרוס בהצלחה וודא שנקודת הקצה נוצרה.
הטבעה וקטורית
הטבעה וקטורית הוא תהליך של המרת טקסט או תמונה לייצוג וקטור. עם הקוד הבא, נוכל ליצור הטבעות וקטוריות עם SageMaker JumpStart ולעדכן את האוסף עם הווקטור שנוצר עבור כל מסמך:
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
הקוד למעלה מראה כיצד לעדכן אובייקט בודד באוסף. כדי לעדכן את כל האובייקטים, עקוב אחר ה- הוראות.
מאגר נתונים וקטורים של MongoDB
MongoDB Atlas וקטור חיפוש היא תכונה חדשה המאפשרת לך לאחסן ולחפש נתונים וקטוריים ב- MongoDB. נתונים וקטוריים הם סוג של נתונים המייצגים נקודה במרחב בעל ממדים גבוהים. סוג זה של נתונים משמש לעתים קרובות ביישומי ML ובינה מלאכותית. MongoDB Atlas Vector Search משתמש בטכניקה הנקראת k-השכנים הקרובים ביותר (k-NN) כדי לחפש וקטורים דומים. k-NN פועל על ידי מציאת ה-k הוקטורים הדומים ביותר לוקטור נתון. הוקטורים הדומים ביותר הם אלו הקרובים ביותר לווקטור הנתון מבחינת המרחק האוקלידי.
אחסון נתונים וקטוריים לצד נתונים תפעוליים יכול לשפר את הביצועים על ידי הפחתת הצורך בהעברת נתונים בין מערכות אחסון שונות. זה מועיל במיוחד עבור יישומים הדורשים גישה בזמן אמת לנתונים וקטוריים.
צור אינדקס חיפוש וקטור
השלב הבא הוא ליצור אינדקס חיפוש וקטור של MongoDB בשדה הווקטור שיצרת בשלב הקודם. MongoDB משתמש ב- knnVector
הקלד לאינדקס הטמעות וקטוריות. השדה הווקטור צריך להיות מיוצג כמערך של מספרים (BSON int32, int64 או סוגי נתונים כפולים בלבד).
עיין סקור את מגבלות סוג knnVector למידע נוסף על המגבלות של knnVector
הקלד.
הקוד הבא הוא הגדרה לדוגמה של אינדקס:
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
שים לב שהמימד חייב להתאים לממד דגם ההטמעות שלך.
שאל את מאגר הנתונים הווקטוריים
אתה יכול לשאול את מאגר הנתונים הווקטוריים באמצעות ה צינור צבירה של חיפוש וקטור. הוא משתמש באינדקס חיפוש וקטור ומבצע א חיפוש סמנטי על מאגר הנתונים הווקטוריים.
הקוד הבא הוא הגדרת חיפוש לדוגמה:
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
פרוס את מודל השפה הגדולה של SageMaker
דגמי בסיס של SageMaker JumpStart הם מודלים של שפה גדולה (LLM) שהוכשרו מראש המשמשים לפתרון מגוון משימות עיבוד שפה טבעית (NLP), כגון סיכום טקסט, מענה לשאלות והסקת שפה טבעית. הם זמינים במגוון גדלים ותצורות. בפתרון זה, אנו משתמשים ב- פנים מחבקות דגם FLAN-T5-XL.
חפש את דגם FLAN-T5-XL ב- SageMaker JumpStart.
בחרו לפרוס כדי להגדיר את דגם FLAN-T5-XL.
ודא שהמודל נפרס בהצלחה ונקודת הקצה פעילה.
צור בוט של אמזון לקס
כדי ליצור בוט של Amazon Lex, בצע את השלבים הבאים:
- במסוף לקסון של אמזון, בחר צור בוט.
- בעד שם הבוט, הכנס שם.
- בעד תפקיד זמן ריצה, בחר צור תפקיד עם הרשאות בסיסיות של אמזון לקס.
- ציין את הגדרות השפה שלך ולאחר מכן בחר בוצע.
- הוסף אמירה לדוגמה ב-
NewIntent
ממשק משתמש ובחר שמור כוונה. - נווט אל
FallbackIntent
שנוצרה עבורך כברירת מחדל והתחלף Active ב הגשמה סָעִיף. - בחרו לִבנוֹת ואחרי שהבנייה מוצלחת, בחר מִבְחָן.
- לפני הבדיקה, בחר בסמל גלגל השיניים.
- ציין את AWS למבדה פונקציה שתקיים אינטראקציה עם MongoDB Atlas וה-LLM כדי לספק תגובות. כדי ליצור את פונקציית lambda בצע שלבים אלה.
- כעת תוכל ליצור אינטראקציה עם ה-LLM.
לנקות את
כדי לנקות את המשאבים שלך, בצע את השלבים הבאים:
- מחק את הבוט של Amazon Lex.
- מחק את פונקציית Lambda.
- מחק את נקודת הקצה של LLM SageMaker.
- מחק את נקודת הקצה של דגם ההטמעות SageMaker.
- מחק את אשכול MongoDB Atlas.
סיכום
בפוסט הראינו כיצד ליצור בוט פשוט המשתמש בחיפוש סמנטי של MongoDB Atlas ומשתלב עם מודל מבית SageMaker JumpStart. בוט זה מאפשר לך ליצור אבטיפוס מהיר של אינטראקציה של משתמשים עם LLMs שונים ב- SageMaker Jumpstart תוך התאמה ביניהם עם ההקשר שמקורו ב- MongoDB Atlas.
כמו תמיד, AWS מקבלת בברכה משוב. אנא השאר את המשוב והשאלות שלך בקטע ההערות.
על המחברים
איגור אלכסייב הוא ארכיטקט פתרונות שותפים בכיר ב-AWS בתחום הנתונים והאנליטיקס. בתפקידו איגור עובד עם שותפים אסטרטגיים המסייעים להם לבנות ארכיטקטורות מורכבות ומותאמות ל-AWS. לפני שהצטרף ל-AWS, כאדריכל Data/Solution הוא יישם פרויקטים רבים בתחום הביג דאטה, כולל מספר אגמי נתונים באקוסיסטם של Hadoop. כמהנדס נתונים הוא היה מעורב ביישום AI/ML לאיתור הונאה ואוטומציה משרדית.
באבו סריניוואסן הוא אדריכל פתרונות שותפים בכיר ב- MongoDB. בתפקידו הנוכחי, הוא עובד עם AWS כדי לבנות את האינטגרציות הטכניות וארכיטקטורות ההתייחסות לפתרונות AWS ו-MongoDB. יש לו יותר משני עשורים של ניסיון בטכנולוגיות מסדי נתונים וענן. הוא נלהב לספק פתרונות טכניים ללקוחות העובדים עם מספר אינטגרטורים גלובליים (GSIs) ברחבי גיאוגרפיות מרובות.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- :יש ל
- :הוא
- :איפה
- $ למעלה
- 100
- 200
- 321
- 361
- 7
- 9
- a
- אודות
- מֵעַל
- להאיץ
- גישה
- לרוחב
- פעיל
- לאחר
- - צבירה
- AI
- מונע AI
- AI / ML
- תעשיות
- מאפשר
- תמיד
- אמזון בעברית
- אמזון לקס
- אמזון SageMaker
- אמזון SageMaker JumpStart
- אמזון שירותי אינטרנט
- an
- ניתוח
- ו
- ממשקי API
- יישומים
- מריחה
- ארכיטקטורה
- ARE
- מערך
- מלאכותי
- בינה מלאכותית
- AS
- At
- תוספות
- אוטומציה
- זמין
- AWS
- AWS למבדה
- בסיסי
- BE
- מועיל
- בֵּין
- גָדוֹל
- נתונים גדולים
- בוט
- בוטים
- לִבנוֹת
- עסקים
- אבל
- by
- נקרא
- CAN
- יכולות
- בזהירות
- האתגרים
- chatbots
- בחרו
- לְנַקוֹת
- ענן
- אשכול
- קוד
- קוהרנטי
- אוסף
- הערות
- להשלים
- מורכב
- רכיבים
- לשקול
- קונסול
- תוכן
- הקשר
- שיחה
- המרת
- לִיצוֹר
- נוצר
- נוֹכְחִי
- לקוחות
- אישית
- נתונים
- אחסון נתונים
- נתונים מונחים
- מסד נתונים
- מאגרי מידע
- עשרות שנים
- בְּרִירַת מֶחדָל
- מחדל
- הגדרה
- לפרוס
- פרס
- איתור
- צעצועי התפתחות
- אחר
- מֵמַד
- ממדים
- מרחק
- מסמך
- תחום
- לְהַכפִּיל
- דינמי
- המערכת האקולוגית
- אפקטיבי
- חיסול
- הטבעה
- מאפשר
- נקודת קצה
- לעסוק
- מהנדס
- הבטחתי
- זן
- מִפְעָל
- חברות
- במיוחד
- כל
- ניסיון
- חיצוני
- מהר
- מאפיין
- מָשׁוֹב
- מעטים
- שדה
- שדות
- לסנן
- מציאת
- לעקוב
- הבא
- בעד
- קרן
- מסגרת
- הונאה
- גילוי הונאה
- חופשי
- החל מ-
- פונקציה
- ציוד
- ליצור
- דור
- גנרטטיבית
- AI Generative
- גיאוגרפיות
- לקבל
- נתן
- גלוֹבָּלִי
- רתמת
- יש
- he
- לעזור
- עזרה
- עוזר
- פסים
- שֶׁלוֹ
- הוליסטית
- איך
- איך
- HTML
- http
- HTTPS
- ICON
- מדגים
- תמונה
- ליישם
- יושם
- לשפר
- in
- כולל
- מדד
- מידע
- קלט
- הוראות
- משולב
- משלב
- שילוב
- השתלבות
- ואינטגרציות
- מוֹדִיעִין
- אינטראקציה
- אינטראקציה
- יחסי גומלין
- מִמְשָׁק
- אל תוך
- מעורב
- IT
- שֶׁלָה
- הצטרפות
- ג'סון
- רק
- אגמים
- נחיתה
- שפה
- גָדוֹל
- למידה
- יציאה
- כְּמוֹ בַּחַיִים
- מגבלות
- LLM
- מכונה
- למידת מכונה
- לעשות
- רב
- להתאים
- ML
- מודל
- מודלים
- MongoDB
- יותר
- רוב
- המהלך
- מספר
- צריך
- שם
- טבעי
- עיבוד שפה טבעית
- צורך
- רשת
- חדש
- הבא
- NLP
- עַכשָׁיו
- מספרים
- אובייקט
- אובייקטים
- of
- Office
- לעתים קרובות
- on
- יחידות
- רק
- מבצעי
- תפעול
- or
- מקורו
- התגברות
- סקירה
- עמוד
- זיווג
- שותף
- שותפים
- לוהט
- נתיב
- ביצועים
- מבצע
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- אנא
- נקודה
- הודעה
- פוטנציאל
- כּוֹחַ
- חזק
- מתנות
- קודם
- קודם
- תהליך
- תהליך
- פרויקטים
- אב טיפוס
- לספק
- מספק
- מתן
- איכות
- שאלה
- שאלות
- מהירות
- זמן אמת
- הפחתה
- הפניה
- רלוונטי
- נציגות
- מיוצג
- מייצג
- לדרוש
- משאבים
- תגובות
- לְחוֹלֵל מַהְפֵּכָה
- תפקיד
- שְׁמִירָה
- בעל חכמים
- ציון
- בצורה חלקה
- חיפוש
- סעיף
- סעיפים
- לחצני מצוקה לפנסיונרים
- נפרד
- שירותים
- סט
- הגדרות
- כמה
- צריך
- הראה
- הופעות
- דומה
- פָּשׁוּט
- לפשט
- יחיד
- גדל
- פִּתָרוֹן
- פתרונות
- לפתור
- מקורות
- מֶרחָב
- החל
- שלב
- צעדים
- אחסון
- חנות
- אסטרטגי
- שותפים אסטרטגיים
- מוצלח
- בהצלחה
- כזה
- מערכת
- מערכת
- מערכות
- משימות
- טכני
- טכניקה
- טכנולוגיות
- מונחים
- מבחן
- בדיקות
- טֶקסט
- מֵאֲשֶׁר
- זֶה
- השמיים
- שֶׁלָהֶם
- אותם
- אז
- הֵם
- זֶה
- דרך
- נִדבָּך
- ל
- רכבת
- טרנספורמטיבית
- מעברים
- נָכוֹן
- שתיים
- סוג
- סוגים
- ui
- עדכון
- להשתמש
- מְשׁוּמָשׁ
- משתמש
- שימושים
- באמצעות
- מגוון
- לאמת
- קול
- ללכת
- היה
- דֶרֶך..
- we
- אינטרנט
- שירותי אינטרנט
- מברך
- בזמן
- יצטרך
- עם
- עובד
- עובד
- אתה
- זפירנט