אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | שירותי האינטרנט של אמזון

אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | שירותי האינטרנט של אמזון

AI Generative למודלים יש פוטנציאל לחולל מהפכה בפעילות הארגונית, אך עסקים חייבים לשקול היטב כיצד לרתום את כוחם תוך התגברות על אתגרים כמו שמירה על נתונים והבטחת איכות התוכן שנוצר בינה מלאכותית.

מסגרת ה-Retrieval-Augmented Generation (RAG) מגדילה הנחיות עם נתונים חיצוניים ממקורות מרובים, כגון מאגרי מסמכים, מסדי נתונים או ממשקי API, כדי להפוך את דגמי היסוד ליעילים עבור משימות ספציפיות לתחום. פוסט זה מציג את היכולות של מודל RAG ומדגיש את הפוטנציאל הטרנספורמטיבי של MongoDB Atlas עם תכונת החיפוש הווקטורית שלו.

MongoDB אטלס היא חבילה משולבת של שירותי נתונים המאיצים ומפשטים את הפיתוח של יישומים מונעי נתונים. מאגר הנתונים הווקטוריים שלו משתלב בצורה חלקה עם אחסון נתונים תפעולי, ומבטל את הצורך במסד נתונים נפרד. אינטגרציה זו מאפשרת יכולות חיפוש סמנטי רב עוצמה באמצעות חיפוש וקטור, דרך מהירה לבנות חיפוש סמנטי ויישומים המונעים בינה מלאכותית.

אמזון SageMaker מאפשר לארגונים לבנות, לאמן ולפרוס מודלים של למידת מכונה (ML). אמזון SageMaker JumpStart מספק מודלים ונתונים מאומנים מראש כדי לעזור לך להתחיל עם ML. אתה יכול לגשת, להתאים אישית ולפרוס מודלים ונתונים מאומנים מראש דרך דף הנחיתה של SageMaker JumpStart ב סטודיו SageMaker של אמזון בכמה לחיצות בלבד.

אמזון לקס הוא ממשק שיחה שעוזר לעסקים ליצור צ'אטבוטים ובוטים קוליים שעוסקים באינטראקציות טבעיות ומציאותיות. על ידי שילוב של Amazon Lex עם AI גנרטיבי, עסקים יכולים ליצור מערכת אקולוגית הוליסטית שבה קלט המשתמש עובר בצורה חלקה לתגובות קוהרנטיות ורלוונטיות מבחינה הקשרית.

סקירת פתרונות

התרשים הבא ממחיש את ארכיטקטורת הפתרונות.

סקירת פתרונות

בסעיפים הבאים, נעבור על השלבים ליישום פתרון זה ומרכיביו.

הגדר אשכול MongoDB

כדי ליצור אשכול MongoDB Atlas בחינם, עקוב אחר ההוראות ב צור אשכול. הגדר את מסד הנתונים גישה ורשת גישה.

פרוס את מודל ההטמעה של SageMaker

אתה יכול לבחור את דגם ההטמעה (ALL MiniLM L6 v2) על SageMaker JumpStart מודלים, מחברות, פתרונות עמוד.

SageMaker JumpStart מודלים, מחברות, פתרונות

בחרו לפרוס לפרוס את המודל.

ודא שהמודל פרוס בהצלחה וודא שנקודת הקצה נוצרה.

המודל נפרס בהצלחה

הטבעה וקטורית

הטבעה וקטורית הוא תהליך של המרת טקסט או תמונה לייצוג וקטור. עם הקוד הבא, נוכל ליצור הטבעות וקטוריות עם SageMaker JumpStart ולעדכן את האוסף עם הווקטור שנוצר עבור כל מסמך:

payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name :  embeddings[0]}}
collection.update_one(query, update)

הקוד למעלה מראה כיצד לעדכן אובייקט בודד באוסף. כדי לעדכן את כל האובייקטים, עקוב אחר ה- הוראות.

מאגר נתונים וקטורים של MongoDB

MongoDB Atlas וקטור חיפוש היא תכונה חדשה המאפשרת לך לאחסן ולחפש נתונים וקטוריים ב- MongoDB. נתונים וקטוריים הם סוג של נתונים המייצגים נקודה במרחב בעל ממדים גבוהים. סוג זה של נתונים משמש לעתים קרובות ביישומי ML ובינה מלאכותית. MongoDB Atlas Vector Search משתמש בטכניקה הנקראת k-השכנים הקרובים ביותר (k-NN) כדי לחפש וקטורים דומים. k-NN פועל על ידי מציאת ה-k הוקטורים הדומים ביותר לוקטור נתון. הוקטורים הדומים ביותר הם אלו הקרובים ביותר לווקטור הנתון מבחינת המרחק האוקלידי.

אחסון נתונים וקטוריים לצד נתונים תפעוליים יכול לשפר את הביצועים על ידי הפחתת הצורך בהעברת נתונים בין מערכות אחסון שונות. זה מועיל במיוחד עבור יישומים הדורשים גישה בזמן אמת לנתונים וקטוריים.

צור אינדקס חיפוש וקטור

השלב הבא הוא ליצור אינדקס חיפוש וקטור של MongoDB בשדה הווקטור שיצרת בשלב הקודם. MongoDB משתמש ב- knnVector הקלד לאינדקס הטמעות וקטוריות. השדה הווקטור צריך להיות מיוצג כמערך של מספרים (BSON int32, int64 או סוגי נתונים כפולים בלבד).

עיין סקור את מגבלות סוג knnVector למידע נוסף על המגבלות של knnVector הקלד.

הקוד הבא הוא הגדרה לדוגמה של אינדקס:

{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}

שים לב שהמימד חייב להתאים לממד דגם ההטמעות שלך.

שאל את מאגר הנתונים הווקטוריים

אתה יכול לשאול את מאגר הנתונים הווקטוריים באמצעות ה צינור צבירה של חיפוש וקטור. הוא משתמש באינדקס חיפוש וקטור ומבצע א חיפוש סמנטי על מאגר הנתונים הווקטוריים.

הקוד הבא הוא הגדרת חיפוש לדוגמה:

{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}

פרוס את מודל השפה הגדולה של SageMaker

דגמי בסיס של SageMaker JumpStart הם מודלים של שפה גדולה (LLM) שהוכשרו מראש המשמשים לפתרון מגוון משימות עיבוד שפה טבעית (NLP), כגון סיכום טקסט, מענה לשאלות והסקת שפה טבעית. הם זמינים במגוון גדלים ותצורות. בפתרון זה, אנו משתמשים ב- פנים מחבקות דגם FLAN-T5-XL.

חפש את דגם FLAN-T5-XL ב- SageMaker JumpStart.

חפש את ה-FLAN-T5-XL

בחרו לפרוס כדי להגדיר את דגם FLAN-T5-XL.

לפרוס

ודא שהמודל נפרס בהצלחה ונקודת הקצה פעילה.

אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

צור בוט של אמזון לקס

כדי ליצור בוט של Amazon Lex, בצע את השלבים הבאים:

  1. במסוף לקסון של אמזון, בחר צור בוט.

צור בוט

  1. בעד שם הבוט, הכנס שם.
  2. בעד תפקיד זמן ריצה, בחר צור תפקיד עם הרשאות בסיסיות של אמזון לקס.
    אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  3. ציין את הגדרות השפה שלך ולאחר מכן בחר בוצע.
    אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  4. הוסף אמירה לדוגמה ב- NewIntent ממשק משתמש ובחר שמור כוונה.
    אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  5. נווט אל FallbackIntent שנוצרה עבורך כברירת מחדל והתחלף Active ב הגשמה סָעִיף.
    החלף פעיל
  6. בחרו לִבנוֹת ואחרי שהבנייה מוצלחת, בחר מִבְחָן.
    בנה ובדוק
  7. לפני הבדיקה, בחר בסמל גלגל השיניים.
    אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
  8. ציין את AWS למבדה פונקציה שתקיים אינטראקציה עם MongoDB Atlas וה-LLM כדי לספק תגובות. כדי ליצור את פונקציית lambda בצע שלבים אלה.
    9. ציין את הפונקציה AWS Lambda
  9. כעת תוכל ליצור אינטראקציה עם ה-LLM.

לנקות את

כדי לנקות את המשאבים שלך, בצע את השלבים הבאים:

  1. מחק את הבוט של Amazon Lex.
  2. מחק את פונקציית Lambda.
  3. מחק את נקודת הקצה של LLM SageMaker.
  4. מחק את נקודת הקצה של דגם ההטמעות SageMaker.
  5. מחק את אשכול MongoDB Atlas.

סיכום

בפוסט הראינו כיצד ליצור בוט פשוט המשתמש בחיפוש סמנטי של MongoDB Atlas ומשתלב עם מודל מבית SageMaker JumpStart. בוט זה מאפשר לך ליצור אבטיפוס מהיר של אינטראקציה של משתמשים עם LLMs שונים ב- SageMaker Jumpstart תוך התאמה ביניהם עם ההקשר שמקורו ב- MongoDB Atlas.

כמו תמיד, AWS מקבלת בברכה משוב. אנא השאר את המשוב והשאלות שלך בקטע ההערות.


על המחברים

אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

איגור אלכסייב הוא ארכיטקט פתרונות שותפים בכיר ב-AWS בתחום הנתונים והאנליטיקס. בתפקידו איגור עובד עם שותפים אסטרטגיים המסייעים להם לבנות ארכיטקטורות מורכבות ומותאמות ל-AWS. לפני שהצטרף ל-AWS, כאדריכל Data/Solution הוא יישם פרויקטים רבים בתחום הביג דאטה, כולל מספר אגמי נתונים באקוסיסטם של Hadoop. כמהנדס נתונים הוא היה מעורב ביישום AI/ML לאיתור הונאה ואוטומציה משרדית.


אחזור-Augmented Generation עם LangChain, Amazon SageMaker JumpStart וחיפוש סמנטי MongoDB Atlas | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.באבו סריניוואסן
הוא אדריכל פתרונות שותפים בכיר ב- MongoDB. בתפקידו הנוכחי, הוא עובד עם AWS כדי לבנות את האינטגרציות הטכניות וארכיטקטורות ההתייחסות לפתרונות AWS ו-MongoDB. יש לו יותר משני עשורים של ניסיון בטכנולוגיות מסדי נתונים וענן. הוא נלהב לספק פתרונות טכניים ללקוחות העובדים עם מספר אינטגרטורים גלובליים (GSIs) ברחבי גיאוגרפיות מרובות.

בול זמן:

עוד מ למידת מכונות AWS