פשט את הגישה למידע פנימי באמצעות אחזור סוכני Augmented Generation ו-LangChain

הועלה מחדש על ידי אפלטון

עוקב: 0

פוסט זה לוקח אותך דרך האתגרים הנפוצים ביותר איתם מתמודדים לקוחות בעת חיפוש מסמכים פנימיים, ונותן לך הדרכה קונקרטית כיצד ניתן להשתמש בשירותי AWS ליצירת בוט שיחה מחולל בינה מלאכותית שהופך מידע פנימי לשימושי יותר.

נתונים לא מובנים מהווים 80% מכלל הנתונים נמצא בתוך ארגונים, המורכב ממאגרים של מדריכים, קובצי PDF, שאלות נפוצות, מיילים ומסמכים אחרים שגדלים מדי יום. עסקים כיום מסתמכים על מאגרי מידע פנימי שצומחים ללא הרף, ובעיות מתעוררות כאשר כמות הנתונים הבלתי מובנים הופכת לבלתי ניתנת לניהול. לעתים קרובות, משתמשים מוצאים את עצמם קוראים ובודקים מקורות פנימיים רבים ושונים כדי למצוא את התשובות שהם צריכים.

פורומים פנימיים של שאלות ותשובות יכולים לעזור למשתמשים לקבל תשובות ספציפיות ביותר, אך גם לדרוש זמני המתנה ארוכים יותר. במקרה של שאלות נפוצות פנימיות ספציפיות לחברה, זמני המתנה ארוכים מביאים לתפוקה נמוכה יותר של העובדים. קשה להרחיב פורומים של שאלות ותשובות מכיוון שהם מסתמכים על תשובות שנכתבו באופן ידני. עם AI גנרטיבי, יש כיום שינוי פרדיגמה באופן שבו משתמשים מחפשים ומוצאים מידע. הצעד ההגיוני הבא הוא להשתמש בבינה מלאכותית גנרטיבית כדי לעבות מסמכים גדולים למידע קטן יותר בגודל ביס לצריכה קלה יותר של המשתמש. במקום להקדיש זמן רב לקריאת טקסט או לחכות לתשובות, משתמשים יכולים ליצור סיכומים בזמן אמת על סמך מספר מאגרים קיימים של מידע פנימי.

סקירת פתרונות

הפתרון מאפשר ללקוחות לאחזר תשובות מאוצרות לשאלות שנשאלו לגבי מסמכים פנימיים על ידי שימוש במודל שנאי כדי ליצור תשובות לשאלות לגבי נתונים שלא הוכשר עליהם, טכניקה הידועה כ-zero-shot prompting. על ידי אימוץ פתרון זה, לקוחות יכולים להרוויח את היתרונות הבאים:

מצא תשובות מדויקות לשאלות על סמך מקורות קיימים של מסמכים פנימיים
צמצם את הזמן שמשתמשים מבלים בחיפוש תשובות על ידי שימוש במודלים של שפה גדולה (LLMs) כדי לספק תשובות כמעט מיידיות לשאילתות מורכבות באמצעות מסמכים עם המידע המעודכן ביותר
חפש שאלות שנענה בעבר דרך לוח מחוונים מרכזי
הפחת את הלחץ הנגרם על ידי הוצאת זמן בקריאה ידנית של מידע כדי לחפש תשובות

Generation Augmented של אחזור (RAG)

Generation Augmented של אחזור (RAG) מפחית חלק מהחסרונות של שאילתות מבוססות LLM על ידי מציאת התשובות ממאגר הידע שלך ושימוש ב-LLM כדי לסכם את המסמכים לתשובות תמציתיות. אנא קרא את זה פוסט ללמוד כיצד ליישם את גישת RAG עם אמזון קנדרה. הסיכונים והמגבלות הבאים קשורים לשאילתות מבוססות LLM שגישת RAG עם Amazon Kendra מטפלת בהן:

הזיות ועקיבות - LLMS מאומנים על מערכי נתונים גדולים ומייצרים תגובות על הסתברויות. זה יכול להוביל לתשובות לא מדויקות, הידועות בשם הזיות.
ממגורות נתונים מרובות - על מנת להתייחס לנתונים ממספר מקורות בתגובה שלך, יש להגדיר מערכת אקולוגית של מחברים כדי לצבור את הנתונים. הגישה למספר מאגרים היא ידנית וגוזלת זמן.
אבטחה - אבטחה ופרטיות הם שיקולים קריטיים בעת פריסת בוטים לשיחה המופעלים על ידי RAG ו-LLMs. למרות השימוש אמזון להתבונן כדי לסנן נתונים אישיים שעשויים להיות מסופקים באמצעות שאילתות משתמשים, נותרה אפשרות של הצצה לא מכוונת של מידע אישי או רגיש, בהתאם לנתונים שנקלטו. המשמעות היא ששליטה בגישה לצ'אט בוט היא חיונית כדי למנוע גישה לא מכוונת למידע רגיש.
רלוונטיות נתונים - LLMS מאומנים על נתונים עד תאריך מסוים, מה שאומר שהמידע לרוב אינו עדכני. העלות הכרוכה במודלים של אימון על נתונים עדכניים היא גבוהה. כדי להבטיח תשובות מדויקות ועדכניות, ארגונים נושאים באחריות לעדכן ולהעשיר באופן שוטף את תוכן המסמכים המצורפים.
עלות - העלות הכרוכה בפריסת פתרון זה צריכה להיות שיקול לעסקים. עסקים צריכים להעריך בקפידה את דרישות התקציב והביצועים שלהם בעת יישום פתרון זה. הפעלת LLMs עשויה לדרוש משאבי חישוב משמעותיים, מה שעשוי להגדיל את עלויות התפעול. עלויות אלו יכולות להפוך למגבלה עבור יישומים שצריכים לפעול בקנה מידה גדול. עם זאת, אחד היתרונות של ענן AWS היא הגמישות לשלם רק עבור מה שאתה משתמש. AWS מציעה מודל תמחור פשוט, עקבי ומשולם, כך שאתה מחויב רק עבור המשאבים שאתה צורך.

שימוש באמזון SageMaker JumpStart

עבור מודלים של שפה מבוססי שנאים, ארגונים יכולים להפיק תועלת מהשימוש אמזון SageMaker JumpStart, המציעה אוסף של דגמי למידת מכונה מובנים מראש. Amazon SageMaker JumpStart מציעה מגוון רחב של מודלים בסיסיים של יצירת טקסט ותשובות לשאלות (שאלות ותשובות), שניתן לפרוס ולהשתמש בקלות. פתרון זה משלב דגם FLAN T5-XL Amazon SageMaker JumpStart, אך ישנם היבטים שונים שכדאי לזכור כאשר בחירת דגם יסוד.

שילוב אבטחה בזרימת העבודה שלנו

בהתאם לשיטות העבודה המומלצות של עמוד האבטחה של ה מסגרת אדריכלית היטב, אמזון קוגניטו משמש לאימות. ניתן לשלב את מאגרי המשתמשים של Amazon Cognito עם ספקי זהות של צד שלישי התומכים במספר מסגרות המשמשות לבקרת גישה, כולל Open Authorization (OAuth), OpenID Connect (OIDC), או Security Assertion Markup Language (SAML). זיהוי המשתמשים ופעולותיהם מאפשר לפתרון לשמור על עקיבות. הפתרון משתמש גם ב- זיהוי מידע אישי מזהה (PII) של Amazon Comprehend תכונה לזהות אוטומטית ולסתור PII. PII שהותקן כולל כתובות, מספרי תעודת זהות, כתובות דוא"ל ומידע רגיש אחר. עיצוב זה מבטיח שכל PII שסופק על ידי המשתמש דרך שאילתת הקלט יוסגר. ה-PII אינו מאוחסן, אינו בשימוש על ידי אמזון קנדרה, או מוזן ל-LLM.

הדרכה לפתרון

השלבים הבאים מתארים את זרימת העבודה של זרימת התשובות לשאלות על פני מסמכים:

משתמשים שולחים שאילתה דרך ממשק אינטרנט.
אמזון קוגניטו משמש לאימות, הבטחת גישה מאובטחת לאפליקציית האינטרנט.
חזית יישום האינטרנט מתארח ב AWS להגביר.
שער API של אמזון מארח REST API עם נקודות קצה שונות לטיפול בבקשות משתמשים המאומתות באמצעות Amazon Cognito.
עריכת PII עם אמזון להתבונן:
- עיבוד שאילתות משתמש: כאשר משתמש שולח שאילתה או קלט, הוא מועבר לראשונה דרך Amazon Comprehend. השירות מנתח את הטקסט ומזהה כל ישויות PII הקיימות בתוך השאילתה.
- חילוץ PII: Amazon Comprehend מחלץ את ישויות ה-PII שזוהו משאילתת המשתמש.
אחזור מידע רלוונטי עם אמזון קנדרה:
- Amazon Kendra משמש לניהול אינדקס מסמכים המכיל את המידע המשמש להפקת תשובות לשאילתות המשתמש.
- השמיים אחזור QA של LangChain מודול משמש לבניית שרשרת שיחה שיש בה מידע רלוונטי על שאילתות המשתמש.
אינטגרציה עם אמזון SageMaker JumpStart:
- הפונקציה AWS Lambda משתמשת בספריית LangChain ומתחברת לנקודת הקצה של Amazon SageMaker JumpStart עם שאילתה ממולאת בהקשר. נקודת הקצה של Amazon SageMaker JumpStart משמשת כממשק של ה-LLM המשמש להסקת מסקנות.
אחסון תגובות והחזרה למשתמש:
- התגובה מה-LLM מאוחסנת ב אמזון דינמו יחד עם השאילתה של המשתמש, חותמת הזמן, מזהה ייחודי ומזהים שרירותיים אחרים עבור הפריט כגון קטגוריית שאלה. אחסון השאלה והתשובה כפריטים בדידים מאפשר לפונקציית AWS Lambda ליצור מחדש בקלות את היסטוריית השיחות של משתמש בהתבסס על הזמן שבו נשאלו שאלות.
- לבסוף, התגובה נשלחת חזרה למשתמש באמצעות בקשת HTTPs דרך תגובת האינטגרציה של Amazon API Gateway REST API.

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

השלבים הבאים מתארים את פונקציות AWS Lambda ואת זרימתן בתהליך:

בדוק ותקן כל מידע PII / רגיש
LangChain QA Retrival Chain
- חפש ואחזר מידע רלוונטי
מילוי הקשר והנדסה מהירה
הסקה עם LLM
החזר תגובה ושמור אותה

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

מקרי שימוש

ישנם מקרי שימוש עסקיים רבים שבהם לקוחות יכולים להשתמש בזרימת עבודה זו. הסעיף הבא מסביר כיצד ניתן להשתמש בזרימת העבודה בתעשיות ובענפים שונים.

סיוע לעובדים

הכשרה ארגונית מתוכננת היטב יכולה לשפר את שביעות רצון העובדים ולצמצם את הזמן הנדרש להכנסת עובדים חדשים. ככל שארגונים גדלים והמורכבות גוברת, העובדים מתקשים להבין את המקורות הרבים של מסמכים פנימיים. מסמכים פנימיים בהקשר זה כוללים הנחיות החברה, מדיניות ונהלי תפעול סטנדרטיים. עבור תרחיש זה, לעובד יש שאלה כיצד להמשיך ולערוך כרטיס כניסה לבעיה פנימית. העובד יכול לגשת ולהשתמש בבוט השיחה של בינה מלאכותית (AI) כדי לשאול ולבצע את השלבים הבאים עבור כרטיס ספציפי.

מקרה שימוש ספציפי: אוטומציה של פתרון בעיות לעובדים בהתבסס על הנחיות החברה.

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

השלבים הבאים מתארים את פונקציות AWS Lambda ואת זרימתן בתהליך:

סוכן LangChain לזהות את הכוונה
שלח הודעה על סמך בקשת העובד
שנה סטטוס כרטיס

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בתרשים ארכיטקטורה זה, ניתן להטמיע סרטוני הדרכה ארגוניים אמזון תעתיק כדי לאסוף יומן של תסריטי וידאו אלה. בנוסף, ניתן להשתמש בתכני הדרכה ארגוניים המאוחסנים במקורות שונים (כלומר, Confluence, Microsoft SharePoint, Google Drive, Jira וכו') ליצירת אינדקסים דרך מחברי Amazon Kendra. קרא מאמר זה כדי ללמוד עוד על אוסף הילידים מחברים אתה יכול להשתמש באמזון קנדרה כנקודת מקור. הסורק של אמזון קנדרה מסוגל להשתמש גם בתסריטי וידאו ההדרכה הארגוניים וגם בתיעוד המאוחסן במקורות אחרים אלה כדי לסייע לבוט השיחה לענות על שאלות ספציפיות להנחיות ההדרכה של החברה. סוכן LangChain מאמת הרשאות, משנה את סטטוס הכרטיס ומודיע לאנשים הנכונים באמצעות Amazon Simple Notification Service (אמזון SNS).

צוותי תמיכת לקוחות

פתרון מהיר של שאילתות לקוחות משפר את חווית הלקוח ומעודד נאמנות למותג. בסיס לקוחות נאמן עוזר להניע מכירות, מה שתורם לשורה התחתונה ומגביר את מעורבות הלקוחות. צוותי תמיכת לקוחות משקיעים אנרגיה רבה בהפניה למסמכים פנימיים רבים ותוכנות ניהול קשרי לקוחות כדי לענות על שאילתות לקוחות לגבי מוצרים ושירותים. מסמכים פנימיים בהקשר זה יכולים לכלול סקריפטים כלליים של שיחות לתמיכת לקוחות, ספרי משחק, הנחיות הסלמה ומידע עסקי. בוט השיחה הגנרטיבי של AI עוזר באופטימיזציה של עלויות מכיוון שהוא מטפל בשאילתות מטעם צוות תמיכת הלקוחות.

מקרה שימוש ספציפי: טיפול בבקשה להחלפת שמן על סמך היסטוריית שירות ותוכנית שירות לקוחות שנרכשה.

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בתרשים ארכיטקטורה זה, הלקוח מנותב לבוט השיחה הגנרטיבי של AI או ל- אמזון Connect מרכז קשר. החלטה זו יכולה להתבסס על רמת התמיכה הדרושה או הזמינות של סוכני תמיכת לקוחות. סוכן LangChain מזהה את כוונת הלקוח ומאמת את זהותו. סוכן LangChain בודק גם את היסטוריית השירות ואת תוכנית התמיכה שנרכשה.

השלבים הבאים מתארים את פונקציות AWS Lambda ואת זרימתן בתהליך:

סוכן LangChain מזהה את הכוונה
אחזר את פרטי הלקוח
בדוק את היסטוריית שירות הלקוחות ואת פרטי האחריות
הזמינו פגישה, ספקו מידע נוסף או פנו למרכז הקשר
שלח אישור למייל

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

Amazon Connect משמש לאיסוף יומני הקול והצ'אט, ו- Amazon Comprehend משמש להסרת מידע אישי מזהה (PII) מיומנים אלה. הסורק של אמזון קנדרה מסוגל אז להשתמש ביומני הקול והצ'אט שנכתבו, סקריפטים של שיחות לקוחות ומדיניות תוכנית תמיכת שירות לקוחות כדי ליצור את האינדקס. לאחר קבלת החלטה, בוט השיחה הגנרטיבי של AI מחליט אם להזמין פגישה, לספק מידע נוסף או לנתב את הלקוח למרכז הקשר לקבלת סיוע נוסף. לצורך אופטימיזציה של עלויות, סוכן LangChain יכול גם ליצור תשובות באמצעות פחות אסימונים ומודל שפה גדול פחות יקר עבור שאילתות לקוחות בעדיפות נמוכה יותר.

שירותים פיננסיים

חברות שירותים פיננסיים מסתמכות על שימוש בזמן במידע כדי להישאר תחרותיים ולציית לתקנות פיננסיות. באמצעות בוט שיחה מחולל בינה מלאכותית, אנליסטים ויועצים פיננסיים יכולים ליצור אינטראקציה עם מידע טקסטואלי באופן שיחת ולצמצם את הזמן והמאמץ הנדרשים כדי לקבל החלטות מושכלות יותר. מלבד השקעה ומחקר שוק, בוט שיחה AI יצירתי יכול גם להגדיל את היכולות האנושיות על ידי טיפול במשימות שבאופן מסורתי דורשות יותר מאמץ וזמן אנושיים. לדוגמה, מוסד פיננסי המתמחה בהלוואות אישיות יכול להגדיל את קצב עיבוד ההלוואות תוך מתן שקיפות טובה יותר ללקוחות.

מקרה שימוש ספציפי: השתמש בהיסטוריה הפיננסית של הלקוחות ובבקשות הלוואה קודמות כדי להחליט ולהסביר את החלטת ההלוואה.

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

השלבים הבאים מתארים את פונקציות AWS Lambda ואת זרימתן בתהליך:

סוכן LangChain לזהות את הכוונה
בדוק את היסטוריית הציון הפיננסי והאשראי של הלקוחות
בדוק מערכת ניהול קשרי לקוחות פנימית
בדוק את מדיניות ההלוואה הסטנדרטית והצע החלטה לעובד המזכה את ההלוואה
שלח הודעה ללקוח

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

ארכיטקטורה זו משלבת נתונים פיננסיים של לקוחות המאוחסנים במסד נתונים ונתונים המאוחסנים בכלי לניהול קשרי לקוחות (CRM). נקודות נתונים אלו משמשות להכרעה המבוססת על מדיניות ההלוואות הפנימית של החברה. הלקוח יכול לשאול שאלות הבהרה כדי להבין לאילו הלוואות הוא זכאי ואת תנאי ההלוואות שהוא יכול לקבל. אם בוט השיחה הגנרטיבי של AI אינו מסוגל לאשר בקשת הלוואה, המשתמש עדיין יכול לשאול שאלות על שיפור ציוני אשראי או אפשרויות מימון חלופיות.

ממשלה

בוטים לשיחת AI גנרטיביים יכולים להועיל רבות למוסדות ממשלתיים על ידי זירוז תהליכי תקשורת, יעילות וקבלת החלטות. בוטים לשיחת בינה מלאכותית גנרטיבית יכולים גם לספק גישה מיידית לבסיסי ידע פנימיים כדי לעזור לעובדי ממשלה לאחזר במהירות מידע, מדיניות ונהלים (כלומר, קריטריונים לזכאות, תהליכי בקשה ושירותים ותמיכה של האזרח). פתרון אחד הוא מערכת אינטראקטיבית, המאפשרת למשלמי מס ומקצועני מס למצוא בקלות פרטים והטבות הקשורות למס. ניתן להשתמש בו כדי להבין שאלות משתמשים, לסכם מסמכי מס ולספק תשובות ברורות באמצעות שיחות אינטראקטיביות.

משתמשים יכולים לשאול שאלות כגון:

איך עובד מס ירושה ומהם ספי המס?
האם תוכל להסביר את המושג מס הכנסה?
מהן השלכות המס בעת מכירת נכס שני?

בנוסף, משתמשים יכולים לקבל את הנוחות של שליחת טופסי מס למערכת, מה שיכול לעזור לאמת את נכונות המידע שסופק.

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

ארכיטקטורה זו ממחישה כיצד משתמשים יכולים להעלות טופסי מס מלאים לפתרון ולהשתמש בו לצורך אימות אינטראקטיבי והדרכה כיצד למלא במדויק את המידע הדרוש.

בריאות

לעסקים בתחום הבריאות יש הזדמנות להפוך את השימוש בכמויות גדולות של מידע פנימי על המטופל, תוך התייחסות לשאלות נפוצות בנוגע למקרי שימוש כגון אפשרויות טיפול, תביעות ביטוח, ניסויים קליניים ומחקר פרמצבטי. שימוש בבוט שיחה מחולל בינה מלאכותית מאפשר יצירה מהירה ומדויקת של תשובות על מידע בריאותי ממאגר הידע המסופק. לדוגמה, חלק מאנשי מקצוע בתחום הבריאות מבלים זמן רב במילוי טפסים להגשת תביעות ביטוח.

במסגרות דומות, מנהלי ניסויים קליניים וחוקרים צריכים למצוא מידע על אפשרויות הטיפול. בוט לשיחות בינה מלאכותית יכול להשתמש במחברים שנבנו מראש באמזון קנדרה כדי לאחזר את המידע הרלוונטי ביותר ממיליוני המסמכים שפורסמו באמצעות מחקר מתמשך שנערך על ידי חברות תרופות ואוניברסיטאות.

מקרה שימוש ספציפי: צמצם את השגיאות והזמן הנדרש למילוי ושליחת טפסי ביטוח.

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

בתרשים ארכיטקטורה זה, איש מקצוע בתחום הבריאות יכול להשתמש בבוט השיחה היצירתי של AI כדי להבין אילו טפסים יש למלא עבור הביטוח. לאחר מכן, סוכן LangChain יכול לאחזר את הטפסים הנכונים ולהוסיף את המידע הדרוש למטופל וכן לתת תשובות לחלקים תיאוריים של הטפסים בהתבסס על פוליסות ביטוח וטפסים קודמים. איש המקצוע בתחום הבריאות יכול לערוך את התשובות שניתנו על ידי ה-LLM לפני אישור ומסירת הטופס לפורטל הביטוח.

השלבים הבאים מתארים את פונקציות AWS Lambda ואת זרימתן בתהליך:

סוכן LangChain לזהות את הכוונה
אחזר את המידע הדרוש למטופל
מלא את טופס הביטוח בהתבסס על פרטי המטופל והנחיית הטופס
שלח את הטופס לפורטל הביטוח לאחר אישור המשתמש

פשט את הגישה למידע פנימי באמצעות Retrieval Augmented Generation ו-LangChain Agents | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

AWS HealthLake משמש לאחסון מאובטח של נתוני הבריאות, כולל טפסי ביטוח קודמים ופרטי מטופל, ו- Amazon Comprehend משמש להסרת מידע אישי מזהה (PII) מטפסי הביטוח הקודמים. לאחר מכן, הסורק של אמזון קנדרה יכול להשתמש בסט טפסי הביטוח ובהנחיות כדי ליצור את האינדקס. לאחר מילוי הטופס(ים) על ידי ה-AI הגנרטיבי, ניתן לשלוח את הטופס(ים) שנבדקו על ידי איש המקצוע הרפואי לפורטל הביטוח.

הערכת מחיר

העלות של פריסת פתרון הבסיס כהוכחת מושג מוצגת בטבלה הבאה. מכיוון שהפתרון הבסיסי נחשב להוכחה של קונספט, Amazon Kendra Developer Edition שימש כאופציה בעלות נמוכה מכיוון שעומס העבודה לא יהיה בייצור. ההנחה שלנו עבור Amazon Kendra Developer Edition הייתה 730 שעות פעילות במשך החודש.

עבור Amazon SageMaker, הנחנו שהלקוח ישתמש במופע ml.g4dn.2xlarge להסקת מסקנות בזמן אמת, עם נקודת קצה אחת לכל מופע. אתה יכול למצוא מידע נוסף על תמחור אמזון SageMaker וסוגי מופעי מסקנות זמינים כאן.

שֵׁרוּת	משאבים שנצרכו	אומדן עלות לחודש בדולר ארה"ב
AWS להגביר	150 דקות בנייה 1 GB של נתונים מוגש 500,000 בקשות	15.71
שער API של אמזון	1M REST API קריאות	3.5
AWS למבדה	מיליון בקשות משך 5 שניות לכל בקשה 2 GB זיכרון שהוקצה	160.23
אמזון דינמו	1 מיליון קריאות מיליון כותבים אחסון 100 GB	26.38
אמזון Sagemaker	הסקה בזמן אמת עם ml.g4dn.2xlarge	676.8
אמזון קנדרה	מהדורת מפתחים עם 730 שעות לחודש 10,000 מסמכים נסרקו 5,000 שאילתות ליום	821.25
.	.	עלות כוללת: 1703.87

* לאמזון קוגניטו יש רמה חינמית של 50,000 משתמשים פעילים חודשיים שמשתמשים במאגרי משתמשי קוגניטו או 50 משתמשים פעילים חודשיים שמשתמשים בספקי זהות SAML 2.0

ניקוי

כדי לחסוך בעלויות, מחק את כל המשאבים שפרסת כחלק מהמדריך. אתה יכול למחוק כל נקודת קצה של SageMaker שייתכן שיצרת דרך מסוף SageMaker. זכור, מחיקת אינדקס של אמזון קנדרה אינה מסירה את המסמכים המקוריים מהאחסון שלך.

סיכום

בפוסט זה, הראינו לך כיצד לפשט את הגישה למידע פנימי על ידי סיכום ממספר מאגרים בזמן אמת. לאחר ההתפתחויות האחרונות של LLMs זמינים מסחרית, האפשרויות של AI גנרטיבי הפכו ברורות יותר. בפוסט זה, הצגנו דרכים להשתמש בשירותי AWS כדי ליצור צ'אט בוט ללא שרת המשתמש ב-AI גנרטיבי כדי לענות על שאלות. גישה זו משלבת שכבת אימות וזיהוי PII של Amazon Comprehend כדי לסנן כל מידע רגיש המסופק בשאילתה של המשתמש. בין אם מדובר ביחידים בתחום הבריאות שמבינים את הניואנסים בהגשת תביעות ביטוח או באנשי משאבי אנוש שמבינים תקנות ספציפיות ברחבי החברה, ישנם מספר תעשיות וענפים שיכולים להפיק תועלת מגישה זו. מודל היסודות של Amazon SageMaker JumpStart הוא המנוע מאחורי הצ'אטבוט, בעוד שגישת מילוי הקשר באמצעות טכניקת RAG משמשת כדי להבטיח שהתגובות מתייחסות בצורה מדויקת יותר למסמכים פנימיים.

למידע נוסף על עבודה עם AI גנרטיבי ב-AWS, עיין ב הכרזה על כלים חדשים לבנייה עם AI גנרטיבי ב-AWS. להדרכה מעמיקה יותר על שימוש בטכניקת RAG עם שירותי AWS, עיין ב בנה במהירות יישומי בינה מלאכותית בינה מלאכותית ברמת דיוק גבוהה על נתונים ארגוניים באמצעות Amazon Kendra, LangChain ומודלים של שפות גדולות. מכיוון שהגישה בבלוג זה היא אגנוסטית של LLM, ניתן להשתמש בכל LLM להסקת מסקנות. בפוסט הבא שלנו, נתאר דרכים ליישם פתרון זה באמצעות Amazon Bedrock ו- Amazon Titan LLM.

על הכותבים

Abhishek Maligehalli Shivalingaiah הוא ארכיטקט פתרונות AI בכיר ב-AWS. הוא נלהב מבניית יישומים באמצעות AI Generative, Amazon Kendra ו-NLP. יש לו כ-10 שנות ניסיון בבניית פתרונות Data & AI ליצירת ערך עבור לקוחות וארגונים. הוא אפילו בנה צ'אט בוט (אישי) בשביל הכיף שיענה על שאלות על הקריירה והמסע המקצועי שלו. מחוץ לעבודה הוא נהנה לצלם פורטרטים של בני משפחה וחברים, ואוהב ליצור יצירות אמנות.

Medha Aiyah הוא אדריכל פתרונות שותף ב-AWS, שבסיסו באוסטין, טקסס. לאחרונה היא סיימה את לימודיה באוניברסיטת טקסס בדאלאס בדצמבר 2022 עם תואר שני במדעי המחשב עם התמחות במערכות חכמות תוך התמקדות ב-AI/ML. היא מעוניינת ללמוד עוד על AI/ML ושימוש בשירותי AWS כדי לגלות פתרונות שמהם יכולים לקוחות להפיק תועלת.

הוגו טסה הוא Associate Solutions Architect ב-AWS שבסיסו בסיאטל, וושינגטון. הוא בעל תואר שני בטכנולוגיית מידע מאוניברסיטת אריזונה סטייט ותואר ראשון בכלכלה מאוניברסיטת שיקגו. הוא חבר באיגוד הביקורת והבקרה של מערכות מידע (ISACA) ובקונסורציום הבינלאומי להסמכת מערכות מידע (ISC)2. הוא נהנה לעזור ללקוחות להפיק תועלת מהטכנולוגיה.

איימן אישימווה הוא Associate Solutions Architect ב-AWS שבסיסו בסיאטל, וושינגטון. הוא בעל תואר שני בהנדסת תוכנה ו-IT מאוניברסיטת אוקלנד. יש לו ניסיון קודם בפיתוח תוכנה, במיוחד בבניית שירותי מיקרו ליישומי אינטרנט מבוזרים. הוא נלהב לעזור ללקוחות לבנות פתרונות חזקים וניתנים להרחבה בשירותי הענן של AWS בהתאם לשיטות העבודה המומלצות.

שרווין סורש הוא אדריכל פתרונות שותף ב-AWS המבוסס באוסטין, טקסס. הוא סיים תואר שני בהנדסת תוכנה עם ריכוז במחשוב ענן ווירטואליזציה ותואר ראשון בהנדסת מחשבים מאוניברסיטת סן חוזה סטייט. הוא נלהב למינוף טכנולוגיה כדי לעזור לשפר את חייהם של אנשים מכל הרקעים.