פוסט זה נכתב בשיתוף עם אנתוני מדיירוס, מנהל הנדסת פתרונות וארכיטקטורה עבור בינה מלאכותית בצפון אמריקה, ובלייק סנצ'י, מנהל בינה עסקית, משניידר אלקטריק. מומחים נוספים של שניידר אלקטריק כוללים את ג'סי מילר, סומיק צ'ודהורי, שסווט בבולגאונקר, דיוויד ווטקינס, מארק קרלסון וברברה סלצ'קובסקי.
מערכות Enterprise Resource Planning (ERP) משמשות חברות לניהול מספר פונקציות עסקיות כגון הנהלת חשבונות, מכירות או ניהול הזמנות במערכת אחת. בפרט, הם משמשים באופן שוטף לאחסון מידע הקשור לחשבונות לקוחות. ארגונים שונים בתוך חברה עשויים להשתמש במערכות ERP שונות ומיזוגן הוא אתגר טכני מורכב בקנה מידה הדורש ידע ספציפי לתחום.
שניידר אלקטריק היא מובילה בטרנספורמציה דיגיטלית של ניהול אנרגיה ואוטומציה תעשייתית. כדי לשרת בצורה הטובה ביותר את צרכי הלקוחות שלהם, שניידר אלקטריק צריכה לעקוב אחר הקישורים בין חשבונות הלקוחות הקשורים במערכות ה-ERP שלהם. ככל שבסיס הלקוחות שלהם גדל, לקוחות חדשים מתווספים מדי יום, וצוותי החשבונות שלהם צריכים למיין באופן ידני את הלקוחות החדשים הללו ולקשר אותם לישות האם המתאימה.
החלטת הקישור מבוססת על המידע העדכני ביותר הזמין בפומבי באינטרנט או בתקשורת, ועשויה להיות מושפעת מרכישות אחרונות, חדשות שוק או מבנה מחדש של חטיבות. דוגמה לקישור חשבון תהיה זיהוי הקשר בין אמזון לחברה הבת שלה, Whole Foods Market [מָקוֹר].
שניידר אלקטריק פורסת מודלים של שפות גדולות על היכולות שלהם לענות על שאלות בתחומי ידע ספציפיים שונים, התאריך שבו המודל הוכשר מגביל את הידע שלו. הם התמודדו עם האתגר הזה על ידי שימוש במודל שפה גדול של Retriever-Augmented Generation קוד פתוח אמזון SageMaker JumpStart לעבד כמויות גדולות של ידע חיצוני שנמשך ולהציג קשרים ארגוניים או ציבוריים בין רשומות ERP.
בתחילת 2023, כאשר שניידר אלקטריק החליטה להפוך חלק מתהליך קישור החשבונות שלה לאוטומטי באמצעות בינה מלאכותית (AI), החברה שיתפה פעולה עם AWS Machine Learning Solutions Lab (MLSL). עם המומחיות של MLSL בייעוץ וביצוע ML, שניידר אלקטריק הצליחה לפתח ארכיטקטורת בינה מלאכותית שתפחית את המאמץ הידני בתהליכי הקישור שלהם, ותספק גישה מהירה יותר לנתונים לצוותי הניתוח במורד הזרם שלהם.
AI Generative
בינה מלאכותית ומודלים של שפה גדולה (LLMs) משנים את הדרך שבה ארגונים עסקיים מסוגלים לפתור אתגרים מורכבים באופן מסורתי הקשורים לעיבוד והבנה של שפה טבעית. חלק מהיתרונות המוצעים על ידי LLMs כוללים את היכולת להבין חלקים גדולים של טקסט ולענות על שאלות קשורות על ידי הפקת תגובות דמויות אדם. AWS מקל על לקוחות להתנסות ולהפיק עומסי עבודה של LLM על ידי הפיכת אפשרויות רבות לזמינות דרך Amazon SageMaker JumpStart, סלע אמזון, ו אמזון טיטאן.
רכישת ידע חיצוני
LLMs ידועים ביכולתם לדחוס ידע אנושי והפגינו יכולות יוצאות דופן במתן מענה לשאלות בתחומי ידע ספציפיים שונים, אך הידע שלהם מוגבל לפי התאריך שבו המודל הוכשר. אנו מטפלים בחיתוך המידע הזה על ידי צימוד ה-LLM עם API של חיפוש Google כדי לספק LLM רב עוצמה אחזור רב (RAG) המתמודד עם האתגרים של שניידר אלקטריק. ה-RAG מסוגל לעבד כמויות גדולות של ידע חיצוני שנשלף מחיפוש Google ולהציג קשרים ארגוניים או ציבוריים בין רשומות ERP.
ראה את הדוגמה הבאה:
שאלה: מיהי חברת האם של וואן מדיקל?
שאילתת גוגל: "חברת אם רפואית אחת" → מידע → LLM
תשובה: One Medical, חברת בת של אמזון...
הדוגמה הקודמת (שנלקחה ממאגר הלקוחות של שניידר אלקטריק) נוגעת לרכישה שהתרחשה בפברואר 2023 ולפיכך לא תיתפס על ידי ה-LLM לבדה עקב ניתוק ידע. הגדלת ה-LLM עם חיפוש Google מבטיחה את המידע העדכני ביותר.
דגם Flan-T5
בפרויקט הזה השתמשנו בדגם Flan-T5-XXL מה- פלאן-T5 משפחת דוגמניות.
דגמי ה-Flan-T5 מותאמים להוראות ולכן הם מסוגלים לבצע משימות NLP מסוג Zero-shot. במשימה שלנו במורד הזרם לא היה צורך להכיל כמות עצומה של ידע עולמי אלא לבצע ביצועים טובים במענה לשאלות בהתחשב בהקשר של טקסטים שסופקו באמצעות תוצאות החיפוש, ולכן, מודל 11B פרמטרים T5 פעל היטב.
JumpStart מספקת פריסה נוחה של משפחת דגמים זו דרך סטודיו SageMaker של אמזון וה-SageMaker SDK. זה כולל Flan-T5 Small, Flan-T5 Base, Flan-T5 Large, Flan-T5 XL ו-Flan-T5 XXL. יתר על כן, JumpStart מספקת כמה גרסאות של Flan-T5 XXL ברמות שונות של קוונטיזציה. פרסנו את Flan-T5-XXL לנקודת קצה לשימוש בהסקת מסקנות אמזון SageMaker Studio Jumpstart.
אחזור LLM Augmented עם LangChain
LangChain היא מסגרת פופולרית וצומחת במהירות המאפשרת פיתוח יישומים המופעלים על ידי LLMs. זה מבוסס על הרעיון של שרשראות, שהם שילובים של רכיבים שונים שנועדו לשפר את הפונקציונליות של LLMs עבור משימה נתונה. לדוגמה, זה מאפשר לנו להתאים אישית הנחיות ולשלב LLMs עם כלים שונים כמו מנועי חיפוש חיצוניים או מקורות נתונים. במקרה השימוש שלנו, השתמשנו בגוגל סרפר רכיב לחיפוש באינטרנט, ופרסו את דגם ה-Flan-T5-XXL הזמין בו אמזון SageMaker Studio Jumpstart. LangChain מבצעת את התזמור הכולל ומאפשרת להזין את דפי תוצאות החיפוש לתוך המופע של Flan-T5-XXL.
הדור המוגבר לאחזור (RAG) מורכב משני שלבים:
- אחזור של נתחי טקסט רלוונטיים ממקורות חיצוניים
- הגדלה של הנתחים עם הקשר בהנחיה שניתנה ל-LLM.
במקרה השימוש של שניידר אלקטריק, ה-RAG פועל באופן הבא:
- שם החברה הנתון משולב עם שאלה כמו "מי היא חברת האם של X", כאשר X היא החברה הנתונה) ומועבר לשאילתת גוגל באמצעות ה- Serper AI
- המידע שחולץ משולב עם השאלה המהירה והמקורית ומועבר ל-LLM לקבלת תשובה.
התרשים הבא ממחיש תהליך זה.
השתמש בקוד הבא כדי ליצור נקודת קצה:
כלי חיפוש מיידי:
בקוד הבא, אנו משלבים יחד את רכיבי האחזור וההגדלה:
ההנדסה המהירה
השילוב של ההקשר והשאלה נקרא הנחיה. שמנו לב שההנחיה הגורפת שבה השתמשנו (וריאציות סביב בקשת חברת האם) תפקדה היטב עבור רוב המגזרים הציבוריים (דומיינים), אך לא הכללה היטב את החינוך או שירותי הבריאות מכיוון שהרעיון של חברת האם אינו משמעותי שם. עבור חינוך, השתמשנו ב-"X" ואילו עבור שירותי בריאות השתמשנו ב-"Y".
כדי לאפשר את בחירת הנחיה הספציפית הזו לתחום, היינו צריכים גם לזהות את הדומיין אליו שייך חשבון נתון. לשם כך, השתמשנו גם ב-RAG שבו שאלה מרובה בחירה "מהו הדומיין של {account}?" כצעד ראשון, ובהתבסס על התשובה שאלנו את ההורה של החשבון באמצעות ההנחיה הרלוונטית כשלב שני. ראה את הקוד הבא:
ההנחיות הספציפיות למגזר העלו את הביצועים הכוללים מ-55% ל-71% מהדיוק. בסך הכל, המאמץ והזמן שהושקעו כדי לפתח יעיל הנחיות נראה כמשפר משמעותית את איכות תגובת ה-LLM.
RAG עם נתונים טבלאיים (SEC-10k)
ההגשות של SEC 10K הן מקור מידע אמין נוסף עבור חברות בנות וחטיבות משנה המוגשות מדי שנה על ידי חברות ציבוריות. הגשות אלה זמינות ישירות ב-SEC EDGAR או דרך CorpWatch ה-API.
אנו מניחים שהמידע ניתן בפורמט טבלה. להלן פסאודו csv מערך נתונים המחקה את הפורמט המקורי של מערך הנתונים SEC-10K. אפשר למזג מרובים csv מקורות נתונים לתוך מסגרת נתונים משולבת של פנדות:
# A pseudo dataset similar by schema to the CorpWatch API dataset
df.head()
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/schneider-electric-leverages-retrieval-augmented-llms-on-sagemaker-to-ensure-real-time-updates-in-their-erp-systems/
- :יש ל
- :הוא
- :לֹא
- :איפה
- $ למעלה
- 1
- 10
- 100
- 10K
- 11
- שנים 15
- 15%
- 160
- 17
- 2023
- 7
- 710
- a
- יכולת
- יכול
- אודות
- מֵעַל
- הפשטה
- להאיץ
- גישה
- להתאים
- חֶשְׁבּוֹן
- חשבונאות
- חשבונות
- דיוק
- מדויק
- רכישה
- רכישות
- לרוחב
- פעולה
- הוסיף
- תוספת
- נוסף
- כתובת
- ממוען
- כתובות
- יתרונות
- מושפע
- סוֹכֵן
- AI
- AI / ML
- מאפשר
- מאפשר
- לבד
- גם
- אמזון בעברית
- למידת מכונת אמזון
- אמזון SageMaker
- אמזון SageMaker JumpStart
- אמזון שירותי אינטרנט
- אמריקה
- בין
- כמות
- כמויות
- an
- ניתוח
- ו
- מדי שנה
- אחר
- לענות
- אנתוני
- API
- לְהוֹפִיעַ
- יישומים
- יישומית
- מריחה
- ארכיטקטורה
- ARE
- סביב
- מלאכותי
- בינה מלאכותית
- בינה מלאכותית (AI)
- AS
- לשאול
- לשאול
- לְהַנִיחַ
- At
- לְהַגדִיל
- מוגבר
- אוטומטי
- אוטומציה
- זמין
- זמין ישירות
- AWS
- למידת מכונות AWS
- בנקאות
- בסיס
- מבוסס
- BE
- היה
- לפני
- שייך
- להלן
- הטבות
- הטוב ביותר
- בֵּין
- אבני
- שיפרה
- מביא
- לִבנוֹת
- בִּניָן
- עסקים
- פונקציות עסקיות
- מודיעין עסקי
- אבל
- by
- נקרא
- CAN
- יכולות
- מסוגל
- קרלסון
- נתפס
- שרשרת
- לאתגר
- האתגרים
- בחירה
- עִיר
- לסווג
- CNBC
- קוד
- טור
- שילוב
- שילובים
- משולב
- חברות
- חברה
- מורכב
- רְכִיב
- רכיבים
- לִהַבִין
- מושג
- דאגות
- מורכב
- ייעוץ
- צרכן
- הקשר
- נוֹחַ
- משותף
- לִיצוֹר
- צור ערך
- לקוח
- לקוחות
- יומי
- נתונים
- גישה למידע
- נתונים מונחים
- מסד נתונים
- מערכי נתונים
- תַאֲרִיך
- דוד
- החליט
- החלטה
- למסור
- אספקה
- מופגן
- פרס
- פריסה
- פריסה
- עיצוב
- מעוצב
- פרט
- מְפוֹרָט
- לפתח
- מתפתח
- צעצועי התפתחות
- אחר
- דיגיטלי
- טרנספורמציה דיגיטלית
- ישירות
- do
- מסמך
- תחום
- תחומים
- ראוי
- מוקדם
- קל
- חינוך
- מאמץ
- חשמלי
- לאפשר
- נקודת קצה
- אנרגיה
- הנדסה
- מנועים
- לְהַבטִיחַ
- הזנת
- חברות
- ישות
- ה-ERP
- דוגמה
- הוצאת להורג
- תערוכה
- ניסיון
- לְנַסוֹת
- מומחיות
- מומחים
- להאריך
- חיצוני
- אקסון מובייל
- משפחה
- מהר
- מהר יותר
- פבואר
- הפד
- מעטים
- הוגש
- תלונות
- סופי
- ראשון
- להתמקד
- מרוכז
- הבא
- כדלקמן
- מזונות
- בעד
- פוּרמָט
- מסגרת
- החל מ-
- פונקציונלי
- פונקציות
- נוסף
- יתר על כן
- גז
- דור
- גנרטטיבית
- AI Generative
- נתן
- גלוֹבָּלִי
- חיפוש Google
- גרפים
- גדל
- גדל
- ערבויות
- היה
- קרה
- יש
- he
- בריאות
- עוזר
- לה
- גבוה יותר
- שֶׁלוֹ
- איך
- HTML
- http
- HTTPS
- בן אנוש
- i
- הזדהות
- לזהות
- מדגים
- לשפר
- שיפור
- in
- לכלול
- כולל
- מַדגֵרָה
- התעשייה
- תעשייה
- מידע
- בתחילה
- יוזמות
- קלט
- תובנות
- למשל
- לשלב
- מוֹדִיעִין
- אינטראקציה
- אינטרסים
- אינטרנט
- אל תוך
- מוּשׁקָע
- IT
- שֶׁלָה
- יהושע
- jpg
- שמור
- מפתח
- לדעת
- ידע
- ידוע
- מעבדה
- שפה
- גָדוֹל
- שכבה
- מנהיג
- מוביל
- למידה
- רמות
- מנופים
- לִגבּוֹת
- כמו
- מוגבל
- מגביל
- קשר
- מְקַשֵׁר
- קישורים
- LLM
- מכונה
- למידת מכונה
- לתחזק
- עושה
- עשייה
- לנהל
- ניהול
- מנהל
- מדריך ל
- באופן ידני
- רב
- סימן
- שוק
- חדשות שוק
- משמעותי
- מדיה
- רפואי
- נתונים רפואיים
- למזג
- מיזוג
- שיטות
- יכול
- טוחן
- ML
- מודל
- מודלים
- יותר
- רוב
- מספר
- שם
- שמות
- טבעי
- עיבוד שפה טבעית
- צורך
- צרכי
- חדש
- ניו יורק
- ניו יורק
- חדשות
- NLP
- לא
- צפון
- צפון אמריקה
- רעיון
- עַכשָׁיו
- תצפית
- of
- מוצע
- שמן
- נפט וגז
- on
- ONE
- אחד רפואי
- לפתוח
- קוד פתוח
- אפשרויות
- or
- תזמור
- להזמין
- ארגון
- אִרְגוּנִי
- ארגונים
- מְקוֹרִי
- אחר
- שלנו
- הַחוּצָה
- תפוקה
- מקיף
- שֶׁלוֹ
- דפים
- דובי פנדה
- פרמטרים
- חברת אם
- חלק
- מסוים
- שותף
- עבר
- לוהט
- נתיב
- לְבַצֵעַ
- ביצועים
- ביצעתי
- ביצוע
- מבצע
- פארמה
- דוקטורט
- צינור
- תכנון
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- פופולרי
- אפשרי
- הודעה
- מופעל
- חזק
- קוֹדֶם
- מנהל
- בעיות
- ההכנסות
- תהליך
- תהליך
- הפקת
- פּרוֹיֶקט
- תָקִין
- ובלבד
- מספק
- ציבורי
- בפומבי
- איכות
- שאלה
- שאלות
- במקום
- זמן אמת
- לאחרונה
- רשום
- להפחית
- קָשׁוּר
- קשר
- מערכות יחסים
- רלוונטי
- אָמִין
- ראוי לציון
- דורש
- מחקר
- חוקר
- משאב
- תגובה
- תגובות
- תוצאה
- תוצאות
- לַחֲזוֹר
- חָסוֹן
- באופן שגרתי
- שׁוּרָה
- הפעלה
- בעל חכמים
- מכירות
- סולם
- שניידר אלקטריק
- מדע
- מַדְעָן
- Sdk
- חיפוש
- מנועי חיפוש
- ה-SEC
- שְׁנִיָה
- מגזר
- מגזרים
- לבטח
- לִרְאוֹת
- מבחר
- לחצני מצוקה לפנסיונרים
- לשרת
- שירותים
- כמה
- היא
- באופן משמעותי
- דומה
- since
- קטן
- פִּתָרוֹן
- פתרונות
- לפתור
- כמה
- מָקוֹר
- מקורות
- מתמחה
- ספציפי
- לְסוֹבֵב
- הסתובב
- מדינה-of-the-art
- סטטיסטי
- שלב
- צעדים
- חנות
- מבנים
- סטודיו
- חלוקות משנה
- חברת בת
- כזה
- מסייע
- מערכת
- מערכות
- משימות
- המשימות
- משימות
- נבחרת
- צוותי
- טכני
- טֶקסט
- מֵאֲשֶׁר
- זֶה
- השמיים
- המידע
- שֶׁלָהֶם
- אותם
- תיאורטי
- שם.
- לכן
- אלה
- הֵם
- זֶה
- מחשבה
- דרך
- כָּך
- זמן
- ל
- יַחַד
- כלי
- כלים
- חלק עליון
- לעקוב
- נסחר
- באופן מסורתי
- מְאוּמָן
- טרנספורמציה
- הפיכה
- אמין
- פִּרפּוּר
- שתיים
- לגלות
- הבנה
- לפתוח
- עדכן
- עדכונים
- us
- להשתמש
- מְשׁוּמָשׁ
- באמצעות
- ערך
- שונים
- Vast
- גירסאות
- אנכיות
- באמצעות
- היה
- דֶרֶך..
- דרכים
- we
- עושר
- אינטרנט
- שירותי אינטרנט
- טוֹב
- מה
- מה
- מתי
- אשר
- בזמן
- מי
- כל
- יצטרך
- עם
- בתוך
- זרימת עבודה
- זרימות עבודה
- עובד
- עוֹלָם
- היה
- X
- שנים
- york
- אתה
- זפירנט