גוגל מלמדת רובוטים לשרת בני אדם - עם דגמי שפות גדולים, מפתח PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

גוגל מלמדת רובוטים לשרת בני אדם - עם דגמי שפות גדולים המפתח

וִידֵאוֹ המודל הגדול ביותר של שפת הבינה המלאכותית של גוגל עוזר לרובוטים להיות גמישים יותר בהבנה ובפירוש פקודות אנושיות, על פי המחקר האחרון של ענקית האינטרנט.

מכונות בדרך כלל מגיבות בצורה הטובה ביותר לדרישות מאוד ספציפיות - בקשות פתוחות יכולות לפעמים לבטל אותן ולהוביל לתוצאות שהמשתמשים לא חשבו עליהן. אנשים לומדים לקיים אינטראקציה עם רובוטים בצורה נוקשה, כמו לשאול שאלות בצורה מסוימת כדי לקבל את התגובה הרצויה.

עם זאת, המערכת האחרונה של גוגל, המכונה PaLM-SayCan, מבטיחה להיות חכמה יותר. למכשיר הפיזי מבית Everyday Robots - סטארט-אפ שנעשה מתוך גוגל X - יש בראשו מצלמות לעיניים וזרוע עם מלקחת תחובה מאחורי גופו הישר הארוך, היושב על גבי סט גלגלים.  

אתה יכול לראות את הרובוט בפעולה בסרטון למטה:

וידאו Youtube

שואל את הרובוט, משהו כמו "הרגע התאמנתי, אתה יכול להביא לי חטיף בריא?" ידחוף אותו להביא תפוח. "PaLM-SayCan [היא] גישה ניתנת לפירוש וכללי למינוף ידע ממודלים של שפות המאפשרת לרובוט לעקוב אחר הוראות טקסטואליות ברמה גבוהה כדי לבצע משימות מבוססות פיזית", מדענים חוקרים מצוות המוח של גוגל מוסבר.

גוגל הציגה את מודל השפה הגדול ביותר שלה כַּף הַיָד באפריל השנה. PaLM הוכשרה על נתונים שנגרדו מהאינטרנט, אך במקום להפיל תגובות טקסט פתוחות, המערכת הותאמה ליצור רשימה של הוראות שהרובוט יבצע.

האמירה "שפכתי את הקולה שלי על השולחן, איך תזרוק אותו ותביא לי משהו שיעזור לנקות?", מנחה את PALM להבין את השאלה ולהפיק רשימה של שלבים שהרובוט יכול לבצע כדי להשלים את המשימה, כמו לעבור על המשימה. להרים את הפחית, לזרוק אותה לפח, ולקבל ספוג.

מודלים גדולים של שפה (LLMs) כמו PaLM, לעומת זאת, לא מבינים את המשמעות של שום דבר שהם אומרים. מסיבה זו, החוקרים הכשירו מודל נפרד באמצעות למידת חיזוק כדי לבסס שפה מופשטת לייצוגים ופעולות ויזואליות. כך הרובוט לומד לקשר את המילה "קולה" לתמונה של פחית משקה תוסס.

PaLM-SayCan לומדת גם את מה שנקרא "פונקציות כלכליות" - שיטה המדרגת את האפשרות להשלים פעולה ספציפית בהינתן אובייקטים בסביבתה. סביר יותר שהרובוט יקלוט ספוג מאשר שואב אבק, למשל, אם הוא מזהה ספוג אך אין שואב בקרבתו. 

"השיטה שלנו, SayCan, מחלצת וממנפת את הידע בתוך LLMs במשימות מבוססות פיזית", הסביר הצוות ב- עבודת מחקר. "ה-LLM (Say) מספק בסיס למשימה לקביעת פעולות שימושיות עבור מטרה ברמה גבוהה ופונקציות הרשות הנלמדות (Can) מספקות ביסוס עולמי כדי לקבוע מה אפשרי לבצע על פי התוכנית. אנו משתמשים בלימוד חיזוק (RL) כדרך ללמוד פונקציות ערכיות מותנות בשפה המספקות יתרונות למה שאפשר בעולם."

כדי למנוע מהרובוט לסטות מהמשימה, הוא מאומן לבחור פעולות מתוך 101 הוראות שונות בלבד. גוגל הכשירה אותה להסתגל למטבח - PaLM-SayCan יכולה לקבל חטיפים, משקאות ולבצע משימות ניקוי פשוטות. החוקרים מאמינים ש-LLMs הם הצעד הראשון לגרום לרובוטים לבצע משימות מורכבות יותר בבטחה עם הוראות מופשטות.

"הניסויים שלנו במספר משימות רובוטיות בעולם האמיתי מדגימים את היכולת לתכנן ולהשלים הוראות שפה טבעיות ארוכות אופק בשיעור הצלחה גבוה. אנו מאמינים שהפרשנות של PaLM-SayCan מאפשרת אינטראקציה בטוחה של משתמשים בעולם האמיתי עם רובוטים", הם סיכמו. ®

בול זמן:

עוד מ הקופה