וִידֵאוֹ המודל הגדול ביותר של שפת הבינה המלאכותית של גוגל עוזר לרובוטים להיות גמישים יותר בהבנה ובפירוש פקודות אנושיות, על פי המחקר האחרון של ענקית האינטרנט.
מכונות בדרך כלל מגיבות בצורה הטובה ביותר לדרישות מאוד ספציפיות - בקשות פתוחות יכולות לפעמים לבטל אותן ולהוביל לתוצאות שהמשתמשים לא חשבו עליהן. אנשים לומדים לקיים אינטראקציה עם רובוטים בצורה נוקשה, כמו לשאול שאלות בצורה מסוימת כדי לקבל את התגובה הרצויה.
עם זאת, המערכת האחרונה של גוגל, המכונה PaLM-SayCan, מבטיחה להיות חכמה יותר. למכשיר הפיזי מבית Everyday Robots - סטארט-אפ שנעשה מתוך גוגל X - יש בראשו מצלמות לעיניים וזרוע עם מלקחת תחובה מאחורי גופו הישר הארוך, היושב על גבי סט גלגלים.
אתה יכול לראות את הרובוט בפעולה בסרטון למטה:
שואל את הרובוט, משהו כמו "הרגע התאמנתי, אתה יכול להביא לי חטיף בריא?" ידחוף אותו להביא תפוח. "PaLM-SayCan [היא] גישה ניתנת לפירוש וכללי למינוף ידע ממודלים של שפות המאפשרת לרובוט לעקוב אחר הוראות טקסטואליות ברמה גבוהה כדי לבצע משימות מבוססות פיזית", מדענים חוקרים מצוות המוח של גוגל מוסבר.
גוגל הציגה את מודל השפה הגדול ביותר שלה כַּף הַיָד באפריל השנה. PaLM הוכשרה על נתונים שנגרדו מהאינטרנט, אך במקום להפיל תגובות טקסט פתוחות, המערכת הותאמה ליצור רשימה של הוראות שהרובוט יבצע.
האמירה "שפכתי את הקולה שלי על השולחן, איך תזרוק אותו ותביא לי משהו שיעזור לנקות?", מנחה את PALM להבין את השאלה ולהפיק רשימה של שלבים שהרובוט יכול לבצע כדי להשלים את המשימה, כמו לעבור על המשימה. להרים את הפחית, לזרוק אותה לפח, ולקבל ספוג.
מודלים גדולים של שפה (LLMs) כמו PaLM, לעומת זאת, לא מבינים את המשמעות של שום דבר שהם אומרים. מסיבה זו, החוקרים הכשירו מודל נפרד באמצעות למידת חיזוק כדי לבסס שפה מופשטת לייצוגים ופעולות ויזואליות. כך הרובוט לומד לקשר את המילה "קולה" לתמונה של פחית משקה תוסס.
PaLM-SayCan לומדת גם את מה שנקרא "פונקציות כלכליות" - שיטה המדרגת את האפשרות להשלים פעולה ספציפית בהינתן אובייקטים בסביבתה. סביר יותר שהרובוט יקלוט ספוג מאשר שואב אבק, למשל, אם הוא מזהה ספוג אך אין שואב בקרבתו.
"השיטה שלנו, SayCan, מחלצת וממנפת את הידע בתוך LLMs במשימות מבוססות פיזית", הסביר הצוות ב- עבודת מחקר. "ה-LLM (Say) מספק בסיס למשימה לקביעת פעולות שימושיות עבור מטרה ברמה גבוהה ופונקציות הרשות הנלמדות (Can) מספקות ביסוס עולמי כדי לקבוע מה אפשרי לבצע על פי התוכנית. אנו משתמשים בלימוד חיזוק (RL) כדרך ללמוד פונקציות ערכיות מותנות בשפה המספקות יתרונות למה שאפשר בעולם."
כדי למנוע מהרובוט לסטות מהמשימה, הוא מאומן לבחור פעולות מתוך 101 הוראות שונות בלבד. גוגל הכשירה אותה להסתגל למטבח - PaLM-SayCan יכולה לקבל חטיפים, משקאות ולבצע משימות ניקוי פשוטות. החוקרים מאמינים ש-LLMs הם הצעד הראשון לגרום לרובוטים לבצע משימות מורכבות יותר בבטחה עם הוראות מופשטות.
"הניסויים שלנו במספר משימות רובוטיות בעולם האמיתי מדגימים את היכולת לתכנן ולהשלים הוראות שפה טבעיות ארוכות אופק בשיעור הצלחה גבוה. אנו מאמינים שהפרשנות של PaLM-SayCan מאפשרת אינטראקציה בטוחה של משתמשים בעולם האמיתי עם רובוטים", הם סיכמו. ®
- AI
- איי אמנות
- מחולל אמנות ai
- איי רובוט
- בינה מלאכותית
- הסמכת בינה מלאכותית
- בינה מלאכותית בבנקאות
- רובוט בינה מלאכותית
- רובוטים של בינה מלאכותית
- תוכנת בינה מלאכותית
- blockchain
- blockchain conference ai
- קוינגניוס
- בינה מלאכותית של שיחה
- קריפטו כנס ai
- של דאל
- למידה עמוקה
- גוגל איי
- למידת מכונה
- אפלטון
- plato ai
- מודיעין אפלטון
- משחק אפלטון
- אפלטון נתונים
- פלטוגיימינג
- סולם ai
- תחביר
- הקופה
- זפירנט