מדברים עם רובוטים בזמן אמת

מדברים עם רובוטים בזמן אמת

מדבר עם רובוטים בזמן אמת PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

חזון מפואר בלימוד רובוטים, חוזר אל ה ניסויי SHRDLU בסוף שנות ה-1960, הוא של רובוטים מועילים המאכלסים מרחבים אנושיים ועוקבים אחר מגוון רחב של פקודות שפה טבעית. במהלך השנים האחרונות, חלה התקדמות משמעותית ביישום למידת מכונה (ML) עבור ההוראה הבאה, שניהם in הדמיה ובמערכות בעולם האמיתי. לאחרונה Palm-SayCan העבודה ייצרה רובוטים הממנפים מודלים של שפה כדי לתכנן התנהגויות ארוכות אופק ולחשוב על מטרות מופשטות. קוד כמדיניות הראתה שמודלים של שפות יוצרי קוד בשילוב עם מערכות תפיסה מאומנות מראש יכולים לייצר מדיניות מותנית בשפה למניפולציה של רובוט אפס. למרות התקדמות זו, תכונה חסרה חשובה של מערכות הלמידה הרובוטיות הנוכחיות "שפה נכנסת, פועלת החוצה". בזמן אמת אינטראקציה עם בני אדם.

באופן אידיאלי, רובוטים של העתיד יגיבו בזמן אמת לכל משימה רלוונטית שמשתמש יוכל לתאר בשפה טבעית. במיוחד בסביבות אנושיות פתוחות, ייתכן שחשוב למשתמשי הקצה להתאים אישית את התנהגות הרובוט בזמן שהיא מתרחשת, להציע תיקונים מהירים ("עצור, הזיז את הזרוע שלך קצת למעלה") או לציין אילוצים ("דחף את זה". לאט לימין"). יתר על כן, שפה בזמן אמת יכולה להקל על אנשים ורובוטים לשתף פעולה במשימות מורכבות ארוכות אופק, כאשר אנשים מנחים באופן איטרטיבי ואינטראקטיבי את מניפולציות הרובוטים עם משוב שפה מדי פעם.

מדבר עם רובוטים בזמן אמת PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
האתגרים של שפה פתוחה אוצר מילים בעקבות. כדי להיות מונחה בהצלחה במשימה של אופק ארוך כמו "שים את כל הבלוקים בקו אנכי", רובוט חייב להגיב במדויק למגוון רחב של פקודות, כולל התנהגויות מתקנות קטנות כמו "לדחוף את העיגול האדום קצת ימינה".

עם זאת, לגרום לרובוטים לעקוב אוצר מילים פתוח השפה מציבה אתגר משמעותי מנקודת מבט של ML. זוהי הגדרה עם מספר גדול מטבעו של משימות, כולל הרבה התנהגויות מתקנות קטנות. קיים ריבוי משימות למידה הגדרות עושות שימוש באוצרות לימוד חיקוי מערכי נתונים או למידה מורכבת (RL) מתגמלים פונקציות כדי להניע את הלמידה של כל משימה, וקשה להרחיב את המאמץ המשמעותי הזה לכל משימה מעבר לקבוצה קטנה שהוגדרה מראש. לפיכך, שאלה פתוחה קריטית בהגדרת אוצר המילים הפתוח היא: כיצד נוכל להגדיל את אוסף נתוני הרובוט כך שיכלול לא עשרות, אלא מאות אלפי התנהגויות בסביבה, וכיצד נוכל לחבר את כל ההתנהגויות הללו לשפה הטבעית משתמש קצה עשוי לספק?

In שפה אינטראקטיבית, אנו מציגים קנה מידה גדול מסגרת למידה חיקוי להפקת רובוטים הניתנים לשפה בזמן אמת, אוצר מילים פתוח. לאחר אימון בגישה שלנו, אנו מגלים כי an מדיניות פרט מסוגלת של פנייה מעל 87,000 הוראות ייחודיות (גדול בסדר גודל מעבודות קודמות), עם אומדן שיעור הצלחה ממוצע של 93.5%. אנחנו גם נרגשים להכריז על שחרורו של שפה-טבלה, מערך הנתונים הגדול ביותר של רובוטים עם הערות בשפה, שאנו מקווים שיניע מחקר נוסף המתמקד ברובוטים הניתנים לשליטה בשפה בזמן אמת.

רובוטים מדריכים עם שפה בזמן אמת.

רובוטים הניתנים לשליטה בשפה בזמן אמת

המפתח לגישה שלנו הוא מתכון שניתן להרחבה ליצירת מערכי נתונים להדגמה של רובוטים גדולים ומגוונים עם תנאי שפה. בניגוד להגדרות קודמות שמגדירות את כל המיומנויות מלפנים ואז אוספות הדגמות שנאספו עבור כל מיומנות, אנו אוספים נתונים ברציפות על פני רובוטים מרובים ללא איפוסי סצנה או פילוח מיומנות ברמה נמוכה. כל הנתונים, כולל נתוני כשל (למשל, הוצאת בלוקים משולחן), עוברים דרך א בדיעבד תיוג שפה מחדש תהליך שיתואם לטקסט. כאן, כותבים צופים בסרטוני רובוט ארוכים כדי לזהות כמה שיותר התנהגויות, מסמנים מתי כל אחד מהם התחיל ונגמר, ומשתמשים בשפה טבעית חופשית כדי לתאר כל קטע. חשוב לציין, בניגוד להוראה קודמת לאחר הגדרות, כל המיומנויות המשמשות לאימון מופיעות מלמטה למעלה מהנתונים עצמם ולא נקבעות מראש על ידי החוקרים.

גישת הלמידה והארכיטקטורה שלנו פשוטות בכוונה. מדיניות הרובוטים שלנו היא תשומת לב צולבת שנאי, מיפוי וידאו וטקסט של 5 הרץ לפעולות רובוט 5 הרץ, תוך שימוש בלמידה מפוקחת סטנדרטית שיבוט התנהגותי אובייקטיבי ללא הפסדי עזר. בזמן הבדיקה, ניתן לשלוח פקודות מדוברות חדשות למדיניות (באמצעות דיבור-לטקסט) בכל זמן עד 5 הרץ.

מדבר עם רובוטים בזמן אמת PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
שפה אינטראקטיבית: מערכת למידה חיקוי לייצור רובוטים הניתנים לשליטה בשפה בזמן אמת.

מהדורת קוד פתוח: ערכת נתונים של טבלת שפה ובנצ'מרק

תהליך ההערה הזה אפשר לנו לאסוף את מערך הנתונים של Language-Table, המכיל למעלה מ-440 הדגמות אמיתיות ו-180 מדומה של הרובוט מבצע פקודת שפה, יחד עם רצף הפעולות שהרובוט עשה במהלך ההדגמה. זהו מערך ההדגמה של רובוטים מותנה בשפה הגדול ביותר מסוגו, בסדר גודל. Language-Table מגיע עם מדד למידה חיקוי מדומה שבו אנו משתמשים לביצוע בחירת מודל, אשר ניתן להשתמש בו כדי להעריך הוראה חדשה בעקבות ארכיטקטורות או גישות.

מערך נתונים # מסלולים (ק) # ייחודי (ק) פעולות פיזיות חוות דעת זמין
הפגנות אפיזודיות
BC-Z 25
0.1
SayCan 68
0.5
תאטרון 1,097
779
תיוג שפה בדיעבד
גושים 30
n / a
LangLFP 10
n / a
לורל 6
1.7
קלווין 20
0.4
שפה-טבלה (ממשי + שבת) 623 (442+181) 206 (127+79)
אנו משווים את Language-Table למערכי נתונים קיימים של רובוטים, תוך הדגשת פרופורציות של נתוני רובוט מדומים (אדומים) או אמיתיים (כחולים), מספר המסלולים שנאספו ומספר המשימות הייחודיות לתיאור השפה.

למדו התנהגויות שפה בזמן אמת

מדבר עם רובוטים בזמן אמת PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
דוגמאות להוראות אופק קצרות שהרובוט מסוגל לבצע, שנדגמו באקראי מתוך הסט המלא של למעלה מ-87,000.
הדרכה קצרת אופק הַצלָחָה
(87,000 נוספים...) ...
דחוף את המשולש הכחול לפינה השמאלית העליונה 80.0%
להפריד בין הכוכב האדום לעיגול האדום 100.0%
לדחוף את הלב הצהוב קצת ימינה 80.0%
מקם את הכוכב האדום מעל הקובייה הכחולה 90.0%
כוון את זרועך אל המשולש הכחול 100.0%
לדחוף קצת את קבוצת הבלוקים שמאלה 100.0%
ממוצע מעל 87k, CI 95% 93.5% +- 3.42%
רווח סמך של 95% (CI) על ההצלחה הממוצעת של מדיניות שפה אינטראקטיבית אינדיבידואלית מעל 87,000 הוראות ייחודיות בשפה טבעית.

אנו מוצאים כי יכולות חדשות מעניינות מתעוררות כאשר רובוטים מסוגלים לעקוב אחר שפה בזמן אמת. אנו מראים שמשתמשים יכולים להוביל רובוטים דרך רצפים מורכבים ארוכי אופק תוך שימוש בשפה טבעית בלבד כדי לפתור יעדים הדורשים מספר דקות של שליטה מדויקת ומתואמת (למשל, "ליצור פרצוף סמיילי מהבלוקים עם עיניים ירוקות" או "מקם הכל" הבלוקים בקו אנכי"). מכיוון שהרובוט מאומן לעקוב אחר שפת אוצר מילים פתוחה, אנו רואים שהוא יכול להגיב למגוון רחב של תיקונים מילוליים (למשל, "לדחוף את הכוכב האדום מעט ימינה") שאחרת עלול להיות קשה למנות אותם מלפנים.

מדבר עם רובוטים בזמן אמת PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
דוגמאות למטרות אופק ארוך שהושגו בהדרכת שפה אנושית בזמן אמת.

לבסוף, אנו רואים ששפה בזמן אמת מאפשרת מצבים חדשים של איסוף נתונים רובוטים. לדוגמה, מפעיל אנושי יחיד יכול לשלוט על ארבעה רובוטים בו-זמנית תוך שימוש בשפה מדוברת בלבד. יש לזה פוטנציאל להגדיל את אוסף נתוני הרובוטים בעתיד מבלי לדרוש תשומת לב אנושית בלתי מחולקת לכל רובוט.

מדבר עם רובוטים בזמן אמת PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.
מפעיל אחד השולט במספר רובוטים בו זמנית עם שפה מדוברת.

סיכום

למרות שכרגע מוגבל למשטח שולחן עם קבוצה קבועה של אובייקטים, Interactive Language מראה עדויות ראשוניות לכך שלמידת חיקוי בקנה מידה גדול אכן יכולה לייצר רובוטים הניתנים לאינטראקציה בזמן אמת שעוקבים אחר פקודות משתמש קצה בצורה חופשית. אנחנו קוד פתוח שפה-טבלה, מערך הדגמת רובוטים בעולם האמיתי הגדול ביותר מסוגו ומדד מדומה משויך, כדי לדרבן התקדמות בשליטה בשפה בזמן אמת של רובוטים פיזיים. אנו מאמינים שהתועלת של מערך נתונים זה עשויה לא להיות מוגבלת רק לבקרת רובוט, אלא עשויה לספק נקודת התחלה מעניינת ללימוד חיזוי וידאו מותנה בשפה ובפעולה, מודלים של שפה מותנית בווידאו של רובוט, או שורה של שאלות פעילות מעניינות אחרות ההקשר הרחב יותר של ML. ראה שלנו מאמר ו GitHub לקבלת מידע נוסף.

תודות

ברצוננו להודות לכל מי שתמך במחקר זה. זה כולל מפעילי טלפון רובוטים: אלכס לוונג, ארמנדו רייס, אליו פראדו, אריק טראן, גאווין גונזלס, ג'ודקסטי ת'רלונג, ג'ואל מגפנטאי, רושל דלה קרוז, סמואל וואן, שרה נגוין, סקוט לרר, נורין רוזלס, טראן פאם, קייל גאג'דהאר, ריס מונגאל. , וניקולין אנדרוז; תמיכה בחומרת רובוט ותיאום טלאופרציה: שון סניידר, ספנסר גודריץ', קמרון ברנס, חורחה אלדקו, ג'ונתן ולה; תפעול ותשתית נתונים: מוכתר מוחמד, מיטה קומאר, ארנב בוזה, וויין גרמליץ'; ורבים שעזרו לספק תיוג שפה של מערכי הנתונים. ברצוננו גם להודות לפייר סרמנה, דבידאטה דויבדי, מייקל ריו, בריאן איכטר ווינסנט ואנהוק על העצות והתמיכה שלא יסולא בפז.

#mailpoet_form_1 .mailpoet_form { }
#mailpoet_form_1 form { margin-bottom: 0; }
#mailpoet_form_1 .mailpoet_column_with_background { padding: 0px; }
#mailpoet_form_1 .wp-block-column:first-child, #mailpoet_form_1 .mailpoet_form_column:first-child { padding: 0 20px; }
#mailpoet_form_1 .mailpoet_form_column:not(:first-child) { margin-left: 0; }
#mailpoet_form_1 h2.mailpoet-heading { margin: 0 0 12px 0; }
#mailpoet_form_1 .mailpoet_paragraph { line-height: 20px; margin-bottom: 20px; }
#mailpoet_form_1 .mailpoet_segment_label, #mailpoet_form_1 .mailpoet_text_label, #mailpoet_form_1 .mailpoet_textarea_label, #mailpoet_form_1 .mailpoet_select_label, #mailpoet_form_1 .mailpoet_radio_label, #mailpoet_form_1 .mailpoet_checkbox_label, #mailpoet_form_1 .mailpoet_list_label, #mailpoet_form_1 .mailpoet_date_label { display: block; משקל גופן: רגיל; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea, #mailpoet_form_1 .mailpoet_select, #mailpoet_form_1 .mailpoet_date_month, #mailpoet_form_1 .mailpoet_date_day, #mailpoet_date_day, #mailpoet_form_date_1; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea { width: 200px; }
#mailpoet_form_1 .mailpoet_checkbox { }
#mailpoet_form_1 .mailpoet_submit { }
#mailpoet_form_1 .mailpoet_divider { }
#mailpoet_form_1 .mailpoet_message { }
#mailpoet_form_1 .mailpoet_form_loading { width: 30px; יישור טקסט: מרכז; גובה קו: רגיל; }
#mailpoet_form_1 .mailpoet_form_loading > span { width: 5px; גובה: 5 פיקסלים; צבע רקע: #5b5b5b; }#mailpoet_form_1{border-radius: 3px;background: #27282e;color: #ffffff;text-align: left;}#mailpoet_form_1 form.mailpoet_form {padding: 0px;}#mailpoet_form_1{width: 100%;}#mailpoet_form mailpoet_message {שוליים: 1; ריפוד: 0 0px;}
#mailpoet_form_1 .mailpoet_validate_success {color: #00d084}
#mailpoet_form_1 input.parsley-success {color: #00d084}
#mailpoet_form_1 select.parsley-success {color: #00d084}
#mailpoet_form_1 textarea.parsley-success {color: #00d084}

#mailpoet_form_1 .mailpoet_validate_error {color: #cf2e2e}
#mailpoet_form_1 input.parsley-error {color: #cf2e2e}
#mailpoet_form_1 select.parsley-error {color: #cf2e2e}
#mailpoet_form_1 textarea.textarea.parsley-error {color: #cf2e2e}
#mailpoet_form_1 .parsley-errors-list {color: #cf2e2e}
#mailpoet_form_1 .parsley-required {color: #cf2e2e}
#mailpoet_form_1 .parsley-custom-error-message {color: #cf2e2e}
#mailpoet_form_1 .mailpoet_paragraph.last {margin-bottom: 0} @media (max-width: 500px) {#mailpoet_form_1 {background: #27282e;}} @media (min-width: 500px) {#mailpoet_paragraph_1 .last . last-child {margin-bottom: 0}} @media (max-width: 500px) {#mailpoet_form_1 .mailpoet_form_column:last-child .mailpoet_paragraph:last-child {margin-bottom: 0}}

לדבר עם רובוטים בזמן אמת פורסם מחדש ממקור http://ai.googleblog.com/2022/12/talking-to-robots-in-real-time.html דרך http://feeds.feedburner.com/blogspot/gJZg

שבוע מיקור המונים

<!–

->

<!–
->

בול זמן:

עוד מ יועצי בלוקצ'יין