חזון מפואר בלימוד רובוטים, חוזר אל ה ניסויי SHRDLU בסוף שנות ה-1960, הוא של רובוטים מועילים המאכלסים מרחבים אנושיים ועוקבים אחר מגוון רחב של פקודות שפה טבעית. במהלך השנים האחרונות, חלה התקדמות משמעותית ביישום למידת מכונה (ML) עבור ההוראה הבאה, שניהם in הדמיה ובמערכות בעולם האמיתי. לאחרונה Palm-SayCan העבודה ייצרה רובוטים הממנפים מודלים של שפה כדי לתכנן התנהגויות ארוכות אופק ולחשוב על מטרות מופשטות. קוד כמדיניות הראתה שמודלים של שפות יוצרי קוד בשילוב עם מערכות תפיסה מאומנות מראש יכולים לייצר מדיניות מותנית בשפה למניפולציה של רובוט אפס. למרות התקדמות זו, תכונה חסרה חשובה של מערכות הלמידה הרובוטיות הנוכחיות "שפה נכנסת, פועלת החוצה". בזמן אמת אינטראקציה עם בני אדם.
באופן אידיאלי, רובוטים של העתיד יגיבו בזמן אמת לכל משימה רלוונטית שמשתמש יוכל לתאר בשפה טבעית. במיוחד בסביבות אנושיות פתוחות, ייתכן שחשוב למשתמשי הקצה להתאים אישית את התנהגות הרובוט בזמן שהיא מתרחשת, להציע תיקונים מהירים ("עצור, הזיז את הזרוע שלך קצת למעלה") או לציין אילוצים ("דחף את זה". לאט לימין"). יתר על כן, שפה בזמן אמת יכולה להקל על אנשים ורובוטים לשתף פעולה במשימות מורכבות ארוכות אופק, כאשר אנשים מנחים באופן איטרטיבי ואינטראקטיבי את מניפולציות הרובוטים עם משוב שפה מדי פעם.
עם זאת, לגרום לרובוטים לעקוב אוצר מילים פתוח השפה מציבה אתגר משמעותי מנקודת מבט של ML. זוהי הגדרה עם מספר גדול מטבעו של משימות, כולל הרבה התנהגויות מתקנות קטנות. קיים ריבוי משימות למידה הגדרות עושות שימוש באוצרות לימוד חיקוי מערכי נתונים או למידה מורכבת (RL) מתגמלים פונקציות כדי להניע את הלמידה של כל משימה, וקשה להרחיב את המאמץ המשמעותי הזה לכל משימה מעבר לקבוצה קטנה שהוגדרה מראש. לפיכך, שאלה פתוחה קריטית בהגדרת אוצר המילים הפתוח היא: כיצד נוכל להגדיל את אוסף נתוני הרובוט כך שיכלול לא עשרות, אלא מאות אלפי התנהגויות בסביבה, וכיצד נוכל לחבר את כל ההתנהגויות הללו לשפה הטבעית משתמש קצה עשוי לספק?
In שפה אינטראקטיבית, אנו מציגים קנה מידה גדול מסגרת למידה חיקוי להפקת רובוטים הניתנים לשפה בזמן אמת, אוצר מילים פתוח. לאחר אימון בגישה שלנו, אנו מגלים כי an מדיניות פרט מסוגלת של פנייה מעל 87,000 הוראות ייחודיות (גדול בסדר גודל מעבודות קודמות), עם אומדן שיעור הצלחה ממוצע של 93.5%. אנחנו גם נרגשים להכריז על שחרורו של שפה-טבלה, מערך הנתונים הגדול ביותר של רובוטים עם הערות בשפה, שאנו מקווים שיניע מחקר נוסף המתמקד ברובוטים הניתנים לשליטה בשפה בזמן אמת.
רובוטים מדריכים עם שפה בזמן אמת. |
רובוטים הניתנים לשליטה בשפה בזמן אמת
המפתח לגישה שלנו הוא מתכון שניתן להרחבה ליצירת מערכי נתונים להדגמה של רובוטים גדולים ומגוונים עם תנאי שפה. בניגוד להגדרות קודמות שמגדירות את כל המיומנויות מלפנים ואז אוספות הדגמות שנאספו עבור כל מיומנות, אנו אוספים נתונים ברציפות על פני רובוטים מרובים ללא איפוסי סצנה או פילוח מיומנות ברמה נמוכה. כל הנתונים, כולל נתוני כשל (למשל, הוצאת בלוקים משולחן), עוברים דרך א בדיעבד תיוג שפה מחדש תהליך שיתואם לטקסט. כאן, כותבים צופים בסרטוני רובוט ארוכים כדי לזהות כמה שיותר התנהגויות, מסמנים מתי כל אחד מהם התחיל ונגמר, ומשתמשים בשפה טבעית חופשית כדי לתאר כל קטע. חשוב לציין, בניגוד להוראה קודמת לאחר הגדרות, כל המיומנויות המשמשות לאימון מופיעות מלמטה למעלה מהנתונים עצמם ולא נקבעות מראש על ידי החוקרים.
גישת הלמידה והארכיטקטורה שלנו פשוטות בכוונה. מדיניות הרובוטים שלנו היא תשומת לב צולבת שנאי, מיפוי וידאו וטקסט של 5 הרץ לפעולות רובוט 5 הרץ, תוך שימוש בלמידה מפוקחת סטנדרטית שיבוט התנהגותי אובייקטיבי ללא הפסדי עזר. בזמן הבדיקה, ניתן לשלוח פקודות מדוברות חדשות למדיניות (באמצעות דיבור-לטקסט) בכל זמן עד 5 הרץ.
שפה אינטראקטיבית: מערכת למידה חיקוי לייצור רובוטים הניתנים לשליטה בשפה בזמן אמת. |
מהדורת קוד פתוח: ערכת נתונים של טבלת שפה ובנצ'מרק
תהליך ההערה הזה אפשר לנו לאסוף את מערך הנתונים של Language-Table, המכיל למעלה מ-440 הדגמות אמיתיות ו-180 מדומה של הרובוט מבצע פקודת שפה, יחד עם רצף הפעולות שהרובוט עשה במהלך ההדגמה. זהו מערך ההדגמה של רובוטים מותנה בשפה הגדול ביותר מסוגו, בסדר גודל. Language-Table מגיע עם מדד למידה חיקוי מדומה שבו אנו משתמשים לביצוע בחירת מודל, אשר ניתן להשתמש בו כדי להעריך הוראה חדשה בעקבות ארכיטקטורות או גישות.
מערך נתונים | # מסלולים (ק) | # ייחודי (ק) | פעולות פיזיות | חוות דעת | זמין |
הפגנות אפיזודיות | |||||
BC-Z | 25 |
0.1 |
✓ | ✓ | ✓ |
SayCan | 68 |
0.5 |
✓ | ✓ | ❌ |
תאטרון | 1,097 |
779 |
❌ | ❌ | ❌ |
תיוג שפה בדיעבד | |||||
גושים | 30 |
n / a | ❌ | ❌ | ✓ |
LangLFP | 10 |
n / a | ✓ | ❌ | ❌ |
לורל | 6 |
1.7 |
✓ | ✓ | ✓ |
קלווין | 20 |
0.4 |
✓ | ❌ | ✓ |
שפה-טבלה (ממשי + שבת) | 623 (442+181) | 206 (127+79) | ✓ | ✓ | ✓ |
אנו משווים את Language-Table למערכי נתונים קיימים של רובוטים, תוך הדגשת פרופורציות של נתוני רובוט מדומים (אדומים) או אמיתיים (כחולים), מספר המסלולים שנאספו ומספר המשימות הייחודיות לתיאור השפה. |
למדו התנהגויות שפה בזמן אמת
דוגמאות להוראות אופק קצרות שהרובוט מסוגל לבצע, שנדגמו באקראי מתוך הסט המלא של למעלה מ-87,000. |
הדרכה קצרת אופק | הַצלָחָה |
(87,000 נוספים...) | ... |
דחוף את המשולש הכחול לפינה השמאלית העליונה | 80.0% |
להפריד בין הכוכב האדום לעיגול האדום | 100.0% |
לדחוף את הלב הצהוב קצת ימינה | 80.0% |
מקם את הכוכב האדום מעל הקובייה הכחולה | 90.0% |
כוון את זרועך אל המשולש הכחול | 100.0% |
לדחוף קצת את קבוצת הבלוקים שמאלה | 100.0% |
ממוצע מעל 87k, CI 95% | 93.5% +- 3.42% |
רווח סמך של 95% (CI) על ההצלחה הממוצעת של מדיניות שפה אינטראקטיבית אינדיבידואלית מעל 87,000 הוראות ייחודיות בשפה טבעית. |
אנו מוצאים כי יכולות חדשות מעניינות מתעוררות כאשר רובוטים מסוגלים לעקוב אחר שפה בזמן אמת. אנו מראים שמשתמשים יכולים להוביל רובוטים דרך רצפים מורכבים ארוכי אופק תוך שימוש בשפה טבעית בלבד כדי לפתור יעדים הדורשים מספר דקות של שליטה מדויקת ומתואמת (למשל, "ליצור פרצוף סמיילי מהבלוקים עם עיניים ירוקות" או "מקם הכל" הבלוקים בקו אנכי"). מכיוון שהרובוט מאומן לעקוב אחר שפת אוצר מילים פתוחה, אנו רואים שהוא יכול להגיב למגוון רחב של תיקונים מילוליים (למשל, "לדחוף את הכוכב האדום מעט ימינה") שאחרת עלול להיות קשה למנות אותם מלפנים.
דוגמאות למטרות אופק ארוך שהושגו בהדרכת שפה אנושית בזמן אמת. |
לבסוף, אנו רואים ששפה בזמן אמת מאפשרת מצבים חדשים של איסוף נתונים רובוטים. לדוגמה, מפעיל אנושי יחיד יכול לשלוט על ארבעה רובוטים בו-זמנית תוך שימוש בשפה מדוברת בלבד. יש לזה פוטנציאל להגדיל את אוסף נתוני הרובוטים בעתיד מבלי לדרוש תשומת לב אנושית בלתי מחולקת לכל רובוט.
מפעיל אחד השולט במספר רובוטים בו זמנית עם שפה מדוברת. |
סיכום
למרות שכרגע מוגבל למשטח שולחן עם קבוצה קבועה של אובייקטים, Interactive Language מראה עדויות ראשוניות לכך שלמידת חיקוי בקנה מידה גדול אכן יכולה לייצר רובוטים הניתנים לאינטראקציה בזמן אמת שעוקבים אחר פקודות משתמש קצה בצורה חופשית. אנחנו קוד פתוח שפה-טבלה, מערך הדגמת רובוטים בעולם האמיתי הגדול ביותר מסוגו ומדד מדומה משויך, כדי לדרבן התקדמות בשליטה בשפה בזמן אמת של רובוטים פיזיים. אנו מאמינים שהתועלת של מערך נתונים זה עשויה לא להיות מוגבלת רק לבקרת רובוט, אלא עשויה לספק נקודת התחלה מעניינת ללימוד חיזוי וידאו מותנה בשפה ובפעולה, מודלים של שפה מותנית בווידאו של רובוט, או שורה של שאלות פעילות מעניינות אחרות ההקשר הרחב יותר של ML. ראה שלנו מאמר ו GitHub לקבלת מידע נוסף.
תודות
ברצוננו להודות לכל מי שתמך במחקר זה. זה כולל מפעילי טלפון רובוטים: אלכס לוונג, ארמנדו רייס, אליו פראדו, אריק טראן, גאווין גונזלס, ג'ודקסטי ת'רלונג, ג'ואל מגפנטאי, רושל דלה קרוז, סמואל וואן, שרה נגוין, סקוט לרר, נורין רוזלס, טראן פאם, קייל גאג'דהאר, ריס מונגאל. , וניקולין אנדרוז; תמיכה בחומרת רובוט ותיאום טלאופרציה: שון סניידר, ספנסר גודריץ', קמרון ברנס, חורחה אלדקו, ג'ונתן ולה; תפעול ותשתית נתונים: מוכתר מוחמד, מיטה קומאר, ארנב בוזה, וויין גרמליץ'; ורבים שעזרו לספק תיוג שפה של מערכי הנתונים. ברצוננו גם להודות לפייר סרמנה, דבידאטה דויבדי, מייקל ריו, בריאן איכטר ווינסנט ואנהוק על העצות והתמיכה שלא יסולא בפז.
#mailpoet_form_1 .mailpoet_form { }
#mailpoet_form_1 form { margin-bottom: 0; }
#mailpoet_form_1 .mailpoet_column_with_background { padding: 0px; }
#mailpoet_form_1 .wp-block-column:first-child, #mailpoet_form_1 .mailpoet_form_column:first-child { padding: 0 20px; }
#mailpoet_form_1 .mailpoet_form_column:not(:first-child) { margin-left: 0; }
#mailpoet_form_1 h2.mailpoet-heading { margin: 0 0 12px 0; }
#mailpoet_form_1 .mailpoet_paragraph { line-height: 20px; margin-bottom: 20px; }
#mailpoet_form_1 .mailpoet_segment_label, #mailpoet_form_1 .mailpoet_text_label, #mailpoet_form_1 .mailpoet_textarea_label, #mailpoet_form_1 .mailpoet_select_label, #mailpoet_form_1 .mailpoet_radio_label, #mailpoet_form_1 .mailpoet_checkbox_label, #mailpoet_form_1 .mailpoet_list_label, #mailpoet_form_1 .mailpoet_date_label { display: block; משקל גופן: רגיל; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea, #mailpoet_form_1 .mailpoet_select, #mailpoet_form_1 .mailpoet_date_month, #mailpoet_form_1 .mailpoet_date_day, #mailpoet_date_day, #mailpoet_form_date_1; }
#mailpoet_form_1 .mailpoet_text, #mailpoet_form_1 .mailpoet_textarea { width: 200px; }
#mailpoet_form_1 .mailpoet_checkbox { }
#mailpoet_form_1 .mailpoet_submit { }
#mailpoet_form_1 .mailpoet_divider { }
#mailpoet_form_1 .mailpoet_message { }
#mailpoet_form_1 .mailpoet_form_loading { width: 30px; יישור טקסט: מרכז; גובה קו: רגיל; }
#mailpoet_form_1 .mailpoet_form_loading > span { width: 5px; גובה: 5 פיקסלים; צבע רקע: #5b5b5b; }#mailpoet_form_1{border-radius: 3px;background: #27282e;color: #ffffff;text-align: left;}#mailpoet_form_1 form.mailpoet_form {padding: 0px;}#mailpoet_form_1{width: 100%;}#mailpoet_form mailpoet_message {שוליים: 1; ריפוד: 0 0px;}
#mailpoet_form_1 .mailpoet_validate_success {color: #00d084}
#mailpoet_form_1 input.parsley-success {color: #00d084}
#mailpoet_form_1 select.parsley-success {color: #00d084}
#mailpoet_form_1 textarea.parsley-success {color: #00d084}
#mailpoet_form_1 .mailpoet_validate_error {color: #cf2e2e}
#mailpoet_form_1 input.parsley-error {color: #cf2e2e}
#mailpoet_form_1 select.parsley-error {color: #cf2e2e}
#mailpoet_form_1 textarea.textarea.parsley-error {color: #cf2e2e}
#mailpoet_form_1 .parsley-errors-list {color: #cf2e2e}
#mailpoet_form_1 .parsley-required {color: #cf2e2e}
#mailpoet_form_1 .parsley-custom-error-message {color: #cf2e2e}
#mailpoet_form_1 .mailpoet_paragraph.last {margin-bottom: 0} @media (max-width: 500px) {#mailpoet_form_1 {background: #27282e;}} @media (min-width: 500px) {#mailpoet_paragraph_1 .last . last-child {margin-bottom: 0}} @media (max-width: 500px) {#mailpoet_form_1 .mailpoet_form_column:last-child .mailpoet_paragraph:last-child {margin-bottom: 0}}
לדבר עם רובוטים בזמן אמת פורסם מחדש ממקור http://ai.googleblog.com/2022/12/talking-to-robots-in-real-time.html דרך http://feeds.feedburner.com/blogspot/gJZg
שבוע מיקור המונים
<!–
->
<!–
->
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- Platoblockchain. Web3 Metaverse Intelligence. ידע מוגבר. גישה כאן.
- מקור: https://blockchainconsultants.io/talking-to-robots-in-real-time/?utm_source=rss&utm_medium=rss&utm_campaign=talking-to-robots-in-real-time
- 000
- 1
- 7
- a
- יכול
- אודות
- מֵעַל
- תקציר
- לרוחב
- פעולות
- פעיל
- למעשה
- פְּנִיָה
- התקדמות
- עצה
- לאחר
- alex
- תעשיות
- מאפשר
- ו
- תשתיות
- להכריז
- בקשה
- גישה
- גישות
- ארכיטקטורה
- זרוע
- המשויך
- תשומת לב
- זמין
- מְמוּצָע
- בחזרה
- רקע
- כי
- החל
- להיות
- תאמינו
- בנצ 'מרק
- מעבר
- קצת
- לחסום
- אבני
- כָּחוֹל
- תַחתִית
- בריאן
- רחב
- יכולות
- מסוגל
- מרכז
- לאתגר
- האתגרים
- מעגל
- לשתף פעולה
- לגבות
- אוסף
- צֶבַע
- משולב
- לְהַשְׁווֹת
- מורכב
- אמון
- לְחַבֵּר
- אילוצים
- מכיל
- הקשר
- לעומת זאת
- לִשְׁלוֹט
- שליטה
- מתואם
- תאום
- תיקונים
- יכול
- יוצרים
- קריטי
- אוצר
- נוֹכְחִי
- כיום
- אישית
- נתונים
- מערכי נתונים
- dc
- לתאר
- תיאור
- למרות
- נחוש
- קשה
- לְהַצִיג
- שונה
- עשרות
- נהיגה
- בְּמַהֲלָך
- כל אחד
- קל יותר
- מאמץ
- מהנדס
- סביבה
- סביבות
- מוערך
- להעריך
- כולם
- עדות
- דוגמה
- נרגש
- קיימים
- פָּנִים
- כשלון
- מָשׁוֹב
- מעטים
- קבוע
- מרוכז
- לעקוב
- הבא
- טופס
- החל מ-
- חזית
- מלא
- פונקציות
- נוסף
- יתר על כן
- עתיד
- מקבל
- gif
- GitHub
- שערים
- Goes
- הולך
- גודריץ '
- ירוק
- קְבוּצָה
- חומרה
- לֵב
- גובה
- עזר
- מועיל
- כאן
- הדגשה
- לקוות
- אופק
- המארח
- איך
- HTML
- HTTPS
- בן אנוש
- בני אדם
- מאות
- לזהות
- חשוב
- in
- לכלול
- כולל
- כולל
- בנפרד
- תשתית
- בתחילה
- קלט
- הוראות
- בכוונה
- אינטראקציה
- אינטראקטיבי
- מעניין
- לֹא יְסוּלֵא בְּפָּז
- IT
- עצמו
- סוג
- דופק
- תיוג
- שפה
- גָדוֹל
- גדול יותר
- הגדול ביותר
- אחרון
- מְאוּחָר
- לִלמוֹד
- למידה
- תנופה
- מוגבל
- ארוך
- אבדות
- מכונה
- למידת מכונה
- לעשות
- מניפולציה
- רב
- מיפוי
- שולים
- max-width
- מיכאל
- יכול
- דקות
- חסר
- ML
- מודל
- מודלים
- מצבי
- יותר
- המהלך
- מספר
- טבעי
- חדש
- נגויין
- נוֹרמָלִי
- מספר
- מטרה
- אובייקטים
- מִקרִי
- הצעה
- לפתוח
- קוד פתוח
- תפעול
- מפעיל
- להזמין
- אחר
- אַחֶרֶת
- מְזוּוָג
- במיוחד
- אֲנָשִׁים
- תפיסה
- לְבַצֵעַ
- ביצוע
- פרספקטיבה
- פאם
- גופני
- פייר
- תכנית
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- נקודה
- מדיניות
- מדיניות
- תנוחות
- אפשרי
- פוטנציאל
- בדיוק
- נבואה
- להציג
- קודם
- תהליך
- לייצר
- מיוצר
- התקדמות
- רכוש
- לספק
- שאלה
- שאלות
- מָהִיר
- ציון
- הגיע
- להגיב
- ממשי
- עולם אמיתי
- זמן אמת
- טעם
- לאחרונה
- מתכון
- Red
- לשחרר
- רלוונטי
- לדרוש
- מחקר
- חוקרים
- להגיב
- לגמול
- רובוט
- למידת רובוטים
- רובוטיקה
- רובוטים
- להרחבה
- סולם
- סצינה
- מַדְעָן
- שון
- קטע
- פילוח
- מבחר
- רצף
- סט
- הצבה
- קצר
- לְהַצִיג
- הראה
- הופעות
- משמעותי
- בו זמנית
- יחיד
- מְיוּמָנוּת
- מיומנויות
- קטן
- לפתור
- מָקוֹר
- רווחים
- תֶקֶן
- כוכב
- החל
- פשוט
- לומד
- הצלחה
- בהצלחה
- תמיכה
- נתמך
- מערכת
- מערכות
- שולחן
- מדבר
- המשימות
- משימות
- מבחן
- השמיים
- שֶׁלָהֶם
- אלפים
- דרך
- זמן
- ל
- חלק עליון
- מְאוּמָן
- הדרכה
- תחת
- ייחודי
- us
- להשתמש
- משתמש
- משתמשים
- תועלת
- מגוון
- באמצעות
- וִידֵאוֹ
- וידאו
- חזון
- W3
- שעון
- אשר
- מי
- רָחָב
- ויקיפדיה
- יצטרך
- לְלֹא
- תיק עבודות
- עובד
- עוֹלָם
- היה
- שנים
- זפירנט
- אפס