ה-AI החדש של Meta מדורג ב-10% המובילים במשחק 'דיפלומטיה' - ושחקנים אנושיים לא היו אינטליגנציה נבונה יותר של PlatoBlockchain. חיפוש אנכי. איי.

ה-AI החדש של Meta מדורג ב-10% המובילים במשחק 'דיפלומטיה' - ושחקנים אנושיים לא היו חכמים יותר

בינה מלאכותית שלטה בחלק מהכי הרבה משחקים מורכבים ידוע לאדם, אך למרות שלעתים קרובות הוא מצטיין בתחרות, שיתוף הפעולה אינו בא באופן טבעי. כעת AI מבית Meta שולט במשחק דיפלומטיה, שדורש ממך לעבוד עם שחקנים אחרים כדי לנצח.

השליטה של ​​גוגל ב משחק Go הוכתרה כאבן דרך חשובה עבור AI, אך למרות המורכבות הבלתי ניתנת להכחשה, היא מתאימה במובנים רבים להיגיון הקר והמחושב של מכונה. זהו משחק של מידע מושלם, שבו יש לך נראות מלאה של המהלכים של היריב שלך, ולנצח פשוט פירושו להיות מסוגל לעקוף שחקן אחד אחר.

דיפלומטיה, לעומת זאת, היא עניין מבולגן הרבה יותר. משחק הלוח רואה עד שבעה שחקנים לוקחים יותר מעצמות צבאיות אירופיות ומשתמשות בצבאותיהן כדי להשתלט על ערים אסטרטגיות. אבל לשחקנים מותר לנהל משא ומתן זה עם זה כדי ליצור ולשבור בריתות במרדף אחר שליטה מוחלטת.

יתרה מכך, כל המהלכים של השחקנים נעשים בו זמנית בכל תור, כך שאתה לא יכול פשוט להגיב למה שאחרים עושים. המשמעות היא שניצחון במשחקים דורש שילוב מורכב של חשיבה אסטרטגית, יכולת לשתף פעולה עם שחקנים אחרים וכישורי משא ומתן שכנוע. בעוד שבינה מלאכותית כבר שלטה באסטרטגיה טהורה, כישורים אחרים הוכיחו שהרבה יותר מסובכים לשכפל.

AI חדש שתוכנן על ידי חוקרים ב-Meta אולי עשה צעד גדול בכיוון הזה. ב מאמר שפורסם שבוע שעבר in מדע, הם מתארים מערכת בשם Cicero שדורגה ב-10 האחוזים המובילים של השחקנים בליגת דיפלומטיה מקוונת והשיגה יותר מכפול מהניקוד הממוצע של השחקנים האנושיים.

"קיקרו הוא גמיש, הוא חסר רחמים, והוא סבלני", אמר אלוף העולם בדיפלומטיה, אנדרו גופ, שלוש פעמים.id ב סרטון שהופק על ידי Meta. "זה משחק בלי הרבה רגש אנושי שלפעמים גורם לך לקבל החלטות רעות. הוא רק מעריך את המצב ומקבל את ההחלטה הטובה ביותר, לא רק עבורו, אלא עבור האנשים איתם הוא עובד".

יצירת Cicero דרשה מחוקרי Meta לשלב שיטות AI מתקדמות משני תתי תחומים שונים: חשיבה אסטרטגית ועיבוד שפה טבעית. בליבה, למערכת יש אלגוריתם תכנון שמנבא מהלכים של שחקנים אחרים ומשתמש בזה כדי לקבוע את האסטרטגיה שלה. האלגוריתם הזה אומן על ידי כך שגרם ל-AI לשחק את עצמו שוב ושוב, תוך ניסיון לחקות את האופן שבו בני אדם משחקים את המשחק.

החוקרים כבר הראו שמודול התכנון הזה לבדו מסוגל לנצח את המקצוענים האנושיים בגרסה פשוטה של ​​המשחק. אבל במחקר האחרון הזה, הצוות שילב אותו עם מודל שפה גדול שאומן על כמויות עצומות של טקסט מהאינטרנט, ולאחר מכן כוונן עדין באמצעות דיאלוג מ-40,000 משחקים מקוונים של דיפלומטיה. זה נתן ל-Cicero המשודרג את היכולת לפרש הודעות משחקנים אחרים ו גם לעצב את עצמו הודעות לשכנע אותם לעבוד ביחד.

המערכת המשולבת מתחילה בשימוש במצב הנוכחי של הלוח ובדיאלוג בעבר כדי לחזות מה כל שחקן צפוי לעשות. לאחר מכן הוא מעלה תוכנית פעולה הן עבור עצמה והן עבור שותפיה לפני הפקת מסרים שנועדו לשרטט את כוונתו ולהבטיח את שיתוף הפעולה של שחקנים אחרים.

מעל 40 משחקים בטורניר המקוון, Cicero תקשר ביעילות עם 82 שחקנים אחרים כדי להסביר את כוונותיו, לתאם פעולות ולנהל משא ומתן על בריתות. באופן מכריע, החוקרים אומרים שהם לא ראו ראיות מהודעות במשחק ששחקנים אנושיים חשדו שהם התחברו עם AI.

עם זאת, היכולות התקשורתיות של הדגם לא היו ללא רבב. הוא יותר ממסוגל לירוק מסרים שטותיים או כאלה שאינם עולים בקנה אחד עם מטרותיו, ולכן החוקרים נאלצו ליצור מספר הודעות מועמדות בכל מהלך ולאחר מכן להשתמש במנגנוני סינון שונים כדי לנכש את האשפה. וגם אז, החוקרים מודים שלפעמים מסרים לא הגיוניים חומקיםPED דרך.

זה מצביע על כך שמודל השפה שבלב קיקרו עדיין לא ממש מבין מה קורה והוא פשוט מייצר מסרים סבירים שאחר כך צריך לבדוק אותם כדי לוודא שהם משיגים את התוצאות הרצויות.

כותב ב שיחה, חוקר הבינה המלאכותית טובי וולש מאוניברסיטת ניו סאות' ויילס באוסטרליה מציין גם שקיקרו ישר ללא טעות, בניגוד לרוב השחקנים האנושיים. אמנם זו אסטרטגיה יעילה להפתיע, אבל זו עלולה להיות חולשה גדולה אם המתחרים יצליחו להבין שיריבם לעולם לא ינסה להונות אותם.

בכל זאת, ההתקדמות היא משמעותית, ופייסבוק מקווה שיהיו לה יישומים הרבה מעבר למשחקי לוח. בהודעה בבלוג, החוקרים אומרים שהיכולת להשתמש באלגוריתמי תכנון כדי לשלוט ביצירת שפות יכולה לאפשר לנהל שיחות ארוכות ועשירות הרבה יותר עם צ'אטבוטים של AI או ליצור דמויות משחקי וידאו שיכולות להסתגל להתנהגות של שחקן.

תמונת אשראי: MabelAmber / 4008 תמונות

בול זמן:

עוד מ רכזת הסינגולריות