בני אדם פוגעים במערכות בינה מלאכותית של Go-Playing

בני אדם פוגעים במערכות בינה מלאכותית של Go-Playing

בני אדם פוגעים במערכות הבינה המלאכותית של Go-Playing PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

חושבים שלבני אדם עלובים אין סיכוי כשמשחקים במשחקי אסטרטגיה נגד AI? אולי תצטרך לחשוב שוב. אדם אחד בארה"ב ניצח בינה מלאכותית במשחק העתיק של Go פשוט על ידי הסחת דעתו מההתקפה שהוא עשה, טקטיקה שספק אם תעבוד על שקית בשר אחרת.

השחקן, Klin Pelrine, כנראה לא ממש בראש דירוג החובבים עבור משחק Go, אבל הצליח להשיג את ה-AI הטוב ביותר ב-14 מתוך 15 משחקים, על פי פייננשל טיימס. פלרין השתמש בטקטיקות שכללו הסחת דעת של האלגוריתם עם מהלכים בפינות אחרות של הלוח בזמן שהוא עבד להקיף קבוצות של אבני יריביו.

Go הוא משחק לוח שבו שני שחקנים מניחים אבן שחורה או לבנה על לוח בגודל 19 על 19, המטרה היא להקיף שטח גדול יותר מהיריב שלך. אבנים מוסרות מהלוח אם מוקפים באבנים מנוגדות.

נראה שה- Go-playing AI לא הבחין במצוקה בה היא נמצאת, אפילו כשהכיתור כמעט הושלם - אסטרטגיה שהיתה נראית במבט חטוף לשחקן אנושי אחר.

כל זה רחוק משנת 2016, כאשר DeepMind's בבעלות גוגל AlphaGo הצליחו לנצח את לי סדול - אחד משחקני ה-Go המדורגים הכי גבוה בעולם - ואנשים רבים ראו בפיתוח הזה כמשחק גמור עבור שחקנים אנושיים, שכן בעתיד היו ירוצצו טבעות סביבם על ידי מודלים של למידת מכונה יותר ויותר מתוחכמים.

Pelrine לא שיחקה נגד AlphaGo, אלא נגד כמה מערכות AI אחרות למשחק Go, כולל KataGo, שמבוססת על טכניקות ששימשה את DeepMind ביצירת AlphaGo Zero.

למרבה האירוניה, נראה שהגישה להביס את מערכות הבינה המלאכותית הללו התגלתה על ידי תוכנת מחשב, אשר נוצרה במיוחד על ידי צוות חוקרים (כולל פלרין) כדי לחפש חולשות באסטרטגיית הבינה המלאכותית ששחקן אנושי יכול לנצל. התוכנית שיחקה יותר ממיליון משחקים נגד KataGo כדי לנתח את התנהגותה, כך נאמר לנו.

האסטרטגיה שמצאה התוכנה אינה טריוויאלית לחלוטין, אבל גם לא קשה לשחקנים אנושיים להתמודד איתה, אמר Pelrine ל-FT, וניתן להשתמש בה על ידי שחקן ביניים כדי לנצח בהצלחה את דגמי ה- AI המשחקים ב-Go.

המהלך האחרון מדגיש שמערכות בינה מלאכותית עשויות להיראות כמומחיות בכל תהליכים שהמודל שלהם הוכשר לבצע, אבל עדיין יכולים להיות חורים מפתיעים ביכולות שלהן.

"אני חושב ש'מצב הכישלון המפתיע' הוא הסיפור האמיתי כאן", אמר מהנדס התוכנה ושחקן השחמט והספורט המקצועי אלן דקר הקופה. "תחשוב על א מכונית טסלה נוסעת לצד של טנדר כי הוא טעה בצבע הבהיר שלו בקו הרקיע."

דקר אמר שסביר להניח שלכל AI מיומן יהיו את הכתמים העיוורים האלה, שהוספת יותר ויותר מורכבות לכיסוי הכתמים העיוורים היא חלקית הסיבה לכך שכל כך קשה לגרום לזה לעבוד היטב, ומדוע זה עלול לקחת יותר זמן מהצפוי להשיג מכוניות ללא נהג בכבישים שלנו.

צוות המחקר אמר ל-FT שהגורם המדויק לנקודה העיוורת באסטרטגיות של שחקני AI Go הוא עניין של השערה, אבל סביר להניח שהגישה שבה משתמש Pelrine היא כל כך נדירה שהאלגוריתם לא מזהה אותה. אם כן, סביר להניח שמודלים מעודכנים שהוכשרו לזהות אסטרטגיה זו עשויים בעתיד לא להיות שולל כל כך בקלות.

ניתן למצוא מאמר המפרט את הטקטיקות היריביות המשמשות לגילוי האסטרטגיה המנצחת כאן [PDF]. ®

בול זמן:

עוד מ הקופה