מדען המחשבים מאתגר את AI ללמוד אינטליגנציה טובה יותר של PlatoBlockchain נתונים. חיפוש אנכי. איי.

מדען המחשבים מאתגר את הבינה המלאכותית ללמוד טוב יותר

אלגוריתמי בינה מלאכותית נועדו ללמוד בהתקפים והתחלות. במקום לעדכן ברציפות את בסיס הידע שלהם במידע חדש לאורך זמן כפי שעושים בני אדם, אלגוריתמים יכולים ללמוד רק בשלב האימון. לאחר מכן, הידע שלהם נשאר קפוא; הם מבצעים את המשימה שאליה הם הוכשרו מבלי שהם יוכלו להמשיך ללמוד תוך כדי. כדי ללמוד אפילו דבר אחד חדש, יש לאמן שוב אלגוריתמים מאפס. זה כאילו בכל פעם שהכרת אדם חדש, הדרך היחידה שתוכל ללמוד את שמה תהיה לאתחל את המוח שלך.

אימון מאפס יכול להוביל להתנהגות המכונה שכחה קטסטרופלית, שבה מכונה משלבת ידע חדש במחיר של שכחת כמעט כל מה שהיא כבר למדה. המצב הזה נוצר בגלל האופן שבו אלגוריתמי ה-AI החזקים ביותר של ימינו, הנקראים רשתות עצביות, לומדים דברים חדשים.

אלגוריתמים אלה מבוססים באופן רופף על המוח שלנו, כאשר הלמידה כרוכה בשינוי חוזק הקשרים בין נוירונים. אבל התהליך הזה נעשה מסובך. קשרים עצביים מייצגים גם ידע עבר, כך ששינוי שלהם יותר מדי יגרום לשכחה.

רשתות נוירונים ביולוגיות פיתחו אסטרטגיות במשך מאות מיליוני שנים כדי להבטיח שמידע חשוב יישאר יציב. אבל רשתות העצבים המלאכותיות של היום נאבקות להגיע לאיזון טוב בין ידע חדש לישן. החיבורים שלהם מוחלפים בקלות רבה מדי כאשר הרשת רואה נתונים חדשים, מה שעלול לגרום לכישלון פתאומי וחמור בזיהוי מידע עבר.

כדי לעזור להתמודד עם זה, כריסטופר קאנאן, מדען מחשבים בן 41 מאוניברסיטת רוצ'סטר, סייע להקים תחום חדש של חקר בינה מלאכותית המכונה למידה מתמשכת. המטרה שלו היא שבינה מלאכותית תמשיך ללמוד דברים חדשים מזרמים רציפים של נתונים, ולעשות זאת מבלי לשכוח את כל מה שהיה קודם.

קאנן השתעשע עם אינטליגנציה של מכונות כמעט כל חייו. כילד באוקלהומה הכפרית שרק רצה ליהנות ממכונות, הוא לימד בוטים לשחק במשחקי מחשב מרובי שחקנים מוקדמים. זה גרם לו לתהות לגבי האפשרות של בינה כללית מלאכותית - מכונה עם יכולת לחשוב כמו אדם בכל דרך. זה גרם לו להתעניין איך מוחות עובדים, והוא התמחה בפילוסופיה ומדעי המחשב באוניברסיטת אוקלהומה סטייט לפני שלימודי התואר השני שלו לקחו אותו לאוניברסיטת קליפורניה, סן דייגו.

כעת קאנן מוצא השראה לא רק במשחקי וידאו, אלא גם בצפייה בבתו בת השנתיים כמעט לומדת על העולם, כאשר כל חווית למידה חדשה מתבססת על האחרונה. בגלל העבודה שלו ושל אחרים, שכחה קטסטרופלית כבר לא ממש קטסטרופלית.

Quanta שוחח עם קאנן על זיכרונות מכונות, שבירת חוקי האימון של רשתות עצביות והאם AI אי פעם ישיג למידה ברמת האדם. הראיון תמצה ונערך למען הבהירות.

איך ההכשרה שלך בפילוסופיה משפיעה על הדרך שבה אתה חושב על העבודה שלך?

זה שירת אותי מאוד כאיש אקדמיה. הפילוסופיה מלמדת אותך, "כיצד אתה מעלה טיעונים מנומקים", ו"כיצד אתה מנתח טיעונים של אחרים?" זה הרבה ממה שאתה עושה במדע. עדיין יש לי מאמרים מאז על הכשלים במבחן טיורינג, ודברים כאלה. ולכן הדברים האלה אני עדיין חושב עליהם הרבה.

המעבדה שלי קיבלה השראה משאלת השאלה: ובכן, אם אנחנו לא יכולים לעשות X, איך נוכל לעשות Y? אנחנו לומדים עם הזמן, אבל רשתות עצביות, באופן כללי, לא. אתה מאמן אותם פעם אחת. זה ישות קבועה אחרי זה. וזה דבר בסיסי שתצטרך לפתור אם אתה רוצה ליצור בינה כללית מלאכותית יום אחד. אם הוא לא יכול ללמוד בלי לטרוף את המוח שלו ולהתחיל מחדש מאפס, אתה לא באמת מתכוון להגיע לשם, נכון? זו יכולת מוקדמת מבחינתי.

כיצד התמודדו חוקרים עם שכחה קטסטרופלית עד כה?

השיטה המוצלחת ביותר, הנקראת replay, מאחסנת חוויות מהעבר ולאחר מכן משחזרת אותן במהלך האימון עם דוגמאות חדשות, כדי שהן לא יאבדו. זה בהשראת חיזוק הזיכרון במוח שלנו, שבו במהלך השינה "מושמעים מחדש" הקידוד ברמה הגבוהה של פעילויות היום כאשר הנוירונים מופעלים מחדש.

במילים אחרות, עבור האלגוריתמים, למידה חדשה לא יכולה לחסל לחלוטין את למידה מהעבר מכיוון שאנו מערבבים חוויות עבר מאוחסנות.

ישנם שלושה סגנונות לעשות זאת. הסגנון הנפוץ ביותר הוא "השידור החוזר האמיתי", שבו החוקרים מאחסנים תת-קבוצה של הקלט הגולמי - למשל, התמונות המקוריות עבור משימת זיהוי אובייקט - ואז מערבבים את התמונות המאוחסנות מהעבר עם תמונות חדשות שילמדו. הגישה השנייה משחזרת ייצוגים דחוסים של התמונות. שיטה שלישית הרבה פחות נפוצה היא "שידור חוזר גנרי". כאן, רשת עצבית מלאכותית מייצרת למעשה גרסה סינתטית של ניסיון עבר ואז מערבבת את הדוגמה הסינתטית הזו עם דוגמאות חדשות. המעבדה שלי התמקדה בשתי השיטות האחרונות.

עם זאת, למרבה הצער, השידור החוזר אינו פתרון מספק במיוחד.

למה לא?

כדי ללמוד משהו חדש, הרשת העצבית צריכה לאחסן לפחות מידע על כל מושג שהיא למדה בעבר. ומנקודת מבט נוירו-מדעית, ההשערה היא שלכם ולי יש שידור חוזר של חוויה עדכנית יחסית - לא משהו שקרה בילדותנו - כדי למנוע שכחה של החוויה האחרונה. בעוד שבדרך שבה אנחנו עושים את זה ברשתות עצביות עמוקות, זה לא נכון. זה לא בהכרח חייב לאחסן את כל מה שהוא ראה, אבל זה צריך לאחסן משהו על כל משימה שלמד בעבר כדי להשתמש בשידור חוזר. ולא ברור מה הוא צריך לאחסן. אז השידור החוזר כפי שהוא נעשה היום עדיין נראה כאילו זה לא עד הסוף.

אם נוכל לפתור לחלוטין שכחה קטסטרופלית, האם זה אומר שבינה מלאכותית תוכל ללמוד דברים חדשים ברציפות לאורך זמן?

לא בדיוק. אני חושב שהשאלות הפתוחות הגדולות, הגדולות והגדולות בתחום הלמידה המתמשכת אינן בשכחה קטסטרופלית. מה שבאמת מעניין אותי הוא: איך למידה מהעבר הופכת את הלמידה העתידית ליעילה יותר? ואיך למידה של משהו בעתיד מתקנת את למידת העבר? אלה דברים שלא הרבה אנשים מודדים, ואני חושב שלעשות זאת הוא חלק קריטי בדחיפה של התחום קדימה, כי באמת, זה לא רק לשכוח דברים. זה על להיות לומד טוב יותר.

שם אני חושב שהשדה קצת חסר ליער בגלל העצים. חלק גדול מהקהילה מגדיר את הבעיה בדרכים שאינן תואמות לא שאלות ביולוגיות מעניינות או יישומים הנדסיים מעניינים. אנחנו לא יכולים פשוט לגרום לכולם לעשות את אותה בעיית צעצוע לנצח. אתה חייב לומר: מהי משימת הכפפה שלנו? איך דוחפים דברים קדימה?

אז למה אתה חושב שרוב האנשים מתמקדים בבעיות הפשוטות האלה?

אני יכול רק לשער. רוב העבודה נעשית על ידי תלמידים שעוקבים אחר עבודות קודמות. הם מעתיקים את ההגדרה של מה שאחרים עשו ומראים כמה הישגים קלים בביצועים עם אותן מדידות. יצירת אלגוריתמים חדשים צפויה להוביל לפרסום, גם אם האלגוריתמים הללו לא באמת מאפשרים לנו להתקדם משמעותית בלמידה מתמדת. מה שמפתיע אותי הוא שאותו סוג של עבודה מיוצר על ידי חברות גדולות שאין להן את אותם תמריצים, למעט עבודה מונעת מתמחים.

כמו כן, עבודה זו אינה טריוויאלית. עלינו לבסס את הניסוי ואת ההגדרה האלגוריתמית הנכונה כדי למדוד האם למידה בעבר מסייעת ללמידה עתידית. הבעיה הגדולה היא שאין לנו מערכי נתונים טובים ללימוד למידה מתמשכת כרגע. כלומר, אנחנו בעצם לוקחים מערכי נתונים קיימים המשמשים למידת מכונה מסורתית ומיישמים אותם מחדש.

בעיקרו של דבר, בדוגמה של למידת מכונה (או לפחות בכל פעם שאני מתחיל ללמד למידת מכונה), יש לנו ערכת אימון, יש לנו ערכת מבחנים - אנחנו מתאמנים על ערכת האימונים, אנחנו בוחנים על ערכת המבחנים. למידה מתמשכת מפרה את הכללים האלה. מערך האימונים שלך הופך למשהו שמתפתח ככל שהלומד לומד. אבל אנחנו עדיין מוגבלים למערכות נתונים קיימות. אנחנו צריכים לעבוד על זה. אנחנו זקוקים לסביבת למידה מתמשכת ממש טובה שבה אנחנו באמת יכולים לדחוף את עצמנו.

איך תיראה סביבת הלמידה המתמשכת האידיאלית?

קל יותר להגיד לך מה זה לא מאשר מה זה. הייתי בפאנל שבו זיהינו את זה כבעיה קריטית, אבל זה לא בעיה שבה אני חושב שלמישהו יש מיד את התשובה.

אני יכול להגיד לך את המאפיינים שיש לזה. אז לעת עתה, נניח שאלגוריתמי AI לא סוכנים מגולמים בסימולציות. אז לכל הפחות, באופן אידיאלי, אנחנו לומדים מסרטונים, או משהו כזה, כמו זרמי וידאו מולטי-מודאליים, ובתקווה עושים יותר מסתם סיווג [של תמונות סטטיות].

יש הרבה שאלות פתוחות על זה. הייתי בסדנת למידה מתמשכת לפני כמה שנים וכמה אנשים כמוני אמרו, "אנחנו חייבים להפסיק להשתמש במערך נתונים שנקרא MNIST, זה פשוט מדי." ואז מישהו אמר, "בסדר, טוב, בוא נעשה למידה מצטברת של [משחק הווידאו מבוסס האסטרטגיה] StarCraft." וגם אני עושה את זה עכשיו מסיבות שונות, אבל אני חושב שגם זה לא ממש מפריע. החיים הם דבר הרבה יותר עשיר מאשר ללמוד לשחק StarCraft.

איך המעבדה שלך ניסתה לעצב אלגוריתמים שיכולים להמשיך ללמוד לאורך זמן?

עם תלמידי לשעבר טיילר הייז, אני היו חלוצים במשימת למידה מתמדת על נימוק אנלוגי. חשבנו שזה יהיה תחום טוב ללמוד את הרעיון של למידת העברה, שבו אתה רוכש מיומנויות ועכשיו צריך להשתמש במיומנויות מורכבות יותר כדי לפתור בעיות מורכבות יותר. באופן ספציפי, מדדנו העברה לאחור - עד כמה למידה של משהו בעבר עוזרת לך בעתיד, ולהיפך. ומצאנו ראיות טובות להעברה, הרבה יותר משמעותיות מאשר למשימה פשוטה כמו זיהוי אובייקטים.

המעבדה שלך מתמקדת גם באימון אלגוריתמים ללמוד באופן רציף מדוגמה אחת בכל פעם, או מקבוצות קטנות מאוד של דוגמאות. איך זה עוזר?

הרבה מערכי למידה מתמשכים עדיין משתמשים בקבוצות גדולות מאוד של דוגמאות. אז הם בעצם יאמרו לאלגוריתם, "הנה 100,000 דברים; ללמוד אותם. הנה 100,000 הדברים הבאים; למד אותם." זה לא ממש תואם את מה שהייתי אומר הוא היישום בעולם האמיתי, כלומר, "הנה דבר אחד חדש; למד את זה. הנה עוד דבר חדש; למד את זה."

אם אנחנו רוצים ש-AI ילמד יותר כמונו, האם עלינו לשחזר גם איך בני אדם לומדים דברים שונים בגילאים שונים, ותמיד משכללים את הידע שלנו?

אני חושב שזו דרך מאוד פורה להתקדמות בתחום הזה. אנשים אומרים לי שאני פשוט אובססיבי להתפתחות עכשיו כשיש לי ילד, אבל אני יכול לראות שהבת שלי מסוגלת ללמוד באחת, שם היא רואה אותי עושה משהו פעם אחת והיא יכולה להעתיק אותו מיד. ואלגוריתמים של למידת מכונה לא יכולים לעשות דבר כזה היום.

זה ממש פתח לי את העיניים. חייב לקרות בראשנו הרבה יותר מאשר ברשתות העצבים המודרניות שלנו. לכן אני חושב שהתחום צריך ללכת לכיוון הרעיון הזה של למידה לאורך זמן, שבו אלגוריתמים הופכים ללומדים טובים יותר על ידי בניית ניסיון העבר.

האם אתה חושב שבינה מלאכותית ילמדו אי פעם בדיוק כמו שבני אדם לומדים?

אני חושב שהם יעשו זאת. בהחלט. זה הרבה יותר מבטיח היום כי יש כל כך הרבה אנשים שעובדים בתחום. אבל אנחנו עדיין צריכים יותר יצירתיות. כל כך הרבה מהתרבות בקהילת למידת מכונה היא גישת מעקב אחר המנהיג.

אני חושב עלינו כאל מכונות ביוכימיות בלבד, ובסופו של דבר נבין כיצד ליצור את האלגוריתמים שלנו לארכיטקטורות הנכונות שלדעתי יהיו בעלות יותר מהיכולות שלנו ממה שיש להן היום. אין שום טיעון משכנע עבורי שאומר שזה בלתי אפשרי.

בול זמן:

עוד מ קוונטמגזין