סיכום הבטחות ומלכודות - חלק רביעי » בלוג CCC

סיכום הבטחות ומלכודות - חלק רביעי » בלוג CCC

CCC תמכה בשלושה מפגשים מדעיים בכנס השנתי של AAAS השנה. השבוע נסכם את עיקרי המפגש, "AI גנרטיבי במדע: הבטחות ומלכודות." הפאנל הזה, בהנחיית ד"ר מתיו טורק, נשיא המכון הטכנולוגי של טויוטה בשיקגו). ד"ר רבקה ווילט, פרופסור לסטטיסטיקה ומדעי המחשב באוניברסיטת שיקגו, ד"ר מרקוס בוהלר, פרופסור להנדסה במכון הטכנולוגי של מסצ'וסטס, ו ד"ר דאנקן ווטסון-פאריס, עוזר פרופסור ב-Scripps Institution of Oceanography וב-Halıcıoğlu Data Science Institute ב-UC סן דייגו. בחלק הרביעי, אנו מסכמים את חלק השאלות והתשובות של הפאנל. 

מפגש שאלות ותשובות בעקבות המצגות של חבר הפאנל, וד"ר מתיו טורק פתח את הדיון. "'הבטחות ומלכודות' נמצא בכותרת של הפאנל הזה. דנו ברבות מההבטחות, אבל לא התייחסנו לרבות מהמלכודות. מה מדאיג אותך לגבי עתיד הבינה המלאכותית הגנרטיבית?"

"האמינות והאמינות של הדגמים הללו היא דאגה גדולה", התחילה ד"ר רבקה ווילט. "המודלים האלה יכולים לחזות דברים שהם סבירים, אבל חסרים בהם אלמנטים מרכזיים ובולטים; האם אני כאדם יכול לזהות שחסר שם משהו?"

ד"ר מרקוס בוהלר הוסיף כי החיזוי בפועל של מודל עשוי להימשך שניה, אך תהליך האימות הניסוי יכול להימשך חודשים או שנה, או יותר. אז איך עלינו לפעול ביניים כשלא אימתנו את התוצאות? "אנחנו צריכים גם לחנך את הדור הבא של מפתחי בינה מלאכותית, כך שיעצבו מודלים אמינים וניתנים לאימות, ושנוכל להשתמש בתובנות מבוססות פיזיקה בבניית המודלים האלה."

ד"ר דאנקן ווטסון-פאריס בנה על שתי הנקודות הקודמות, ואמר "מכיוון שהמודלים האלה נועדו לייצר תוצאות סבירות, אנחנו לא יכולים רק להסתכל על התוצאות כדי לאמת את דיוקן. חוקרי בינה מלאכותית גנרטיבית צריכים להיות בעלי הבנה עמוקה של איך המודלים האלה עובדים כדי לאמת את התוצאות שלהם, וזו הסיבה שחינוך נכון של הדור הבא הוא כל כך חשוב."

חבר קהל: "במדעי החומרים, אנחנו יודעים את הכיוון קדימה לחקר חומרים מסוימים, אבל עבור אחרים, כמו מוליכים בטמפרטורת החדר, אנחנו לא יודעים איך להתקדם. איך לדעתך תיראה הדרך קדימה בלימוד החומרים הלא ידועים הללו? וכיצד יש לאפשר מחקר מסוג זה מנקודת מבט רגולטורית?"

"ובכן, אני לא מומחה במחקר מוליכים", אמר ד"ר בוהלר, "אז אני לא אדבר ישירות על זה, אבל אני יכול לדבר באופן כללי על האופן שבו אנו מתקדמים במדעי החומרים, במיוחד בתחום החלבון שלי. ופיתוח חומרים ביו. הדרך בה אנו מתקדמים היא היכולת לדחוף את המעטפת. אנו עורכים ניסויים חדשים ובודקים רעיונות ותיאוריות מוזרות ורואים אילו מהם עובדים ולמה. לגבי האופן שבו עלינו לאפשר את המחקר הזה, אנחנו צריכים יותר מודלים של קוד פתוח עם גישה קולקטיבית. הייתי מעודד פוליטיקאים לא להסדיר יתר על המידה את הטכנולוגיות הללו, כך שלחוקרים ולציבור תהיה גישה למודלים מסוג זה. אני לא חושב שזה רעיון טוב למנוע מאנשים להשתמש במודלים האלה, במיוחד כשאנחנו יכולים לאסוף רעיונות ופיתוחים ולהכניס ידע מתחומים מגוונים של פעילות אנושית. לדוגמה, כשהמציאו את מכונת הדפוס, הרשויות ניסו להגביל את זמינות הטכנולוגיה הזו כך שניתן יהיה לקרוא מעט ספרים בהמוניהם, אך מאמץ זה נכשל כישלון חרוץ. הדרך הטובה ביותר להגן על הציבור היא להקל על הגישה למודלים הללו בצורה כזו שנוכל לפתח, לחקור ולהעריך אותם באופן נרחב לטובת התועלת המרבית של החברה".

חבר הקהל: "רוב המודלים של AI הגנרטיביים כיום הם מודלים של רגרסיה המתמקדים בהדמיה או חיקוי של תרחישים שונים. עם זאת, גילוי במדע ניזון מההשערות והתחזיות שאנו חולמים. אז איך אנחנו יוצרים מודלים שנועדו להגות תחזיות חדשות במקום המודלים הנוכחיים המשמשים בעיקר לניסויים?"

ד"ר בוהלר הגיב ראשון ואמר: "אתה צודק, רוב המודלים המסורתיים של למידת מכונה מבוססים לרוב על רגרסיה, אבל המודלים שעליהם דיברנו היום עובדים אחרת. כאשר אתה מרכיב מערכות מרובות סוכנים עם יכולות רבות, הן למעשה מתחילות לחקור תרחישים חדשים והן מתחילות לנמק ולבצע תחזיות על סמך הניסויים שהן ערכו. הם הופכים אנושיים יותר. אתה, בתור חוקר, לא היית מריץ ניסוי ורק תסיים - היית מריץ ניסוי ואז תתחיל להסתכל על הנתונים ולאמת אותם ולבצע תחזיות חדשות על סמך הנתונים האלה, כדי לחבר את הנקודות ולחקור על ידי העלאת השערות והדמיה כיצד יתפתח תרחיש חדש. הייתם מתנסים, אוספים נתונים חדשים, מפתחים תיאוריה ומציעים אולי מסגרת משולבת לגבי עניין מסוים. אז היית מגן על הרעיונות שלך מפני הביקורת של עמיתיך ואולי משנה את ההשערה שלך כאשר נעשה שימוש במידע חדש. כך פועלות מערכות יריבות מרובות סוכנים חדשות, אבל כמובן שהן משלימות כישורים אנושיים עם יכולת הרבה יותר גדולה לנמק על כמויות אדירות של נתונים וייצוגים של ידע. המודלים האלה כבר יכולים לייצר השערות חדשות שדוחפות את המעטפת הרבה מעבר למה שכבר נחקר, מה שמוסיף לתהליך המדעי של גילוי וחדשנות".

"הייתי משלים את זה," התערב ד"ר ווילט, "כאשר תחום גילוי ההשלמות והרגרסיה הסימבולית הוא תחום נוסף המכוון הרבה יותר ליצירת השערות. יש הרבה עבודה מתמשכת במרחב הזה".

חבר קהל: "כיצד אנו מגדילים את הגישה לדגמים מסוג זה ומתגברים על מכשולים, כמו שרוב הדגמים נוצרים עבור דוברי אנגלית?"

ד"ר רבקה ווילט ענתה ואמרה, "להרבה אנשים יש גישה לשימוש במודלים האלה, אבל עיצוב והכשרתם עולים מיליוני דולרים רבים. אם רק קבוצה קטנה של ארגונים מסוגלת להקים את המודלים האלה, אז רק קבוצה קטנה מאוד של אנשים מקבלים את ההחלטות וקובעים סדרי עדיפויות בקהילה המדעית. ולעתים קרובות סדרי העדיפויות של הארגונים והאנשים האלה הם מונעי רווח. עם זאת, אני חושב שהנוף הזה מתחיל להשתנות. ארגונים כמו NSF מנסים לבנות תשתית שניתן לגשת אליה על ידי הקהילה המדעית הרחבה יותר. מאמץ זה דומה לפיתוח מוקדם של מחשבי-על. בימים הראשונים, החוקרים נאלצו להגיש הצעות ארוכות כדי לקבל גישה למחשב-על. אני חושב שאנחנו הולכים לראות פרדיגמות מתפתחות דומות בבינה מלאכותית ובינה מלאכותית.

"אני מסכים," אמר ד"ר ווטסון-פאריס. "בתוספת לכך מהצד הרגולטורי, אני לא חושב שאנחנו צריכים להסדיר את המחקר הבסיסי, אולי את מרחבי היישומים, אבל לא את המחקר עצמו."

תודה רבה שקראתם, והישארו מעודכנים לגבי התקצירים של שני הפאנלים האחרים שלנו ב-AAAS 2024.

בול זמן:

עוד מ בלוג CCC