מלמטה למעלה ועד מלמעלה למטה: מדענית החישוב אמנדה ברנרד על היופי שבסימולציות, למידת מכונה וכיצד השניים מצטלבים - עולם הפיזיקה

מלמטה למעלה ועד מלמעלה למטה: מדענית החישוב אמנדה ברנרד על היופי שבסימולציות, למידת מכונה וכיצד השניים מצטלבים - עולם הפיזיקה

אמנדה ברנרד
מומחה ממשקים אמנדה ברנרד היא סגנית מנהלת ומנהלת מדעי החישוב בבית הספר למחשוב באוניברסיטה הלאומית של אוסטרליה. (באדיבות: Sitthixay Ditthavong/קנברה טיימס)

משימוש במחשבי-על כדי לנצל סוגים חדשים של חומרים ועד לאימון מודלים של למידת מכונה לחקר תכונות מורכבות בקנה מידה ננו, מדענית החישוב האוסטרלית אמנדה ברנרד עובד בממשק של מחשוב ומדעי הנתונים. פרופסור בכיר ב בית הספר למחשוב באוניברסיטה הלאומית של אוסטרליה, ברנרד הוא גם סגן מנהל ומוביל מדעי החישוב. בימים אלה, היא משתמשת במגוון שיטות חישוביות כדי לפתור בעיות במדעי הפיזיקה, אבל ברנרד החלה את הקריירה שלה כפיזיקאית, וקיבלה את הדוקטורט שלה בפיזיקה תיאורטית של החומר המעובה ב-2003.

לאחר שבילה את השנים הבאות כפוסט דוקטורט ב- המרכז לחומרים ננומטריים במעבדה הלאומית של ארגון בארצות הברית, היא החלה להרחיב את תחומי העניין שלה במחקר כדי להקיף היבטים רבים של מדעי החישוב, כולל השימוש בלמידת מכונה בננוטכנולוגיה, מדעי החומרים, כימיה ורפואה.

בחור משני ה המכון האוסטרלי לפיזיקה ו האגודה המלכותית לכימיה, בשנת 2022 מונה ברנרד א חבר במסדר אוסטרליה. היא גם זכתה במספר פרסים, כולל פרס פיינמן לשנת 2014 בננוטכנולוגיה (תיאוריה) וה מדליה לשנת 2019 מאיגוד המודלים המולקולריים של אוסטרליה. היא מדברת עם האמיש ג'ונסטון על העניין שלה ביישום למידת מכונה על מגוון בעיות, ועל האתגרים והתגמולים של ניהול אוניברסיטה.

אתה יכול לספר לנו קצת על מה שאתה עושה כמדען חישובי?

מדע החישוב כרוך בתכנון ושימוש במודלים מתמטיים כדי לנתח בעיות תובעניות חישוביות בתחומים רבים של מדע והנדסה. זה כולל התקדמות בתשתית חישובית ואלגוריתמים המאפשרים לחוקרים בתחומים שונים אלה לבצע ניסויים חישוביים בקנה מידה גדול. במובן מסוים, מדע החישוב כולל מחקר של מחשוב בעל ביצועים גבוהים, ולא רק מחקר באמצעות מחשב בעל ביצועים גבוהים.

אנו מבלים את רוב זמננו באלגוריתמים ומנסים להבין כיצד ליישם אותם באופן המנצל בצורה הטובה ביותר את החומרה המתקדמת; והחומרה הזו משתנה כל הזמן. זה כולל סימולציות קונבנציונליות המבוססות על מודלים מתמטיים שפותחו במיוחד בתחומים מדעיים שונים, בין אם זה פיזיקה, כימיה או מעבר לכך. אנחנו גם מבלים זמן רב בשימוש בשיטות מ למידת מכונה (ML) ו- בינה מלאכותית (AI), שרובם פותחו על ידי מדעני מחשב, מה שהופך אותו למחקר בינתחומי מאוד. זה מאפשר להשתמש בחבורה שלמה של גישות חדשות בכל התחומים המדעיים השונים הללו.

למידת מכונה מאפשרת לנו לשחזר הרבה מהמורכבות שאיבדנו כאשר אנו מפיקים את התיאוריות היפות הללו

סימולציה נולדה מתוך ההיבטים התיאורטיים של כל תחום מדעי, שבעזרת כמה רמות הפשטה נוחות אפשרו לנו לפתור את המשוואות. אבל כשפיתחנו את התיאוריות הללו, הן היו כמעט פישוט יתר של הבעיה, שנעשתה או מתוך רדיפה אחר אלגנטיות מתמטית או סתם למען המעשיות. ML מאפשר לנו לשחזר הרבה מהמורכבות שאיבדנו כאשר אנו מפיקים את התיאוריות היפות הללו. אך למרבה הצער, לא כל ML עובד טוב עם מדע, ולכן מדעני חישוב מבלים זמן רב בניסיון להבין כיצד ליישם את האלגוריתמים הללו שמעולם לא נועדו לשמש עבור מערכי נתונים מסוג זה כדי להתגבר על חלק מהבעיות שיש מנוסה בממשק. וזה אחד התחומים המרגשים שאני אוהב.

התחלת את הקריירה שלך בתור פיזיקאי. מה גרם לך לעבור למדעי החישוב?

פיזיקה היא נקודת התחלה מצוינת לכל דבר. אבל תמיד הייתי בדרך למדע החישובי בלי לשים לב לזה. במהלך פרויקט המחקר הראשון שלי כסטודנט, השתמשתי בשיטות חישוביות ומיד התמכרתי. אהבתי את הקידוד, כל הדרך מכתיבת הקוד ועד לתוצאות הסופיות, וכך ידעתי מיד שמחשבי-על נועדו להיות הכלי המדעי שלי. זה היה מרגש לחשוב מה מדען חומרים יכול לעשות אם היה יכול לעשות דוגמאות מושלמות בכל פעם. או מה כימאי היה יכול לעשות אם הם יכולים להסיר את כל הזיהומים ולקבל תגובות מושלמות. מה נוכל לעשות אם נוכל לחקור סביבות קשות או מסוכנות מבלי להסתכן בפגיעה באף אחד? ויותר חשוב, מה אם נוכל לעשות את כל הדברים האלה בו זמנית, לפי דרישה, בכל פעם שניסינו?

היופי של מחשבי-על הוא שהם המכשיר היחיד שמאפשר לנו להגיע לשלמות כמעט זו. מה שהכי שובה אותי הוא שאני יכול לא רק לשחזר את מה שעמיתיי יכולים לעשות במעבדה, אלא גם לעשות כל מה שהם לא יכולים לעשות במעבדה. אז מהימים הראשונים, הפיזיקה החישובית שלי הייתה על מחשב. הכימיה החישובית שלי התפתחה אז לחומרים, אינפורמטיקה של חומרים, ועכשיו כמעט אך ורק ל-ML. אבל תמיד התמקדתי בשיטות בכל אחד מהתחומים האלה, ואני חושב שבסיס בפיזיקה מאפשר לי לחשוב בצורה מאוד יצירתית על איך אני ניגש לכל התחומים האחרים האלה מבחינה חישובית.

במה שונה למידת מכונה מהדמיות מחשב קלאסיות?

רוב המחקר שלי הוא כעת ML, כנראה 80% ממנו. עם זאת, אני עדיין עושה כמה סימולציות קונבנציונליות, מכיוון שהן נותנות לי משהו מאוד שונה. סימולציות ביסודו של דבר הן גישה מלמטה למעלה. אנחנו מתחילים עם קצת הבנה של מערכת או בעיה, אנחנו מריצים סימולציה, ואז אנחנו מקבלים כמה נתונים בסוף. ML, לעומת זאת, היא גישה מלמעלה למטה. אנחנו מתחילים עם הנתונים, אנחנו מריצים מודל, ואז אנחנו מגיעים להבנה טובה יותר של המערכת או הבעיה. סימולציה מבוססת על כללים שנקבעו על ידי התיאוריות המדעיות המבוססות שלנו, בעוד ש-ML מבוסס על חוויות והיסטוריה. סימולציות לרוב דטרמיניסטיות במידה רבה, אם כי ישנן כמה דוגמאות לשיטות סטוכסטיות כמו מונטה קרלו. ML הוא בעיקרו סטוכסטי, אם כי יש כמה דוגמאות שהן גם דטרמיניסטיות.

עם סימולציות, אני יכול לעשות אקסטרפולציה טובה מאוד. הרבה מהתיאוריות העומדות בבסיס הדמיות מאפשרות לנו לחקור אזורים של "מרחב תצורה" (הקואורדינטות שקובעות את כל המצבים האפשריים של מערכת) או אזורים של בעיה שאין לנו נתונים או מידע לגביהם. מצד שני, ML ממש טוב באינטרפולציה ומילוי כל הפערים וזה טוב מאוד להסקת מסקנות.

מושג זרימת נתונים

ואכן, שתי השיטות מבוססות על סוגים שונים מאוד של היגיון. סימולציה מבוססת על היגיון "אם-אז-אחר", כלומר אם יש לי בעיה מסוימת או קבוצה מסוימת של תנאים, אז אני אקבל תשובה דטרמיניסטית או אחרת, מבחינה חישובית, היא כנראה תקרוס אם תקבל זה לא בסדר. ML, לעומת זאת, מבוסס על היגיון של "הערכה-שיפור-חזרה", מה שאומר שהוא תמיד ייתן תשובה. התשובה הזו תמיד ניתנת לשיפור, אבל אולי לא תמיד היא נכונה, אז זה עוד הבדל.

הסימולציות הן תוך-תחומיות: יש להן קשר הדוק מאוד לידע בתחום והן מסתמכות על אינטליגנציה אנושית. מצד שני, ML הוא בינתחומי: באמצעות מודלים שפותחו מחוץ לתחום המקורי, הוא אגנוסטי לידע בתחום ומסתמך במידה רבה על בינה מלאכותית. זו הסיבה שאני אוהב לשלב בין שתי הגישות.

האם אתה יכול לספר לנו קצת יותר על האופן שבו אתה משתמש למידת מכונה במחקר שלך?

לפני הופעת ה-ML, מדענים היו צריכים להבין פחות או יותר את היחסים בין התשומות לתפוקות. היינו צריכים לקבוע מראש את מבנה המודל לפני שהצלחנו לפתור אותו. פירוש הדבר היה שעלינו לקבל מושג על התשובה לפני שנוכל לחפש אותה.

נוכל לפתח מבנה של ביטוי או משוואה ולפתור אותו בו-זמנית. זה מאיץ את השיטה המדעית, וזו עוד סיבה שבגללה אני אוהב להשתמש בלמידת מכונה

כאשר אתה משתמש ב-ML, המכונות משתמשות בטכניקות סטטיסטיות ובמידע היסטורי כדי לתכנת את עצמן בעצם. זה אומר שאנחנו יכולים לפתח מבנה של ביטוי או משוואה ולפתור אותו בו-זמנית. זה מאיץ את השיטה המדעית, וזו עוד סיבה למה אני אוהב להשתמש בה.

טכניקות ה-ML בהן אני משתמש הן מגוונות. יש הרבה טעמים וסוגים שונים של ML, בדיוק כמו שיש המון סוגים שונים של פיזיקה חישובית או שיטות פיזיקה ניסויית. אני משתמש בלמידה ללא פיקוח, שמבוססת כולה על משתני קלט, והיא בוחנת פיתוח "דפוסים נסתרים" או ניסיון למצוא נתונים מייצגים. זה שימושי עבור חומרים בננו-מדע, כאשר לא עשינו את הניסויים כדי אולי למדוד תכונה, אבל אנחנו יודעים לא מעט על תנאי הקלט שהשקענו כדי לפתח את החומר.

למידה ללא פיקוח יכולה להיות שימושית במציאת קבוצות של מבנים, המכונים אשכולות, שיש להם קווי דמיון במרחב הגבוה, או מבנים טהורים ומייצגים (ארכיטיפים או אבות טיפוס) המתארים את מערך הנתונים כמכלול. אנו יכולים גם להפוך נתונים כדי למפות אותם למרחב בעל מימד נמוך יותר ולחשוף קווי דמיון נוספים שלא נראו בעבר, באופן דומה שאנו עשויים לשנות למרחב הדדי בפיזיקה.

אני משתמש גם ב-ML בפיקוח כדי למצוא קשרים ומגמות, כמו קשרי מבנה-רכוש, שהם חשובים בחומרים ובמדעי הננו. זה כולל סיווג, שבו יש לנו תווית בדיד. נניח שכבר יש לנו קטגוריות שונות של ננו-חלקיקים, ועל סמך המאפיינים שלהם, אנו רוצים להקצות אותם אוטומטית לקטגוריה כזו או אחרת, ולוודא שנוכל להפריד בקלות את המחלקות הללו על סמך נתוני קלט בלבד.

אני משתמש בלמידה סטטיסטית וגם בלמידה בפיקוח למחצה. למידה סטטיסטית, במיוחד, שימושית במדע, אם כי עדיין לא נעשה בה שימוש נרחב. אנו חושבים על זה כהסקה סיבתית שמשמשת הרבה באבחון רפואי, וניתן ליישם זאת כדי לאבחן ביעילות כיצד חומר, למשל, עשוי להיווצר, ולא רק מדוע הוא נוצר.

קבוצת המחקר שלך כוללת אנשים עם מגוון רחב של תחומי עניין מדעיים. אתה יכול לתת לנו טעימה של כמה מהדברים שהם לומדים?

כשהתחלתי בפיזיקה, מעולם לא חשבתי שאהיה מוקף בקבוצה כל כך מדהימה של אנשים חכמים מתחומים מדעיים שונים. אשכול מדעי החישוב באוניברסיטה הלאומית של אוסטרליה כולל מדעני סביבה, מדעני כדור הארץ, ביולוגים חישוביים וביואינפורמטיקה. ישנם גם חוקרים שלומדים גנומיקה, מדעי המוח החישוביים, כימיה קוונטית, מדעי החומר, פיזיקת פלזמה, אסטרופיזיקה, אסטרונומיה, הנדסה, ואני – ננוטכנולוגיה. אז אנחנו חבורה מגוונת.

הקבוצה שלנו כוללת ג'וזפה בארסה, אשר מפתחת אלגוריתמים העומדים בבסיס חבילות התוכנה לכימיה קוונטית הנמצאות בשימוש בכל רחבי העולם. המחקר שלו מתמקד כיצד אנו יכולים למנף מעבדים חדשים, כגון מאיצים, וכיצד אנו יכולים לחשוב מחדש כיצד ניתן לחלק ולפצל מולקולות גדולות כך שנוכל לשלב אסטרטגית זרימות עבודה מקבילות באופן מסיבי. הוא גם עוזר לנו להשתמש במחשבי-על בצורה יעילה יותר, מה שחוסך באנרגיה. ובשנתיים האחרונות, הוא החזיק בשיא העולם באלגוריתם הכימיה הקוונטית הטוב ביותר.

גם בקנה מידה קטן - מבחינת מדע - הוא מין בואי, שהוא ביואינפורמטיקן העובד על פיתוח מודלים סטטיסטיים חדשים בתחום מערכות פילוגנומיה [תחום רב תחומי המשלב מחקר אבולוציוני עם ביולוגיה מערכות ואקולוגיה, תוך שימוש בשיטות ממדעי הרשת]. אלה כוללים מודלים לחלוקה, מודלים המודעים לאיזומורפיזם ומודלים של עצי הפצה. היישומים של זה כוללים אזורים באנזימים פוטוסינתטיים או נתוני שעתוק פילוגנית של חרקים עמוקים, והוא עשה עבודה בבדיקת אצות, כמו גם חיידקים ווירוסים כמו HIV ו-SARS-CoV-2 (הגורם ל-COVID-19).

מין בואי

בקצה הגדול יותר של הסקאלה נמצא מתמטיקאי קוונלינג דנג, שמחקרו מתמקד במודלים מתמטיים ובסימולציה עבור מדיה בקנה מידה גדול, כמו דינמיקה של אוקיינוסים ואטמוספירה, כמו גם גולשי קרח באנטארקטיקה.

החלק הטוב ביותר הוא כשאנחנו מגלים שבעיה מתחום אחד למעשה כבר נפתרה באחר, ועוד יותר טוב כשאנחנו מגלים אחד מנוסה במספר תחומים, כך שנוכל לדרג בצורה סופר ליניארית. זה נהדר כאשר לפתרון אחד יש מספר תחומי השפעה. ובאיזו תדירות תמצא מדען מוח חישובי שעובד לצד פיזיקאי פלזמה? זה פשוט לא קורה בדרך כלל.

בנוסף לעבודה עם קבוצת המחקר שלך, אתה גם סגן מנהל בית הספר למחשוב של האוניברסיטה הלאומית של אוסטרליה. אתה יכול לספר לנו קצת על התפקיד הזה?

זה בעיקר תפקיד אדמיניסטרטיבי. אז בנוסף לעבודה עם קבוצה מדהימה של מדעני מחשב במדעי הנתונים, תחומי יסוד בשפות, פיתוח תוכנה, אבטחת סייבר, ראייה ממוחשבת, רובוטיקה וכן הלאה, אני גם זוכה ליצור הזדמנויות לאנשים חדשים להצטרף לבית הספר ולהיות הגרסה הטובה ביותר של עצמם. הרבה מהעבודה שלי בתפקיד המנהיגות היא על האנשים. וזה כולל גיוס עובדים, טיפול בתכנית הקביעות שלנו וגם תכנית הפיתוח המקצועי שלנו. הייתה לי גם הזדמנות להתחיל כמה תוכניות חדשות לתחומים שחשבתי שדורשים תשומת לב.

דוגמה אחת כזו הייתה במהלך מגיפת ה-COVID העולמית. רבים מאיתנו נסגרו ולא יכולנו לגשת למעבדות שלנו, מה שגרם לנו לתהות מה אנחנו יכולים לעשות. ניצלתי את ההזדמנות לפתח תוכנית בשם מלגת יובל משותפת, התומך בחוקרים הפועלים בממשק בין מדעי המחשב לתחום אחר, שבו הם פותרים אתגרים גדולים בתחומיהם, אך גם משתמשים בידע בתחום זה כדי ליידע סוגים חדשים של מדעי המחשב. התוכנית תמכה בחמישה חוקרים כאלה בתחומים שונים בשנת 2021.

אני גם היו"ר של ה תכנית נשים חלוציות, שיש לה מלגות, מלגות ומלגות לתמיכה בנשים שנכנסות למחשוב ולהבטיח שהן יצליחו לאורך הקריירה שלהן איתנו.

וכמובן, אחד מתפקידי האחרים כסגן המנהל הוא לדאוג למתקני המחשוב של בית הספר שלנו. אני בוחן דרכים בהן נוכל לגוון את צינור המשאבים שלנו כדי לעבור תקופות קשות, כמו בתקופת הקורונה, כשלא יכולנו להזמין ציוד חדש. אני גם בוחן איך אנחנו יכולים להיות יעילים יותר באנרגיה, מכיוון שהמחשוב משתמש בכמות עצומה של אנרגיה.

זה חייב להיות זמן מרגש מאוד עבור אנשים שעושים מחקר ב-ML, מכיוון שהטכנולוגיה מוצאת כל כך הרבה שימושים שונים. לאילו יישומים חדשים של ML אתה הכי מצפה במחקר שלך?

ובכן, כנראה כמה מאלה שאתה כבר שומע עליהם, כלומר AI. אמנם ישנם סיכונים הקשורים לבינה מלאכותית, אבל יש גם הזדמנויות עצומות, ואני חושב שבינה מלאכותית גנרטיבית תהיה חשובה במיוחד בשנים הקרובות למדע - בתנאי שנוכל להתגבר על חלק מהבעיות שבהן הוא "הזוי" [כאשר מערכת בינה מלאכותית , כגון מודל שפה גדול, מייצר מידע שקרי, המבוסס על מערך נתוני אימון או היגיון הקשרי, או שילוב של שניהם].

לא משנה באיזה תחום מדע אנחנו נמצאים, אנחנו מוגבלים על ידי הזמן שיש לנו, הכסף, המשאבים והציוד שיש לנו גישה אליו. זה אומר שאנחנו מתפשרים על המדע שלנו כדי להתאים למגבלות האלה במקום להתמקד בהתגברות עליהן

אבל לא משנה באיזה תחום מדע אנחנו נמצאים, בין אם חישוביים או ניסויים, כולנו סובלים תחת מספר הגבלות. אנחנו מוגבלים על ידי הזמן שיש לנו, הכסף, המשאבים והציוד שיש לנו גישה אליו. זה אומר שאנחנו מתפשרים על המדע שלנו כדי להתאים למגבלות האלה במקום להתמקד בהתגברות עליהן. אני באמת מאמין שהתשתית לא צריכה להכתיב מה אנחנו עושים, זה צריך להיות הפוך.

אני חושב שבינה מלאכותית גנרטיבית הגיעה בזמן הנכון כדי לאפשר לנו סוף סוף להתגבר על חלק מהבעיות הללו, כי יש לה פוטנציאל רב להשלים את החסר ולספק לנו מושג מה המדע שהיינו יכולים לעשות, אילו היה לנו הכל. המשאבים הדרושים.

אכן, בינה מלאכותית יכולה לאפשר לנו להשיג יותר על ידי עשיית פחות ולהימנע מכמה מהמלכודות כמו הטיית בחירה. זו בעיה גדולה מאוד כאשר מיישמים ML על מערכי נתונים מדעיים. אנחנו צריכים לעשות הרבה יותר עבודה כדי להבטיח ששיטות גנרטיביות מייצרות מדע משמעותי, לא הזיות. זה חשוב במיוחד אם הם עומדים להוות את הבסיס לדגמים גדולים שהוכשרו מראש. אבל אני חושב שזה הולך להיות עידן מרגש באמת של מדע שבו אנחנו עובדים בשיתוף פעולה עם AI, במקום שהוא רק מבצע עבורנו משימה.

בול זמן:

עוד מ עולם הפיזיקה