רשתות עצביות דלילות מכוונות פיזיקאים לנתונים שימושיים | מגזין קוונטה

רשתות עצביות דלילות מכוונות פיזיקאים לנתונים שימושיים | מגזין קוונטה

רשתות עצביות דלילות מכוונות פיזיקאים לנתונים שימושיים | Quanta Magazine PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

מבוא

נניח שיש לך ספר בן אלף עמודים, אבל בכל עמוד יש רק שורת טקסט בודדת. אתה אמור לחלץ את המידע הכלול בספר באמצעות סורק, רק הסורק המסוים הזה עובר באופן שיטתי על כל עמוד ועמוד, סורק אינץ' מרובע בכל פעם. ייקח לך הרבה זמן לעבור על כל הספר עם הסורק הזה, ורוב הזמן הזה יתבזבז על סריקת שטח ריק. 

כאלה הם החיים של הרבה פיזיקאים ניסויים. בניסויים בחלקיקים, גלאים לוכדים ומנתחים כמויות אדירות של נתונים, למרות שרק חלק זעיר מהם מכיל מידע שימושי. "בתצלום של, נניח, ציפור עפה בשמיים, כל פיקסל יכול להיות בעל משמעות", הסביר Kazuhiro Terao, פיזיקאי במעבדת האצה הלאומית של SLAC. אבל בתמונות שהפיזיקאי מסתכל בהן, לעתים קרובות רק חלק קטן מהן באמת משנה. בנסיבות כאלה, חקירה בכל פרט גוזלת זמן ומשאבים חישוביים שלא לצורך.

אבל זה מתחיל להשתנות. בעזרת כלי למידת מכונה המכונה רשת עצבית קונבולוציונית דלילה (SCNN), החוקרים יכולים להתמקד בחלקים הרלוונטיים של הנתונים שלהם ולסנן את השאר. חוקרים השתמשו ברשתות אלו כדי להאיץ במידה ניכרת את יכולתם לבצע ניתוח נתונים בזמן אמת. והם מתכננים להעסיק SCNN בניסויים הקרובים או הקיימים לפחות בשלוש יבשות. הבורר מסמן שינוי היסטורי עבור קהילת הפיזיקה. 

"בפיסיקה, אנחנו רגילים לפתח אלגוריתמים וגישות חישוביות משלנו", אמר קרלוס ארגולס-דלגאדו, פיזיקאי באוניברסיטת הרווארד. "תמיד היינו בחזית הפיתוח, אבל עכשיו, בקצה החישובי של הדברים, מדעי המחשב מובילים לעתים קרובות את הדרך." 

דמויות דלילות

העבודה שתוביל ל-SCNN החלה ב-2012, אז בנג 'מין גרהם, אז באוניברסיטת וורוויק, רצה ליצור רשת נוירונים שתוכל לזהות כתב יד סיני. 

הכלים המובילים באותה תקופה למשימות הקשורות לתמונה כמו זה היו רשתות עצביות קונבולוציוניות (CNNs). עבור משימת כתב היד הסיני, סופר היה מתחקה אחר דמות בטאבלט דיגיטלי, ומייצר תמונה של, נניח, 10,000 פיקסלים. לאחר מכן, ה-CNN יעביר רשת של 3 על 3 הנקראת קרנל על פני כל התמונה, ומרכז את הליבה על כל פיקסל בנפרד. עבור כל מיקום של הליבה, הרשת תבצע חישוב מתמטי מסובך שנקרא קונבולציה שחיפשה מאפיינים מבדילים.

מכשירי CNN תוכננו לשימוש עם תמונות צפופות מידע כגון תצלומים. אבל תמונה המכילה תו סיני היא ריקה ברובה; חוקרים מתייחסים לנתונים עם מאפיין זה כדלים. זה מאפיין נפוץ של כל דבר בעולם הטבע. "כדי לתת דוגמה עד כמה העולם יכול להיות דליל", אמר גרהם, אם מגדל אייפל היה עטוף במלבן הקטן ביותר האפשרי, המלבן הזה היה מורכב מ"99.98% אוויר ורק 0.02% ברזל".

מבוא

גרהם ניסה לשנות את גישת ה-CNN כך שהקרנל ימוקם רק על קטעים של 3 על 3 של התמונה המכילים לפחות פיקסל אחד שיש לו ערך שאינו אפס (ולא רק ריק). בדרך זו, הוא הצליח לייצר מערכת שיכולה לזהות ביעילות סינית בכתב יד. הוא זכה בתחרות של 2013 על ידי זיהוי תווים בודדים עם שיעור שגיאה של 2.61% בלבד. (בני אדם קיבלו ציון של 4.81% בממוצע.) לאחר מכן הפנה את תשומת לבו לבעיה גדולה עוד יותר: זיהוי אובייקט תלת מימדי.

עד 2017, גרהם עבר ל-Facebook AI Research ושכלל עוד יותר את הטכניקה שלו לאור מה היא פרטים עבור ה-SCNN הראשון, שמרכז את הליבה רק על פיקסלים בעלי ערך שאינו אפס (במקום למקם את הליבה על כל מקטע של 3 על 3 שיש לו לפחות פיקסל "שלא אפס" אחד). זה היה הרעיון הכללי הזה שטראו הביא לעולם הפיזיקה של החלקיקים.

צילומי מחתרת

Terao מעורב בניסויים במעבדת האקסלרטור הלאומית של פרמי שחוקרים את טבעם של הנייטרינו, בין החלקיקים היסודיים החמקמקים ביותר הידועים. הם גם החלקיקים הנפוצים ביותר ביקום עם מסה (אם כי לא הרבה), אך לעתים רחוקות הם מופיעים בתוך גלאי. כתוצאה מכך, רוב הנתונים עבור ניסויי נייטרינו דלילים, וטראו חיפש כל הזמן גישות טובות יותר לניתוח נתונים. הוא מצא אחד ב-SCNNs.

בשנת 2019, הוא יישם SCNNs על סימולציות של הנתונים הצפויים מניסוי הניטרינו העמוק מתחת לאדמה, או DUNE, שיהיה הניסוי הגדול בעולם בפיזיקת הניטרינו כשיגיע לאינטרנט בשנת 2026. הפרויקט יצלם ניטרינו מפרמילב, ממש מחוץ לשיקגו. דרך 800 מייל של כדור הארץ למעבדה תת קרקעית בדרום דקוטה. לאורך הדרך, החלקיקים "יתנדנדו" בין שלושת סוגי הנייטרינו הידועים, ותנודות אלו עשויות לחשוף תכונות ניוטרינו מפורטות.

ה-SCNNs ניתחו את הנתונים המדומים מהר יותר משיטות רגילות, ודרשו פחות כוח חישובי בכך. התוצאות המבטיחות אומרות שסביר להניח ש-SCNNs ישמשו במהלך הריצה הניסויית בפועל.

ב-2021, בינתיים, Terao עזר להוסיף SCNNs לניסוי נייטרינו נוסף ב-Fermilab הידוע בשם MicroBooNE. כאן, מדענים מסתכלים על ההשלכות של התנגשויות בין ניטרינו וגרעינים של אטומי ארגון. על ידי בחינת המסלולים שנוצרו על ידי אינטראקציות אלה, החוקרים יכולים להסיק פרטים על הנייטרינו המקוריים. לשם כך, הם צריכים אלגוריתם שיכול להסתכל על הפיקסלים (או, טכנית, עמיתיהם התלת מימדיים הנקראים ווקסלים) בייצוג תלת מימדי של הגלאי ואז לקבוע אילו פיקסלים משויכים לאיזה מסלולי חלקיקים.

מכיוון שהנתונים כל כך דלים - פיצוץ של קווים זעירים בתוך גלאי גדול (כ-170 טון של ארגון נוזלי) - SCNNs הם כמעט מושלמים למשימה זו. עם CNN סטנדרטי, התמונה תצטרך להתפרק ל-50 חלקים, בגלל כל החישוב שצריך לעשות, אמר טראו. "עם CNN דליל, אנחנו מנתחים את כל התמונה בבת אחת - ועושים את זה הרבה יותר מהר."

טריגרים בזמן

אחד החוקרים שעבדו על MicroBooNE היה מתמחה לתואר ראשון בשם פליקס יו. התרשם מהעוצמה והיעילות של SCNNs, הוא הביא איתו את הכלים למקום העבודה הבא שלו כסטודנט לתואר שני במעבדת מחקר של הרווארד הקשורה רשמית למצפה הניוטרינו IceCube בקוטב הדרומי.

אחת המטרות המרכזיות של מצפה הכוכבים היא ליירט את הנייטרינים האנרגטיים ביותר ביקום ולהתחקות אחריהם למקורותיהם, שרובם נמצאים מחוץ לגלקסיה שלנו. הגלאי מורכב מ-5,160 חיישנים אופטיים קבורים בקרח האנטארקטי, שרק חלק זעיר מהם נדלקים בכל זמן נתון. שאר המערך נותר חשוך ואינו אינפורמטיבי במיוחד. גרוע מכך, רבים מה"אירועים" שהגלאים מתעדים הם חיוביות שגויות ואינם שימושיים לציד נייטרינו. רק אירועים שנקראים ברמת טריגר עושים את הקיצוץ לניתוח נוסף, וצריך לקבל החלטות מיידיות לגבי אילו מהם ראויים לייעוד זה ומאילו יתעלמו לצמיתות.

רשתות CNN סטנדרטיות איטיות מדי למשימה זו, אז מדעני IceCube הסתמכו זה מכבר על אלגוריתם בשם LineFit כדי לספר להם על זיהויים שעלולים להיות שימושיים. אבל האלגוריתם הזה אינו אמין, אמר יו, "מה שאומר שאנחנו עלולים להחמיץ אירועים מעניינים". שוב, זוהי סביבת נתונים דלילה המתאימה באופן אידיאלי ל-SCNN.

יו - יחד עם ארגולס-דלגאדו, יועצו לדוקטורט, וג'ף לזר, סטודנט לתואר שני באוניברסיטת ויסקונסין, מדיסון - כימתו את היתרון הזה, והראו ב מאמר שפורסם לאחרונה שהרשתות הללו יהיו מהירות פי 20 בערך מרשתות CNN טיפוסיות. "זה מהיר מספיק כדי לרוץ על כל אירוע שיוצא מהגלאי," כ-3,000 בכל שנייה, אמר לזר. "זה מאפשר לנו לקבל החלטות טובות יותר לגבי מה לזרוק ומה לשמור."

מבוא

המחברים גם השתמשו בהצלחה ב-SCNN בסימולציה באמצעות נתונים רשמיים של IceCube, והשלב הבא הוא לבדוק את המערכת שלהם על העתק של מערכת המחשוב בקוטב הדרומי. אם הכל ילך כשורה, ארגולס-דלגאדו מאמין שהם צריכים להתקין את המערכת שלהם במצפה הכוכבים באנטארקטיקה בשנה הבאה. אבל הטכנולוגיה יכולה לראות שימוש רחב עוד יותר. "אנחנו חושבים ש[SCNNs יכולים להועיל] לכל טלסקופי הניטרינו, לא רק עם IceCube", אמר ארגולס-דלגאדו.

מעבר לנייטרינו

פיליפ האריס, פיזיקאי במכון הטכנולוגי של מסצ'וסטס, מקווה ש-SCNNs יוכלו לעזור במתנגש החלקיקים הגדול מכולם: מאיץ ההדרונים הגדול (LHC) ב-CERN. האריס שמע על סוג זה של רשת עצבית מעמית MIT, מדען המחשב סונג האן. "שיר הוא מומחה להפיכת אלגוריתמים למהירים ויעילים", אמר האריס - מושלם עבור ה-LHC, שבו מתרחשות 40 מיליון התנגשויות בכל שנייה.

כשדיברו לפני כמה שנים, סונג סיפר להריס על פרויקט רכב אוטונומי שהוא ממשיך עם חברי המעבדה שלו. הצוות של סונג השתמש ב-SCNN כדי לנתח מפות לייזר תלת-ממדיות של החלל שלפני הרכב, שחלק גדול מהם ריק, כדי לראות אם קיימות מכשולים כלשהם.

האריס ועמיתיו מתמודדים עם אתגרים דומים ב-LHC. כאשר שני פרוטונים מתנגשים בתוך המכונה, ההתרסקות יוצרת כדור מתרחב העשוי מחלקיקים. כאשר אחד מהחלקיקים הללו פוגע בקולט, מתרחשת מקלחת חלקיקים משנית. "אם אתה יכול למפות את מלוא היקף הגשם הזה," אמר האריס, "תוכל לקבוע את האנרגיה של החלקיק שהוליד אותו", שעשוי להיות מושא לעניין מיוחד - משהו כמו בוזון היגס, שפיזיקאים התגלה ב-2012, או חלקיק חומר אפל, שפיזיקאים עדיין מחפשים.

"הבעיה שאנו מנסים לפתור מסתכמת בחיבור הנקודות", אמר האריס, בדיוק כפי שמכונית בנהיגה עצמית עשויה לחבר את הנקודות של מפת לייזר כדי לזהות חסימה.

SCNNs יאיץ את ניתוח הנתונים ב-LHC לפחות בפקטור של 50, אמר האריס. "המטרה הסופית שלנו היא להכניס [SCNNs] לגלאי" - משימה שתיקח לפחות שנה של ניירת ורכישה נוספת מהקהילה. אבל הוא ועמיתיו מלאי תקווה.

בסך הכל, סביר יותר ויותר ש-SCNNs - רעיון שנוצר במקור בעולם מדעי המחשב - ישחקו בקרוב תפקיד בניסויים הגדולים ביותר שנערכו אי פעם בפיזיקה של נייטרינו (DUNE), אסטרונומיה נייטרינו (IceCube) ופיזיקה של אנרגיה גבוהה (ה-LHC) .

גרהם אמר שהוא הופתע לטובה לגלות ש-SCNN עשו את דרכם לפיזיקת חלקיקים, למרות שהוא לא היה בהלם לחלוטין. "במובן מופשט", אמר, "חלקיק שנע בחלל הוא קצת כמו קצה עט שנע על פיסת נייר."

בול זמן:

עוד מ קוונטמגזין