شبکه های عصبی پراکنده فیزیکدانان را به داده های مفید راهنمایی می کنند | مجله کوانتا

شبکه های عصبی پراکنده فیزیکدانان را به داده های مفید راهنمایی می کنند | مجله کوانتا

Sparse Neural Networks Point Physicists to Useful Data | Quanta Magazine PlatoBlockchain Data Intelligence. Vertical Search. Ai.

معرفی

فرض کنید یک کتاب هزار صفحه ای دارید، اما هر صفحه فقط یک خط متن دارد. شما قرار است اطلاعات موجود در کتاب را با استفاده از یک اسکنر استخراج کنید، فقط این اسکنر خاص به طور سیستماتیک از هر صفحه عبور می کند و هر بار یک اینچ مربع را اسکن می کند. زمان زیادی طول می کشد تا کل کتاب را با آن اسکنر مرور کنید، و بیشتر آن زمان صرف اسکن فضای خالی می شود. 

زندگی بسیاری از فیزیکدانان تجربی چنین است. در آزمایش‌های ذرات، آشکارسازها مقادیر زیادی از داده‌ها را ضبط و تجزیه و تحلیل می‌کنند، حتی اگر تنها بخش کوچکی از آن حاوی اطلاعات مفیدی باشد. توضیح داد: «مثلاً در عکسی از پرنده‌ای که در آسمان پرواز می‌کند، هر پیکسل می‌تواند معنادار باشد». کازوهیرو ترائو، فیزیکدان آزمایشگاه ملی شتاب دهنده SLAC. اما در تصاویری که یک فیزیکدان به آنها نگاه می کند، اغلب تنها بخش کوچکی از آن واقعاً اهمیت دارد. در چنین شرایطی، بررسی هر جزئیات بیهوده زمان و منابع محاسباتی را مصرف می کند.

اما این در حال تغییر است. با ابزار یادگیری ماشینی که به عنوان شبکه عصبی کانولوشنال پراکنده (SCNN) شناخته می‌شود، محققان می‌توانند روی بخش‌های مربوطه از داده‌های خود تمرکز کرده و بقیه را بررسی کنند. محققان از این شبکه‌ها برای سرعت بخشیدن به توانایی آن‌ها برای تجزیه و تحلیل داده‌ها در زمان واقعی استفاده کرده‌اند. و آنها قصد دارند از SCNN ها در آزمایش های آتی یا موجود در حداقل سه قاره استفاده کنند. این سوئیچ یک تغییر تاریخی را برای جامعه فیزیک نشان می دهد. 

گفت: "در فیزیک، ما به توسعه الگوریتم ها و رویکردهای محاسباتی خود عادت کرده ایم." کارلوس آرگوئلز-دلگادو، فیزیکدان دانشگاه هاروارد. ما همیشه در خط مقدم توسعه بوده‌ایم، اما اکنون، در پایان محاسباتی، علم کامپیوتر اغلب پیشرو است.» 

شخصیت های پراکنده

کاری که منجر به SCNN ها می شود در سال 2012 آغاز شد، زمانی که بنجامین گراهام، سپس در دانشگاه وارویک، می خواست یک شبکه عصبی بسازد که بتواند دست خط چینی را تشخیص دهد. 

ابزارهای برتر در آن زمان برای کارهای مرتبط با تصویر مانند این شبکه‌های عصبی کانولوشنال (CNN) بودند. برای کار دست‌نویسی چینی، یک نویسنده یک شخصیت را روی یک تبلت دیجیتال ردیابی می‌کند و تصویری مثلاً 10,000 پیکسلی تولید می‌کند. سپس CNN یک شبکه 3 در 3 به نام کرنل را در کل تصویر جابجا می کند و هسته را روی هر پیکسل جداگانه متمرکز می کند. برای هر قرار دادن هسته، شبکه یک محاسبات ریاضی پیچیده به نام کانولوشن را انجام می دهد که به دنبال ویژگی های متمایز است.

سی‌ان‌ان‌ها برای استفاده با تصاویر متراکم اطلاعاتی مانند عکس‌ها طراحی شده‌اند. اما یک تصویر حاوی یک کاراکتر چینی عمدتا خالی است. محققان داده‌های دارای این ویژگی را پراکنده می‌دانند. این ویژگی مشترک هر چیزی در دنیای طبیعی است. گراهام گفت: «برای مثالی از اینکه جهان چقدر می‌تواند پراکنده باشد، اگر برج ایفل در کوچک‌ترین مستطیل ممکن قرار می‌گرفت، آن مستطیل از «99.98 درصد هوا و فقط 0.02 درصد آهن» تشکیل می‌شد.

معرفی

گراهام سعی کرد رویکرد CNN را به گونه‌ای تغییر دهد که هسته فقط در بخش‌های 3 در 3 از تصویر قرار گیرد که حاوی حداقل یک پیکسل است که دارای ارزش غیر صفر است (و فقط خالی نیست). به این ترتیب او موفق شد سیستمی تولید کند که بتواند چینی های دست نویس را به طور موثر شناسایی کند. با شناسایی کاراکترهای منفرد با نرخ خطای تنها 2013 درصد در رقابتی در سال 2.61 برنده شد. (انسانها به طور متوسط ​​4.81 درصد امتیاز گرفتند.) سپس توجه خود را به یک مشکل بزرگتر معطوف کرد: تشخیص سه بعدی اشیا.

تا سال 2017، گراهام به تحقیقات هوش مصنوعی فیسبوک نقل مکان کرد و تکنیک خود را بیشتر اصلاح کرد منتشر شده la جزئیات برای اولین SCNN، که هسته را فقط بر روی پیکسل هایی متمرکز کرد که دارای مقدار غیر صفر بودند (به جای قرار دادن هسته روی هر بخش 3 در 3 که حداقل یک پیکسل "غیر صفر" داشت). این ایده کلی بود که Terao به دنیای فیزیک ذرات آورد.

عکس های زیرزمینی

Terao با آزمایش‌هایی در آزمایشگاه شتاب‌دهنده ملی فرمی که ماهیت نوترینوها را در میان گریزان‌ترین ذرات بنیادی شناخته شده بررسی می‌کند، درگیر است. آنها همچنین فراوان ترین ذرات جهان با جرم هستند (البته نه زیاد)، اما به ندرت در داخل یک آشکارساز ظاهر می شوند. در نتیجه، بیشتر داده‌های آزمایش‌های نوترینو پراکنده هستند و Terao دائماً به دنبال رویکردهای بهتر برای تجزیه و تحلیل داده‌ها بود. او یکی را در SCNN ها پیدا کرد.

در سال 2019، او از SCNN برای شبیه‌سازی داده‌های مورد انتظار از آزمایش نوترینویی زیرزمینی یا DUNE استفاده کرد، آزمایشی که در سال 2026 بزرگترین آزمایش فیزیک نوترینو در جهان خواهد بود. از طریق 800 مایل زمین به آزمایشگاه زیرزمینی در داکوتای جنوبی. در طول مسیر، ذرات بین سه نوع شناخته شده نوترینو "نوسان می‌کنند" و این نوسانات ممکن است ویژگی‌های دقیق نوترینو را نشان دهد.

SCNNها داده های شبیه سازی شده را سریعتر از روش های معمولی تجزیه و تحلیل کردند و برای انجام این کار به توان محاسباتی بسیار کمتری نیاز داشتند. نتایج امیدوارکننده به این معنی است که احتمالاً SCNN ها در طول اجرای آزمایشی واقعی مورد استفاده قرار خواهند گرفت.

در همین حال، در سال 2021، Terao به اضافه کردن SCNN به آزمایش نوترینو دیگری در Fermilab به نام MicroBooNE کمک کرد. در اینجا، دانشمندان به عواقب برخورد بین نوترینوها و هسته‌های اتم‌های آرگون نگاه می‌کنند. با بررسی مسیرهای ایجاد شده توسط این فعل و انفعالات، محققان می توانند جزئیاتی را در مورد نوترینوهای اصلی استنباط کنند. برای انجام این کار، آنها به الگوریتمی نیاز دارند که بتواند پیکسل ها (یا از نظر فنی، همتایان سه بعدی آنها به نام وکسل) را در یک نمایش سه بعدی آشکارساز نگاه کند و سپس تعیین کند که کدام پیکسل با کدام مسیر ذرات مرتبط است.

از آنجایی که داده ها بسیار پراکنده هستند - انباشته شدن خطوط کوچک در یک آشکارساز بزرگ (تقریباً 170 تن آرگون مایع) - SCNN تقریباً برای این کار عالی هستند. Terao گفت، با یک CNN استاندارد، تصویر باید به 50 قطعه تقسیم شود، زیرا تمام محاسباتی که باید انجام شود. "با یک CNN پراکنده، ما کل تصویر را به یکباره تجزیه و تحلیل می کنیم - و آن را بسیار سریعتر انجام می دهیم."

محرک های به موقع

یکی از محققانی که روی MicroBooNE کار می‌کرد، یک کارآموز در مقطع کارشناسی به نام فلیکس یو بود. او که تحت تأثیر قدرت و کارایی SCNN ها قرار گرفته بود، ابزارها را به عنوان دانشجوی کارشناسی ارشد در آزمایشگاه تحقیقاتی هاروارد که به طور رسمی به رصدخانه نوترینوهای IceCube در قطب جنوب وابسته بود، با خود به محل کار بعدی خود آورد.

یکی از اهداف کلیدی رصدخانه رهگیری پرانرژی ترین نوترینوهای جهان و ردیابی آنها به منابعشان است که بیشتر آنها خارج از کهکشان ما قرار دارند. این آشکارساز متشکل از 5,160 حسگر نوری است که در یخ های قطب جنوب مدفون شده اند که تنها بخش کوچکی از آنها در هر لحظه روشن می شوند. بقیه آرایه تاریک باقی می ماند و به خصوص آموزنده نیست. بدتر از آن، بسیاری از "رویدادهایی" که آشکارسازها ثبت می کنند، مثبت کاذب هستند و برای شکار نوترینو مفید نیستند. فقط رویدادهای به اصطلاح سطح ماشه باعث تجزیه و تحلیل بیشتر می شوند و باید تصمیمات فوری اتخاذ شود که کدام یک شایسته آن نامگذاری هستند و کدام یک برای همیشه نادیده گرفته می شوند.

CNN های استاندارد برای این کار بسیار کند هستند، بنابراین دانشمندان IceCube مدت‌هاست که بر الگوریتمی به نام LineFit تکیه کرده‌اند تا در مورد تشخیص‌های مفید بالقوه به آنها اطلاع دهند. یو گفت، اما این الگوریتم غیرقابل اعتماد است، "به این معنی که ممکن است رویدادهای جالبی را از دست بدهیم." باز هم، این یک محیط داده پراکنده است که برای یک SCNN مناسب است.

یو - به همراه آرگوئلز-دلگادو، مشاور دکتری خود، و جف لازار، دانشجوی کارشناسی ارشد در دانشگاه ویسکانسین، مدیسون - این مزیت را کمی کردند و نشان دادند که در یک مقاله اخیر که این شبکه ها حدود 20 برابر سریعتر از CNN های معمولی خواهند بود. لازار گفت: «این به اندازه‌ای سریع است که روی هر رویدادی که از آشکارساز بیرون می‌آید اجرا شود،» حدود 3,000 در هر ثانیه. این به ما امکان می‌دهد در مورد اینکه چه چیزی را دور بریزیم و چه چیزی را نگه داریم، بهتر تصمیم بگیریم.»

معرفی

نویسندگان همچنین با موفقیت از یک SCNN در شبیه‌سازی با استفاده از داده‌های رسمی IceCube استفاده کرده‌اند و گام بعدی آزمایش سیستم خود بر روی نمونه‌ای از سیستم محاسباتی قطب جنوب است. اگر همه چیز خوب پیش برود، Argüelles-Delgado معتقد است که آنها باید سال آینده سیستم خود را در رصدخانه قطب جنوب نصب کنند. اما این فناوری حتی می تواند کاربرد گسترده تری داشته باشد. آرگوئل-دلگادو گفت: «ما فکر می کنیم که [SCNN ها می توانند] برای همه تلسکوپ های نوترینو، نه فقط IceCube، مفید باشند.

فراتر از نوترینوها

فیلیپ هریس، فیزیکدان مؤسسه فناوری ماساچوست، امیدوار است که SCNN ها بتوانند به بزرگترین برخورد دهنده ذرات از همه آنها کمک کنند: برخورد دهنده بزرگ هادرون (LHC) در سرن. هریس در مورد این نوع شبکه عصبی از یکی از همکاران MIT، دانشمند کامپیوتر سونگ هان، شنید. هریس گفت: "Song در ساخت الگوریتم‌ها سریع و کارآمد متخصص است.

هنگامی که آنها چند سال پیش صحبت کردند، سونگ به هریس درباره یک پروژه خودروی خودمختار گفت که او با اعضای آزمایشگاهش دنبال می کرد. تیم سانگ از SCNN برای تجزیه و تحلیل نقشه های لیزری سه بعدی از فضای جلوی وسیله نقلیه که بیشتر آن خالی است استفاده می کرد تا ببیند آیا موانعی در پیش رو وجود دارد یا خیر.

هریس و همکارانش با چالش های مشابهی در LHC روبرو هستند. هنگامی که دو پروتون در داخل دستگاه برخورد می کنند، تصادف یک کره در حال انبساط ایجاد می کند که از ذرات تشکیل شده است. هنگامی که یکی از این ذرات به کلکتور برخورد می کند، بارش ذرات ثانویه رخ می دهد. هریس گفت: «اگر بتوانید وسعت کامل این باران را ترسیم کنید، می‌توانید انرژی ذره‌ای را که باعث پیدایش آن شده است، تعیین کنید، که ممکن است یک شی مورد توجه خاص باشد - چیزی مانند بوزون هیگز، که فیزیکدانان آن را می‌گویند. کشف شده در سال 2012، یا یک ذره ماده تاریک، که فیزیکدانان هنوز در جستجوی آن هستند.

هریس گفت: «مشکلی که ما در تلاش برای حل آن هستیم به اتصال نقاط مربوط می شود، همانطور که یک ماشین خودران ممکن است نقاط یک نقشه لیزری را برای تشخیص یک مانع به هم متصل کند.

هریس گفت که SCNN ها تجزیه و تحلیل داده ها را در LHC حداقل تا 50 ضریب سرعت می بخشند. "هدف نهایی ما این است که [SCNN] را وارد آشکارساز کنیم" - کاری که حداقل یک سال کاغذبازی و خرید اضافی از طرف جامعه طول خواهد کشید. اما او و همکارانش امیدوار هستند.

در مجموع، به طور فزاینده‌ای محتمل است که SCNNها - ایده‌ای که در ابتدا در دنیای علوم رایانه مطرح شد - به زودی در بزرگترین آزمایش‌های انجام شده در فیزیک نوترینو (DUNE)، اخترشناسی نوترینو (IceCube) و فیزیک با انرژی بالا (LHC) نقشی ایفا کنند. .

گراهام گفت که از شنیدن اینکه SCNN ها به فیزیک ذرات راه پیدا کرده اند بسیار شگفت زده شد، هرچند که کاملاً شوکه نشد. او گفت: «به معنای انتزاعی، ذره‌ای که در فضا حرکت می‌کند کمی شبیه نوک قلمی است که روی یک تکه کاغذ حرکت می‌کند.»

تمبر زمان:

بیشتر از مجله کوانتاما