شبكات عصبية متفرقة توجه الفيزيائيين إلى بيانات مفيدة | مجلة كوانتا

شبكات عصبية متفرقة توجه الفيزيائيين إلى بيانات مفيدة | مجلة كوانتا

الشبكات العصبية المتفرقة توجه الفيزيائيين إلى بيانات مفيدة | مجلة كوانتا ذكاء البيانات PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

المُقدّمة

لنفترض أن لديك كتابًا مؤلفًا من ألف صفحة ، لكن كل صفحة تحتوي على سطر واحد فقط من النص. من المفترض أن تستخرج المعلومات الواردة في الكتاب باستخدام ماسح ضوئي ، فقط هذا الماسح الضوئي المعين يمر بشكل منهجي عبر كل صفحة ، ويمسح بوصة واحدة مربعة في المرة الواحدة. سيستغرق الأمر وقتًا طويلاً لتصفح الكتاب بأكمله باستخدام هذا الماسح ، وسيضيع معظم ذلك الوقت في مسح المساحة الفارغة. 

هذه هي حياة العديد من علماء الفيزياء التجريبية. في تجارب الجسيمات ، تلتقط أجهزة الكشف وتحلل كميات هائلة من البيانات ، على الرغم من أن جزءًا صغيرًا منها فقط يحتوي على معلومات مفيدة. وأوضح "في صورة ، لنقل ، طائر يحلق في السماء ، يمكن أن يكون لكل بكسل معنى" كازوهيرو تيراو، عالم فيزياء في مختبر المسرع الوطني SLAC. لكن في الصور التي ينظر إليها الفيزيائي ، غالبًا ما يكون جزء صغير منها مهمًا في الواقع. في مثل هذه الظروف ، فإن التأمل في كل التفاصيل يستهلك بلا داع الوقت والموارد الحسابية.

لكن هذا بدأ يتغير. باستخدام أداة التعلم الآلي المعروفة باسم الشبكة العصبية التلافيفية المتفرقة (SCNN) ، يمكن للباحثين التركيز على الأجزاء ذات الصلة من بياناتهم وفحص الباقي. استخدم الباحثون هذه الشبكات لتسريع قدرتهم بشكل كبير على القيام بتحليل البيانات في الوقت الفعلي. وهم يخططون لتوظيف شبكات SCNN في التجارب القادمة أو الحالية في ثلاث قارات على الأقل. يمثل التبديل تغييرًا تاريخيًا لمجتمع الفيزياء. 

قال "في الفيزياء ، نحن معتادون على تطوير خوارزمياتنا وأساليبنا الحسابية" كارلوس أرغيليس ديلجادو، عالم فيزياء في جامعة هارفارد. "لقد كنا دائمًا في طليعة التطوير ، ولكن الآن ، في النهاية الحسابية للأشياء ، غالبًا ما تقود علوم الكمبيوتر الطريق." 

شخصيات متفرقة

بدأ العمل الذي من شأنه أن يؤدي إلى شبكات SCNNs في عام 2012 ، عندما بنيامين غراهام، الذي كان وقتها في جامعة وارويك ، أراد إنشاء شبكة عصبية يمكنها التعرف على الكتابة اليدوية الصينية. 

كانت الأدوات الرئيسية في ذلك الوقت للمهام المتعلقة بالصور مثل هذه الشبكات العصبية التلافيفية (CNNs). بالنسبة لمهمة الكتابة اليدوية الصينية ، يتتبع الكاتب حرفًا على جهاز لوحي رقمي ، وينتج صورة ، على سبيل المثال ، 10,000 بكسل. ستقوم CNN بعد ذلك بتحريك شبكة 3 × 3 تسمى النواة عبر الصورة بأكملها ، مع توسيط النواة على كل بكسل على حدة. لكل موضع للنواة ، تقوم الشبكة بإجراء عملية حسابية معقدة تسمى الالتواء الذي يبحث عن السمات المميزة.

تم تصميم شبكات CNN لاستخدامها مع الصور كثيفة المعلومات مثل الصور الفوتوغرافية. لكن الصورة التي تحتوي على شخصية صينية فارغة في الغالب ؛ يشير الباحثون إلى البيانات التي تحمل هذه الخاصية على أنها بيانات متفرقة. إنها سمة مشتركة لأي شيء في العالم الطبيعي. قال غراهام: "لإعطاء مثال على مدى تناثر العالم" ، إذا كان برج إيفل محاطًا بأصغر مستطيل ممكن ، فإن هذا المستطيل سيتكون من "99.98٪ هواء و 0.02٪ فقط من الحديد".

المُقدّمة

حاول Graham تعديل نهج CNN بحيث يتم وضع النواة فقط على أقسام 3 × 3 من الصورة التي تحتوي على بكسل واحد على الأقل له قيمة غير صفرية (وليست فارغة فقط). بهذه الطريقة ، نجح في إنتاج نظام يمكنه التعرف بكفاءة على اللغة الصينية المكتوبة بخط اليد. فازت في مسابقة عام 2013 عن طريق تحديد الشخصيات الفردية بمعدل خطأ 2.61٪ فقط. (سجل البشر 4.81٪ في المتوسط). ثم حوّل انتباهه بعد ذلك إلى مشكلة أكبر: التعرف على الأشياء ثلاثية الأبعاد.

بحلول عام 2017 ، انتقل جراهام إلى Facebook AI Research وقام بتنقيح أسلوبه و نشرت ال تفاصيل بالنسبة لـ SCNN الأول ، والذي ركز النواة على وحدات البكسل التي لها قيمة غير صفرية (بدلاً من وضع النواة على أي قسم 3 × 3 يحتوي على بكسل واحد على الأقل "غير صفري"). كانت هذه الفكرة العامة التي جلبها تيراو إلى عالم فيزياء الجسيمات.

طلقات تحت الأرض

يشارك Terao في تجارب في مختبر Fermi National Accelerator Laboratory الذي يبحث في طبيعة النيوترينوات ، من بين أكثر الجسيمات الأولية المعروفة مراوغة. إنها أيضًا أكثر الجسيمات وفرة في الكون من حيث الكتلة (وإن لم يكن كثيرًا) ، لكنها نادرًا ما تظهر داخل الكاشف. ونتيجة لذلك ، فإن معظم البيانات الخاصة بتجارب النيوترينو متناثرة ، وكان تيراو يبحث باستمرار عن طرق أفضل لتحليل البيانات. وجد واحدة في SCNNs.

في عام 2019 ، قام بتطبيق SCNNs على عمليات محاكاة البيانات المتوقعة من Deep Underground Neutrino Experiment ، أو DUNE ، والتي ستكون أكبر تجربة فيزياء النيوترينو في العالم عندما يتم تشغيلها على الإنترنت في عام 2026. سيطلق المشروع النيوترينوات من Fermilab ، خارج شيكاغو مباشرةً ، عبر 800 ميل من الأرض إلى مختبر تحت الأرض في ساوث داكوتا. على طول الطريق ، سوف "تتأرجح" الجسيمات بين الأنواع الثلاثة المعروفة من النيوترينوات ، وقد تكشف هذه التذبذبات عن خصائص نيوترينو مفصلة.

حللت شبكات SCNN البيانات المحاكاة بشكل أسرع من الطرق العادية ، وتطلبت قدرة حسابية أقل بكثير في القيام بذلك. تعني النتائج الواعدة أنه من المحتمل استخدام شبكات SCNN أثناء التشغيل التجريبي الفعلي.

وفي الوقت نفسه ، في عام 2021 ، ساعد Terao في إضافة SCNNs إلى تجربة نيوترينو أخرى في Fermilab تُعرف باسم MicroBooNE. هنا ، ينظر العلماء إلى آثار الاصطدامات بين النيوترينوات ونواة ذرات الأرجون. من خلال فحص المسارات التي أنشأتها هذه التفاعلات ، يمكن للباحثين استنتاج تفاصيل حول النيوترينوات الأصلية. للقيام بذلك ، يحتاجون إلى خوارزمية يمكنها النظر إلى البيكسلات (أو تقنيًا ، نظائرها ثلاثية الأبعاد تسمى voxels) في تمثيل ثلاثي الأبعاد للكاشف ثم تحديد البكسلات المرتبطة بمسارات الجسيمات.

نظرًا لأن البيانات متناثرة جدًا - تناثر خطوط صغيرة داخل كاشف كبير (حوالي 170 طنًا من الأرجون السائل) - تعد شبكات SCNN مثالية تقريبًا لهذه المهمة. وقال تيراو إنه باستخدام شبكة CNN القياسية ، يجب تقسيم الصورة إلى 50 قطعة ، بسبب كل العمليات الحسابية التي يتعين القيام بها. "باستخدام شبكة CNN قليلة العدد ، نقوم بتحليل الصورة بأكملها مرة واحدة - ونقوم بذلك بشكل أسرع."

مشغلات في الوقت المناسب

أحد الباحثين الذين عملوا في MicroBooNE كان متدربًا جامعيًا اسمه فيليكس يو. نظرًا لإعجابه بقوة وكفاءة شبكات SCNN ، أحضر الأدوات معه إلى مكان عمله التالي كطالب دراسات عليا في مختبر أبحاث بجامعة هارفارد مرتبط رسميًا بمرصد IceCube Neutrino في القطب الجنوبي.

أحد الأهداف الرئيسية للمرصد هو اعتراض النيوترينوات الأكثر نشاطًا في الكون وتعقبها إلى مصادرها ، والتي يقع معظمها خارج مجرتنا. يتألف الكاشف من 5,160 مستشعرًا ضوئيًا مدفونًا في جليد أنتاركتيكا ، ولا يضيء سوى جزء ضئيل منها في أي وقت. تبقى بقية المصفوفة مظلمة وليست مفيدة بشكل خاص. والأسوأ من ذلك ، أن العديد من "الأحداث" التي تسجلها أجهزة الكشف هي نتائج إيجابية خاطئة وليست مفيدة في البحث عن النيوترينو. فقط ما يسمى بالأحداث على مستوى الزناد هي التي تقوم بإجراء مزيد من التحليل ، ويجب اتخاذ قرارات فورية بشأن أي منها يستحق هذا التعيين وأيها سيتم تجاهله بشكل دائم.

شبكات CNN القياسية بطيئة جدًا بالنسبة لهذه المهمة ، لذلك اعتمد علماء IceCube منذ فترة طويلة على خوارزمية تسمى LineFit لإخبارهم عن الاكتشافات التي يحتمل أن تكون مفيدة. قال يو ، لكن هذه الخوارزمية غير موثوقة ، "مما يعني أننا قد نفقد أحداثًا مثيرة للاهتمام." مرة أخرى ، إنها بيئة بيانات متفرقة مناسبة بشكل مثالي لـ SCNN.

حدد يو - جنبًا إلى جنب مع Argüelles-Delgado ، مستشار الدكتوراه الخاص به ، وجيف لازار ، طالب الدراسات العليا في جامعة ويسكونسن ، ماديسون - هذه الميزة ، وظهرت في ورقة حديثة أن هذه الشبكات ستكون أسرع بحوالي 20 مرة من شبكات CNN النموذجية. قال لازار: "هذه السرعة كافية للتشغيل في كل حدث يخرج من الكاشف" ، حوالي 3,000 مرة كل ثانية. "هذا يمكننا من اتخاذ قرارات أفضل بشأن ما يجب التخلص منه وما يجب الاحتفاظ به."

المُقدّمة

استخدم المؤلفون أيضًا SCNN بنجاح في محاكاة باستخدام بيانات IceCube الرسمية ، والخطوة التالية هي اختبار نظامهم على نسخة طبق الأصل من نظام الحوسبة في القطب الجنوبي. إذا سارت الأمور على ما يرام ، تعتقد Argüelles-Delgado أنه يجب تثبيت نظامهم في مرصد القطب الجنوبي العام المقبل. لكن التكنولوجيا يمكن أن تشهد استخدامًا أوسع. قالت Argüelles-Delgado: "نعتقد أن [شبكات SCNN يمكن أن تفيد] جميع تلسكوبات النيوترينو ، وليس فقط IceCube".

ما وراء النيوترينوات

يأمل فيليب هاريس ، الفيزيائي في معهد ماساتشوستس للتكنولوجيا ، أن تساعد شبكات SCNN في أكبر مصادم للجسيمات على الإطلاق: مصادم الهادرونات الكبير (LHC) في CERN. سمع هاريس عن هذا النوع من الشبكات العصبية من زميل معهد ماساتشوستس للتكنولوجيا ، عالم الكمبيوتر سونغ هان. قال هاريس: "سونغ خبير في جعل الخوارزميات سريعة وفعالة" - وهو مثالي لمصادم الهادرونات الكبير ، حيث يحدث 40 مليون تصادم كل ثانية.

عندما تحدثوا قبل عامين ، أخبر سونغ هاريس عن مشروع مركبة ذاتية القيادة كان يتابعه مع أعضاء معمله. كان فريق Song يستخدم شبكات SCNN لتحليل خرائط الليزر ثلاثية الأبعاد للمساحة أمام السيارة ، والكثير منها فارغ ، لمعرفة ما إذا كانت هناك أي عوائق أمام السيارة.

يواجه هاريس وزملاؤه تحديات مماثلة في مصادم الهادرونات الكبير. عندما يصطدم بروتونان داخل الجهاز ، يؤدي الاصطدام إلى تكوين كرة متوسعة مصنوعة من الجسيمات. عندما يصطدم أحد هذه الجسيمات بالمجمع ، يحدث دش ثانوي للجسيمات. قال هاريس: "إذا كان بإمكانك تحديد المدى الكامل لهذا الدش ، فيمكنك تحديد طاقة الجسيم التي أدت إلى نشأته" ، والتي قد تكون موضع اهتمام خاص - شيء مثل بوزون هيغز ، اكتشف في عام 2012 ، أو جسيم المادة المظلمة ، الذي لا يزال علماء الفيزياء يبحثون عنه.

قال هاريس: "إن المشكلة التي نحاول حلها تكمن في ربط النقاط" ، تمامًا كما يمكن لسيارة ذاتية القيادة أن تربط نقاط خريطة الليزر لاكتشاف العائق.

قال هاريس إن شبكات SCNN ستسرع من تحليل البيانات في LHC بعامل 50 على الأقل. "هدفنا النهائي هو إدخال [شبكات SCNN] في الكاشف" - وهي مهمة ستستغرق عامًا على الأقل من الأعمال الورقية واشتراكًا إضافيًا من المجتمع. لكنه وزملاؤه متفائلون.

إجمالاً ، من المرجح بشكل متزايد أن شبكات SCNN - وهي فكرة تم تصورها في الأصل في عالم علوم الكمبيوتر - ستلعب قريبًا دورًا في أكبر التجارب التي أجريت على الإطلاق في فيزياء النيوترينو (DUNE) وعلم فلك النيوترينو (IceCube) وفيزياء الطاقة العالية (LHC) .

قال جراهام إنه فوجئ بسرور عندما علم أن شبكات SCNN قد شق طريقها إلى فيزياء الجسيمات ، على الرغم من أنه لم يُصدم تمامًا. قال: "بالمعنى المجرد ، فإن حركة الجسيم في الفضاء تشبه إلى حد ما طرف القلم الذي يتحرك على قطعة من الورق".

الطابع الزمني:

اكثر من كوانتماجازين