تفريغ "الصندوق الأسود" لبناء نماذج ذكاء اصطناعي أفضل

تفريغ "الصندوق الأسود" لبناء نماذج ذكاء اصطناعي أفضل

تفريغ "الصندوق الأسود" لبناء نماذج أفضل للذكاء الاصطناعي. PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.

عندما يتم نشر نماذج التعلم العميق في العالم الحقيقي ، ربما لاكتشاف الاحتيال المالي من نشاط بطاقة الائتمان أو تحديد السرطان في الصور الطبية ، فإنها غالبًا ما تكون قادرة على التفوق على البشر.

ولكن ما هي بالضبط نماذج التعلم العميق التي تتعلمها؟ هل النموذج المدرَّب على اكتشاف سرطان الجلد في الصور السريرية ، على سبيل المثال ، يتعلم بالفعل ألوان وملمس الأنسجة السرطانية ، أم أنه يشير إلى بعض السمات أو الأنماط الأخرى؟

تعتمد نماذج التعلم الآلي القوية هذه عادةً على الشبكات العصبية الاصطناعية يمكن أن تحتوي على ملايين العقد التي تعالج البيانات لعمل تنبؤات. نظرًا لتعقيدها ، غالبًا ما يطلق الباحثون على هذه النماذج "الصناديق السوداء" لأنه حتى العلماء الذين يبنونها لا يفهمون كل ما يجري تحت الغطاء.

لم تكن ستيفاني جيغيلكا راضية عن تفسير "الصندوق الأسود". أستاذ مشارك تم تعيينه حديثًا في قسم MIT للهندسة الكهربائية وعلوم الكمبيوتر ، Jegelka يتعمق في التعلم العميق لفهم ما يمكن أن تتعلمه هذه النماذج وكيف تتصرف ، وكيفية بناء معلومات مسبقة معينة في هذه النماذج.

"في نهاية اليوم ، يعتمد ما سيتعلمه نموذج التعلم العميق على العديد من العوامل. لكن بناء فهم ذي صلة عمليًا سيساعدنا في تصميم نماذج أفضل ، ويساعدنا أيضًا على فهم ما يجري بداخلها حتى نعرف متى يمكننا نشر نموذج ومتى لا يمكننا ذلك. يقول Jegelka ، وهو أيضًا عضو في مختبر علوم الكمبيوتر والذكاء الاصطناعي (CSAIL) ومعهد البيانات والأنظمة والمجتمع (IDSS): هذا أمر بالغ الأهمية.

تهتم Jegelka بشكل خاص بتحسين نماذج التعلم الآلي عندما تكون بيانات الإدخال في شكل رسوم بيانية. تشكل بيانات الرسم البياني تحديات محددة: على سبيل المثال ، تتكون المعلومات الواردة في البيانات من معلومات حول العقد والحواف الفردية ، بالإضافة إلى الهيكل - ما هو متصل بماذا. بالإضافة إلى ذلك ، تحتوي الرسوم البيانية على تناظرات رياضية يجب أن يحترمها نموذج التعلم الآلي ، بحيث يؤدي نفس الرسم البياني دائمًا إلى نفس التنبؤ على سبيل المثال. إن بناء مثل هذه التناظرات في نموذج التعلم الآلي ليس بالأمر السهل عادةً.

خذ الجزيئات ، على سبيل المثال. يمكن تمثيل الجزيئات على شكل رسوم بيانية ، برؤوس تتوافق مع الذرات والحواف التي تتوافق مع الروابط الكيميائية بينها. قد ترغب شركات الأدوية في استخدام التعلم العميق للتنبؤ بسرعة بخصائص العديد من الجزيئات ، مما يؤدي إلى تضييق العدد الذي يجب عليهم اختباره جسديًا في المختبر.

يدرس Jegelka طرقًا لبناء نماذج رياضية للتعلم الآلي يمكن أن تأخذ بيانات الرسم البياني بشكل فعال كمدخلات ومخرجات شيء آخر ، في هذه الحالة توقع للخصائص الكيميائية للجزيء. هذا يمثل تحديًا خاصًا نظرًا لأن خصائص الجزيء لا تتحدد فقط من خلال الذرات الموجودة فيه ، ولكن أيضًا من خلال الروابط بينها.  

تشمل الأمثلة الأخرى للتعلم الآلي على الرسوم البيانية توجيه حركة المرور وتصميم الرقائق وأنظمة التوصية.

وقد أصبح تصميم هذه النماذج أكثر صعوبة بسبب حقيقة أن البيانات المستخدمة في تدريبها تختلف غالبًا عن البيانات التي تراها النماذج في الممارسة العملية. ربما تم تدريب النموذج باستخدام الرسوم البيانية الجزيئية الصغيرة أو شبكات المرور ، لكن الرسوم البيانية التي يراها بمجرد نشرها تكون أكبر أو أكثر تعقيدًا.

في هذه الحالة ، ما الذي يتوقع الباحثون أن يتعلمه هذا النموذج ، وهل سيظل يعمل عمليًا إذا كانت بيانات العالم الحقيقي مختلفة؟

يقول Jegelka: "لن يكون نموذجك قادرًا على تعلم كل شيء بسبب بعض مشكلات الصلابة في علوم الكمبيوتر ، ولكن ما يمكنك تعلمه وما لا يمكنك تعلمه يعتمد على كيفية إعداد النموذج".

لقد تناولت هذا السؤال من خلال الجمع بين شغفها بالخوارزميات والرياضيات المنفصلة مع حماسها للتعلم الآلي.

من الفراشات إلى المعلوماتية الحيوية

نشأت جيغيلكا في بلدة صغيرة في ألمانيا وأصبحت مهتمة بالعلوم عندما كانت طالبة في المدرسة الثانوية. شجعها مدرس داعم على المشاركة في مسابقة علمية دولية. فازت هي وزملاؤها من الولايات المتحدة وسنغافورة بجائزة موقع إلكتروني أنشأوه عن الفراشات بثلاث لغات.

بالنسبة لمشروعنا ، التقطنا صورًا للأجنحة باستخدام مجهر إلكتروني مسح في إحدى الجامعات المحلية للعلوم التطبيقية. كما أتيحت لي الفرصة لاستخدام كاميرا عالية السرعة في مرسيدس بنز - هذه الكاميرا عادةً ما تصور محركات احتراق - والتي استخدمتها لالتقاط فيديو بطيء الحركة لحركة أجنحة الفراشة. كانت تلك هي المرة الأولى التي أتواصل فيها حقًا مع العلم والاستكشاف ، "تتذكر.

مفتونًا بكل من علم الأحياء والرياضيات ، قررت Jegelka دراسة المعلوماتية الحيوية في جامعة توبنغن وجامعة تكساس في أوستن. كان لديها عدد قليل من الفرص لإجراء البحوث عندما كانت طالبة جامعية ، بما في ذلك تدريب داخلي في علم الأعصاب الحسابي في جامعة جورج تاون ، لكنها لم تكن متأكدة من المهنة التي ستتبعها.

عندما عادت للسنة الأخيرة في الكلية ، انتقلت Jegelka مع اثنين من زملائها في الغرفة كانا يعملان كمساعدين باحثين في معهد ماكس بلانك في توبنغن.

"كانوا يعملون على التعلم الآلي ، وبدا ذلك رائعًا حقًا بالنسبة لي. كان علي أن أكتب أطروحة البكالوريوس ، لذلك سألت في المعهد إذا كان لديهم مشروع لي. بدأت العمل على التعلم الآلي في معهد ماكس بلانك وأحببته. لقد تعلمت الكثير هناك ، وكان مكانًا رائعًا للبحث "، كما تقول.

مكثت في معهد ماكس بلانك لإكمال أطروحة الماجستير ، ثم شرعت في الحصول على درجة الدكتوراه في التعلم الآلي من معهد ماكس بلانك والمعهد الفيدرالي السويسري للتكنولوجيا..

خلال الدكتوراه ، استكشفت كيف يمكن للمفاهيم من الرياضيات المنفصلة أن تساعد في تحسين تقنيات التعلم الآلي.

نماذج التدريس للتعلم

كلما تعلمت Jegelka أكثر عن التعلم الآلي ، ازداد اهتمامها بالتحديات المتمثلة في فهم كيفية تصرف النماذج ، وكيفية توجيه هذا السلوك.

"يمكنك فعل الكثير باستخدام التعلم الآلي ، ولكن فقط إذا كان لديك النموذج والبيانات الصحيحة. إنه ليس مجرد صندوق أسود حيث ترميه على البيانات ويعمل. عليك في الواقع أن تفكر في الأمر ، وخصائصه ، وما تريد أن يتعلمه النموذج ويفعله "، كما تقول.

بعد الانتهاء من دراسة ما بعد الدكتوراة في جامعة كاليفورنيا في بيركلي ، انخرط جيجلكا في البحث وقرر ممارسة مهنة في الأوساط الأكاديمية. انضمت إلى هيئة التدريس في معهد ماساتشوستس للتكنولوجيا في عام 2015 كأستاذ مساعد.

"ما أحببته حقًا في معهد ماساتشوستس للتكنولوجيا ، منذ البداية ، هو أن الناس يهتمون حقًا بالبحث والإبداع. هذا هو أكثر ما أقدره في معهد ماساتشوستس للتكنولوجيا. الناس هنا يقدرون حقًا الأصالة والعمق في البحث ، "كما تقول.

هذا التركيز على الإبداع مكّن Jegelka من استكشاف مجموعة واسعة من الموضوعات.

بالتعاون مع أعضاء هيئة التدريس الآخرين في معهد ماساتشوستس للتكنولوجيا ، تدرس تطبيقات التعلم الآلي في علم الأحياء والتصوير ورؤية الكمبيوتر وعلوم المواد.

ولكن ما يدفع Jegelka حقًا هو التحقيق في أساسيات التعلم الآلي ، ومؤخرًا ، مسألة المتانة. في كثير من الأحيان ، يعمل النموذج جيدًا على بيانات التدريب ، ولكن يتدهور أدائه عندما يتم نشره على بيانات مختلفة قليلاً. إن بناء المعرفة المسبقة في نموذج يمكن أن يجعله أكثر موثوقية ، لكن فهم المعلومات التي يحتاجها النموذج ليكون ناجحًا وكيفية بنائه ليس بهذه البساطة ، كما تقول.

كما أنها تستكشف طرقًا لتحسين أداء نماذج التعلم الآلي لتصنيف الصور.

نماذج تصنيف الصور موجودة في كل مكان ، من أنظمة التعرف على الوجه على الهواتف المحمولة إلى الأدوات التي تحدد الحسابات المزيفة على وسائل التواصل الاجتماعي. تحتاج هذه النماذج إلى كميات هائلة من البيانات للتدريب ، ولكن نظرًا لأنه من المكلف على البشر تسمية ملايين الصور يدويًا ، غالبًا ما يستخدم الباحثون مجموعات البيانات غير المسماة لاختبار النماذج مسبقًا بدلاً من ذلك.

ثم تعيد هذه النماذج استخدام التمثيلات التي تعلموها عندما يتم ضبطها لاحقًا لمهمة محددة.

من الناحية المثالية ، يريد الباحثون أن يتعلم النموذج بقدر ما يستطيع أثناء التدريب المسبق ، حتى يتمكن من تطبيق هذه المعرفة على مهمته النهائية. لكن في الممارسة العملية ، غالبًا ما تتعلم هذه النماذج القليل من الارتباطات البسيطة - مثل تلك الصورة التي لها ضوء الشمس والأخرى لها الظل - وتستخدم هذه "الاختصارات" لتصنيف الصور.

"لقد أظهرنا أن هذه مشكلة في" التعلم المتباين "، وهو أسلوب قياسي للتدريب المسبق ، من الناحية النظرية والتجريبية على حد سواء. لكننا نظهر أيضًا أنه يمكنك التأثير على أنواع المعلومات التي سيتعلم النموذج تمثيلها من خلال تعديل أنواع البيانات التي تعرضها للنموذج. هذه خطوة واحدة نحو فهم ما ستفعله النماذج فعليًا في الممارسة "، كما تقول.

لا يزال الباحثون لا يفهمون كل ما يجري داخل نموذج التعلم العميق ، أو تفاصيل حول كيفية التأثير على ما يتعلمه النموذج وكيف يتصرف ، لكن Jegelka يتطلع إلى مواصلة استكشاف هذه الموضوعات.

"غالبًا في التعلم الآلي ، نرى شيئًا ما يحدث عمليًا ونحاول فهمه نظريًا. هذا تحد كبير. أنت تريد أن تبني فهمًا يطابق ما تراه في الممارسة ، حتى تتمكن من القيام بعمل أفضل. ما زلنا في بداية فهم هذا ، كما تقول.

خارج المختبر ، Jegelka من محبي الموسيقى والفن والسفر وركوب الدراجات. لكن في هذه الأيام ، تستمتع بقضاء معظم وقت فراغها مع ابنتها في سن ما قبل المدرسة.

<!–
->

الطابع الزمني:

اكثر من مستشارو Blockchain