يُظهر الذكاء الاصطناعي الذي يتم تدريسه ذاتيًا أوجه التشابه مع كيفية عمل الدماغ لذكاء بيانات PlatoBlockchain. البحث العمودي. عاي.

يُظهر الذكاء الاصطناعي المدروس ذاتيًا أوجه التشابه مع كيفية عمل الدماغ

لعقد من الزمان حتى الآن ، تم تدريس العديد من أنظمة الذكاء الاصطناعي الأكثر إثارة للإعجاب باستخدام مخزون ضخم من البيانات المصنفة. يمكن تسمية صورة "القط العتابي" أو "قطة النمر" ، على سبيل المثال ، من أجل "تدريب" شبكة عصبية اصطناعية للتمييز بشكل صحيح بين تابي والنمر. كانت الإستراتيجية ناجحة بشكل مذهل وقاصرة بشكل مؤسف.

يتطلب مثل هذا التدريب "الخاضع للإشراف" البيانات التي تم تصنيفها بشق الأنفس من قبل البشر ، وغالبًا ما تتخذ الشبكات العصبية طرقًا مختصرة لتعلم ربط التسميات بأقل قدر من المعلومات وأحيانًا السطحية. على سبيل المثال ، قد تستخدم الشبكة العصبية وجود العشب للتعرف على صورة بقرة ، لأن الأبقار عادةً ما يتم تصويرها في الحقول.

"نحن نربي جيلًا من الخوارزميات التي تشبه الطلاب الجامعيين [الذين] لم يأتوا إلى الفصل الدراسي بأكمله ، ثم في الليلة التي سبقت النهائي ، كانوا مكتظين ،" قال اليكسي افروس، عالم كمبيوتر في جامعة كاليفورنيا ، بيركلي. "إنهم لا يتعلمون المادة حقًا ، لكنهم يقومون بعمل جيد في الاختبار."

بالنسبة للباحثين المهتمين بالتقاطع بين الذكاء الحيواني والآلي ، علاوة على ذلك ، قد يكون هذا "التعلم الخاضع للإشراف" محدودًا فيما يمكن أن يكشفه عن الأدمغة البيولوجية. الحيوانات - بما في ذلك البشر - لا تستخدم مجموعات البيانات المصنفة للتعلم. بالنسبة للجزء الأكبر ، فهم يستكشفون البيئة بمفردهم ، وبذلك يكتسبون فهمًا ثريًا وقويًا للعالم.

الآن بدأ بعض علماء الأعصاب الحاسوبيين في استكشاف الشبكات العصبية التي تم تدريبها باستخدام القليل من البيانات الموصوفة بشريًا أو بدونها. أثبتت خوارزميات "التعلم الذاتي" هذه نجاحًا هائلاً في نمذجة لغة الإنسان ومؤخرا ، التعرف على الصور. في العمل الأخير ، أظهرت النماذج الحسابية للأنظمة المرئية والسمعية للثدييات التي تم إنشاؤها باستخدام نماذج التعلم تحت الإشراف الذاتي ، تطابقًا أوثق مع وظائف الدماغ مقارنة بنظرائهم من ذوي التعلم الخاضع للإشراف. بالنسبة لبعض علماء الأعصاب ، يبدو أن الشبكات الاصطناعية بدأت في الكشف عن بعض الأساليب الفعلية التي تستخدمها أدمغتنا للتعلم.

إشراف معيب

نشأت نماذج الدماغ المستوحاة من الشبكات العصبية الاصطناعية منذ حوالي 10 سنوات ، في نفس الوقت تقريبًا الذي أطلقت عليه الشبكة العصبية اسمها AlexNet أحدث ثورة في مهمة تصنيف الصور غير المعروفة. هذه الشبكة ، مثلها مثل جميع الشبكات العصبية ، كانت مكونة من طبقات من الخلايا العصبية الاصطناعية ، ووحدات حسابية تشكل روابط مع بعضها البعض والتي يمكن أن تختلف في القوة ، أو "الوزن". إذا فشلت الشبكة العصبية في تصنيف صورة بشكل صحيح ، تقوم خوارزمية التعلم بتحديث أوزان الاتصالات بين الخلايا العصبية لتقليل احتمالية سوء التصنيف في الجولة التالية من التدريب. تكرر الخوارزمية هذه العملية عدة مرات مع جميع صور التدريب ، وتعديل الأوزان ، حتى يصبح معدل خطأ الشبكة منخفضًا بشكل مقبول.

في نفس الوقت تقريبًا ، طور علماء الأعصاب النماذج الحسابية الأولى لـ النظام البصري للرئيسيات، باستخدام الشبكات العصبية مثل AlexNet وخلفائها. بدا الاتحاد واعدًا: عندما عُرضت الصور نفسها على القرود والشبكات العصبية الاصطناعية ، على سبيل المثال ، أظهر نشاط الخلايا العصبية الحقيقية والخلايا العصبية الاصطناعية مراسلات مثيرة للاهتمام. تم اتباع نماذج اصطناعية للكشف عن السمع والرائحة.

ولكن مع تقدم المجال ، أدرك الباحثون حدود التدريب تحت الإشراف. على سبيل المثال ، في عام 2017 ، التقط ليون جاتيس ، عالم الكمبيوتر آنذاك في جامعة توبنغن في ألمانيا ، وزملاؤه صورة لسيارة Ford Model T ، ثم غطوا نمط جلد النمر عبر الصورة ، مما أدى إلى تكوين صورة غريبة ولكن يسهل التعرف عليها. . صنفت شبكة عصبية اصطناعية رائدة الصورة الأصلية بشكل صحيح على أنها نموذج T ، لكنها اعتبرت الصورة المعدلة نمرًا. لقد ركز على النسيج ولم يكن لديه فهم لشكل السيارة (أو النمر ، لهذه المسألة).

تم تصميم استراتيجيات التعلم تحت الإشراف الذاتي لتجنب مثل هذه المشاكل. في هذا النهج ، لا يقوم البشر بتسمية البيانات. بدلا من ذلك ، "تأتي التسميات من البيانات نفسها ،" قال فريدمان زينك، عالم الأعصاب الحاسوبي في معهد فريدريش ميشر للبحوث الطبية الحيوية في بازل ، سويسرا. تقوم الخوارزميات الخاضعة للإشراف الذاتي بشكل أساسي بإنشاء فجوات في البيانات وتطلب من الشبكة العصبية ملء الفراغات. في ما يسمى بنموذج اللغة الكبيرة ، على سبيل المثال ، ستعرض خوارزمية التدريب الشبكة العصبية الكلمات القليلة الأولى من الجملة وتطلب منها التنبؤ بالكلمة التالية. عندما تدرب على مجموعة ضخمة من النصوص المستقاة من الإنترنت ، فإن النموذج يبدو أن يتعلم البنية النحوية للغة ، مما يدل على قدرة لغوية رائعة - كل ذلك بدون تسميات خارجية أو إشراف.

هناك جهد مماثل جار في رؤية الكمبيوتر. في أواخر عام 2021 ، كايمينغ هي وزملاؤهم "التشفير التلقائي المقنع، "الذي يبني على أ تقنية ابتكرها فريق Efros في عام 2016. تخفي خوارزمية التعلم ذاتية الإشراف الصور بشكل عشوائي ، وتحجب ما يقرب من ثلاثة أرباع كل صورة. يقوم برنامج التشفير التلقائي المقنع بتحويل الأجزاء غير المقنعة إلى تمثيلات كامنة - أوصاف رياضية مضغوطة تحتوي على معلومات مهمة حول كائن. (في حالة الصورة ، قد يكون التمثيل الكامن وصفًا رياضيًا يلتقط ، من بين أشياء أخرى ، شكل كائن في الصورة.) ثم يحول مفكك الشفرة هذه التمثيلات مرة أخرى إلى صور كاملة.

تقوم خوارزمية التعلم ذات الإشراف الذاتي بتدريب مجموعة التشفير وفك التشفير لتحويل الصور المقنعة إلى نسخها الكاملة. يتم تغذية أي اختلافات بين الصور الحقيقية والصور المعاد بناؤها مرة أخرى في النظام لمساعدته على التعلم. تتكرر هذه العملية لمجموعة من صور التدريب حتى يصبح معدل خطأ النظام منخفضًا بشكل مناسب. في أحد الأمثلة ، عندما عُرض على مشفر تلقائي مُقنع مُدرَّب صورة غير مرئية سابقًا لحافلة مع حجب 80٪ منها تقريبًا ، أعاد النظام بناء هيكل الحافلة بنجاح.

قال إفروس: "هذه نتيجة رائعة للغاية".

يبدو أن التمثيلات الكامنة التي تم إنشاؤها في نظام مثل هذا تحتوي على معلومات أعمق بكثير مما يمكن أن تتضمنه الاستراتيجيات السابقة. قد يتعلم النظام شكل السيارة ، على سبيل المثال - أو النمر - وليس أنماطها فقط. قال إيفروس: "هذه حقًا هي الفكرة الأساسية للتعلم تحت الإشراف الذاتي - فأنت تبني معرفتك من الأسفل إلى الأعلى". لا تكدس في اللحظة الأخيرة لاجتياز الاختبارات.

العقول الخاضعة للإشراف الذاتي

في أنظمة مثل هذه ، يرى بعض علماء الأعصاب أصداءً لكيفية تعلمنا. قال "أعتقد أنه ليس هناك شك في أن 90٪ مما يفعله الدماغ هو التعلم تحت الإشراف الذاتي" بليك ريتشاردز، عالم الأعصاب الحاسوبي في جامعة ماكجيل وميلا ، معهد الذكاء الاصطناعي في كيبيك. يُعتقد أن العقول البيولوجية تتنبأ باستمرار ، على سبيل المثال ، بالموقع المستقبلي للكائن أثناء تحركه ، أو الكلمة التالية في الجملة ، تمامًا كما تحاول خوارزمية التعلم ذاتية الإشراف التنبؤ بالفجوة في صورة أو جزء من النص. والأدمغة تتعلم من أخطائها من تلقاء نفسها أيضًا - فقط جزء صغير من ردود فعل دماغنا يأتي من مصدر خارجي يقول ، في الأساس ، "إجابة خاطئة".

على سبيل المثال ، ضع في اعتبارك الأنظمة المرئية للإنسان والرئيسيات الأخرى. هذه هي أفضل ما تمت دراسته من بين جميع الأنظمة الحسية للحيوانات ، لكن علماء الأعصاب كافحوا لشرح سبب تضمينها مسارين منفصلين: التيار البصري البطني ، المسؤول عن التعرف على الأشياء والوجوه ، والتيار البصري الظهري ، الذي يعالج الحركة (" مسارات "ماذا" و "أين" ، على التوالي).

ابتكر ريتشاردز وفريقه نموذجًا خاضعًا للإشراف الذاتي يلمح إلى إجابة. أنهم متدرب ذكاء اصطناعي يجمع بين شبكتين عصبيتين مختلفتين: الأولى تسمى هندسة ResNet ، وقد صممت لمعالجة الصور ؛ يمكن للشبكة الثانية ، المعروفة باسم الشبكة المتكررة ، تتبع سلسلة من المدخلات السابقة لعمل تنبؤات حول المدخلات المتوقعة التالية. لتدريب الذكاء الاصطناعي المدمج ، بدأ الفريق بتسلسل 10 إطارات ، على سبيل المثال ، من مقطع فيديو ودع شبكة ResNet تعالجها واحدة تلو الأخرى. ثم تنبأت الشبكة المتكررة بالتمثيل الكامن للإطار الحادي عشر ، مع عدم مطابقة الإطارات العشرة الأولى فقط. قارنت خوارزمية التعلم ذات الإشراف الذاتي التنبؤ بالقيمة الفعلية وأعطت تعليمات للشبكات العصبية لتحديث أوزانها لجعل التنبؤ أفضل.

وجد فريق ريتشاردز أن ذكاءً اصطناعيًا تم تدريبه باستخدام شبكة ResNet واحدة كان جيدًا في التعرف على الأشياء ، ولكن ليس في تصنيف الحركة. ولكن عندما قاموا بتقسيم شبكة الرواسب الفردية إلى قسمين ، مما أدى إلى إنشاء مسارين (دون تغيير العدد الإجمالي للخلايا العصبية) ، طور الذكاء الاصطناعي تمثيلات للأشياء في أحدهما وللحركة في الآخر ، مما يتيح التصنيف النهائي لهذه الخصائص - تمامًا كما يرجح أن أدمغتنا فعل.

لاختبار الذكاء الاصطناعي بشكل أكبر ، عرض عليه الفريق مجموعة من مقاطع الفيديو التي عرضها باحثون في معهد ألين لعلوم الدماغ في سياتل سابقًا على الفئران. مثل الرئيسيات ، لدى الفئران مناطق دماغية متخصصة في الصور الثابتة والحركة. سجل باحثو آلن النشاط العصبي في القشرة البصرية للفأر أثناء مشاهدة الحيوانات لمقاطع الفيديو.

هنا أيضًا ، وجد فريق ريتشاردز أوجه تشابه في طريقة تفاعل الذكاء الاصطناعي والأدمغة الحية مع مقاطع الفيديو. أثناء التدريب ، أصبح أحد المسارات في الشبكة العصبية الاصطناعية أكثر تشابهًا مع المناطق البطنية التي تكشف عن الأشياء في دماغ الفأر ، وأصبح المسار الآخر مشابهًا للمناطق الظهرية التي تركز على الحركة.

قال ريتشاردز إن النتائج تشير إلى أن نظامنا البصري له مساران متخصصان لأنهما يساعدان في التنبؤ بالمستقبل البصري. مسار واحد ليس جيدًا بما فيه الكفاية.

تحكي نماذج الجهاز السمعي البشري قصة مماثلة. في يونيو ، قاد فريق جان ريمي كينج، عالم أبحاث في Meta AI ، دربت ذكاءً اصطناعيًا يسمى Wav2Vec 2.0، والذي يستخدم شبكة عصبية لتحويل الصوت إلى تمثيلات كامنة. يخفي الباحثون بعض هذه التمثيلات ، والتي تغذي بعد ذلك شبكة عصبية مكونة أخرى تسمى المحول. أثناء التدريب ، يتنبأ المحول بالمعلومات المقنعة. في هذه العملية ، يتعلم الذكاء الاصطناعي بأكمله تحويل الأصوات إلى تمثيلات كامنة - مرة أخرى ، لا حاجة إلى تسميات. استخدم الفريق حوالي 600 ساعة من بيانات الكلام لتدريب الشبكة ، "وهو ما سيحصل عليه الطفل تقريبًا في أول عامين من الخبرة ،" قال كينغ.

بمجرد تدريب النظام ، قام الباحثون بتشغيل أقسام من الكتب الصوتية باللغات الإنجليزية والفرنسية والماندرين. قارن الباحثون بعد ذلك أداء الذكاء الاصطناعي ببيانات من 412 شخصًا - مزيج من المتحدثين الأصليين للغات الثلاث الذين استمعوا إلى نفس الامتدادات الصوتية أثناء تصوير أدمغتهم في ماسح الرنين المغناطيسي الوظيفي. قال كينج إن شبكته العصبية والأدمغة البشرية ، على الرغم من الصور المشوشة ومنخفضة الدقة للرنين المغناطيسي الوظيفي ، "لا ترتبط ببعضها البعض فحسب ، بل ترتبط بطريقة منهجية": يتماشى النشاط في الطبقات الأولى من الذكاء الاصطناعي مع النشاط. في القشرة السمعية الأولية ، في حين أن نشاط الطبقات العميقة للذكاء الاصطناعي يتماشى مع نشاط الطبقات العليا في الدماغ ، في هذه الحالة قشرة الفص الجبهي. قال ريتشاردز: "إنها بيانات جميلة حقًا". "إنه ليس قاطعًا ، لكنه دليل مقنع آخر يشير إلى أن الطريقة التي نتعلم بها اللغة هي في الواقع إلى حد كبير من خلال محاولة التنبؤ بالأشياء التالية التي ستقال."

الأمراض غير المعالجة

لم يقتنع الجميع. جوش ماكديرموتعالم الأعصاب الحاسوبي في معهد ماساتشوستس للتكنولوجيا ، وقد عمل على نماذج الرؤية والإدراك السمعي باستخدام التعلم تحت الإشراف والتعلم الذاتي. صمم مختبره ما يسميه "الميترات" ، وهي إشارات صوتية ومرئية مركبة ، والتي بالنسبة للإنسان ، ضوضاء غامضة. ومع ذلك ، بالنسبة للشبكة العصبية الاصطناعية ، يبدو أن الميترات لا يمكن تمييزها عن الإشارات الحقيقية. يشير هذا إلى أن التمثيلات التي تتشكل في الطبقات العميقة للشبكة العصبية ، حتى مع التعلم الذاتي ، لا تتطابق مع التمثيلات في أدمغتنا. قال ماكديرموت إن مناهج التعلم تحت الإشراف الذاتي "تقدم بمعنى أنك قادر على تعلم التمثيلات التي يمكن أن تدعم الكثير من سلوكيات التعرف دون الحاجة إلى كل هذه التسميات". "لكن لا يزال لديهم الكثير من أمراض النماذج الخاضعة للإشراف."

تحتاج الخوارزميات نفسها أيضًا إلى مزيد من العمل. على سبيل المثال ، في Wav2Vec 2.0 من Meta AI ، لا يتوقع الذكاء الاصطناعي سوى التمثيلات الكامنة لبضع عشرات من المللي ثانية من الصوت - وقت أقل مما يستغرقه نطق ضوضاء مميزة بشكل ملحوظ ، ناهيك عن كلمة واحدة. قال كينغ: "هناك العديد من الأشياء التي يجب القيام بها لفعل شيء مشابه لما يفعله الدماغ".

سيتطلب الفهم الحقيقي لوظيفة الدماغ أكثر من التعلم الذاتي. لسبب واحد ، الدماغ مليء بوصلات التغذية الراجعة ، في حين أن النماذج الحالية لديها القليل من هذه الروابط ، إن وجدت. تتمثل الخطوة التالية الواضحة في استخدام التعلم تحت الإشراف الذاتي لتدريب الشبكات المتكررة للغاية - وهي عملية صعبة - ومعرفة كيف يقارن النشاط في مثل هذه الشبكات بالنشاط الدماغي الحقيقي. ستكون الخطوة الحاسمة الأخرى هي مطابقة نشاط الخلايا العصبية الاصطناعية في نماذج التعلم تحت الإشراف الذاتي مع نشاط الخلايا العصبية البيولوجية الفردية. قال كينج: "نأمل ، في المستقبل ، أن يتم تأكيد نتائجنا من خلال التسجيلات أحادية الخلية أيضًا".

إذا كانت أوجه التشابه الملحوظة بين الأدمغة ونماذج التعلم التي يتم الإشراف عليها ذاتيًا تنطبق على المهام الحسية الأخرى ، فسيكون ذلك مؤشرًا أقوى على أن أي سحر قادر على أدمغتنا يتطلب التعلم بالإشراف الذاتي بشكل ما. قال كينج: "إذا وجدنا تشابهًا منهجيًا بين أنظمة مختلفة إلى حد كبير ، فإنه [سيشير] إلى أنه ربما لا توجد طرق عديدة لمعالجة المعلومات بطريقة ذكية". "على الأقل ، هذا نوع من الفرضية الجميلة التي نود العمل معها."

الطابع الزمني:

اكثر من كوانتماجازين