كيف تبدو المحولات لتقليد أجزاء من ذكاء بيانات أفلاطون في الدماغ. البحث العمودي. عاي.

كيف تبدو المحولات لتقليد أجزاء من الدماغ

إن فهم كيفية تنظيم الدماغ والوصول إلى المعلومات المكانية - أين نحن ، وما هو قاب قوسين أو أدنى ، وكيفية الوصول إلى هناك - يظل تحديًا رائعًا. تتضمن العملية استدعاء شبكة كاملة من الذكريات والبيانات المكانية المخزنة من عشرات المليارات من الخلايا العصبية ، كل منها متصل بآلاف الآخرين. حدد علماء الأعصاب العناصر الرئيسية مثل خلايا الشبكة، الخلايا العصبية التي تحدد المواقع. لكن التعمق أكثر سيكون أمرًا صعبًا: ليس الأمر كما لو أن الباحثين يمكنهم إزالة ودراسة شرائح من المادة الرمادية البشرية لمشاهدة كيف تتدفق الذكريات القائمة على الموقع للصور والأصوات والروائح وتتواصل مع بعضها البعض.

يقدم الذكاء الاصطناعي طريقة أخرى. على مدى سنوات ، استخدم علماء الأعصاب أنواعًا عديدة من الشبكات العصبية - المحركات التي تشغل معظم تطبيقات التعلم العميق - لنمذجة إطلاق الخلايا العصبية في الدماغ. في العمل الأخير ، أظهر الباحثون أن الحُصين ، وهي بنية دماغية مهمة للذاكرة ، هي أساسًا نوع خاص من الشبكات العصبية ، تُعرف باسم محول، متنكر. يتتبع نموذجهم الجديد المعلومات المكانية بطريقة توازي الأعمال الداخلية للدماغ. لقد شهدوا نجاحًا ملحوظًا.

"حقيقة أننا نعرف أن هذه النماذج من الدماغ تعادل المحول تعني أن نماذجنا تؤدي أداءً أفضل بكثير ويسهل تدريبها ،" قال جيمس ويتينجتون، عالم الأعصاب الإدراكي الذي يقسم وقته بين جامعة ستانفورد ومختبر تيم بيرنس في جامعة أكسفورد.

تشير الدراسات التي أجراها ويتينغتون وآخرون إلى أن المحولات يمكن أن تحسن بشكل كبير من قدرة نماذج الشبكة العصبية لتقليد أنواع الحسابات التي تجريها الخلايا الشبكية وأجزاء أخرى من الدماغ. قال ويتينغتون إن مثل هذه النماذج يمكن أن تعزز فهمنا لكيفية عمل الشبكات العصبية الاصطناعية ، بل والأكثر احتمالًا ، كيف تتم العمليات الحسابية في الدماغ.

"نحن لا نحاول إعادة تكوين الدماغ ،" قال ديفيد ها، عالم كمبيوتر في Google Brain يعمل أيضًا على نماذج المحولات. "ولكن هل يمكننا إنشاء آلية يمكنها أن تفعل ما يفعله الدماغ؟"

ظهرت المحولات لأول مرة منذ خمس سنوات كطريقة جديدة للذكاء الاصطناعي لمعالجة اللغة. إنها الصلصة السرية في تلك البرامج التي تستحوذ على العناوين الرئيسية لإكمال الجمل مثل بيرت و GPT-3 ، والتي يمكن أن تولد كلمات أغنية مقنعة ، وتأليف سوناتات شكسبير وانتحال شخصية ممثلي خدمة العملاء.

تعمل المحولات باستخدام آلية تسمى الانتباه الذاتي ، حيث يتم دائمًا توصيل كل إدخال - كلمة ، بكسل ، رقم في تسلسل - بكل مدخلات أخرى. (تربط الشبكات العصبية الأخرى المدخلات بمدخلات أخرى معينة فقط). ولكن بينما تم تصميم المحولات للمهام اللغوية ، فقد برعت منذ ذلك الحين في مهام أخرى مثل تصنيف الصور - والآن ، نمذجة الدماغ.

في عام 2020 ، قامت مجموعة بقيادة سيب هوشريتر، عالم الكمبيوتر في جامعة يوهانس كيبلر لينز في النمسا ، استخدم محولًا لإعادة تجهيز نموذج قوي طويل الأمد لاسترجاع الذاكرة يسمى شبكة هوبفيلد. تم تقديم هذه الشبكات لأول مرة قبل 40 عامًا من قبل عالم الفيزياء في جامعة برينستون جون هوبفيلد ، تتبع هذه الشبكات قاعدة عامة: الخلايا العصبية النشطة في نفس الوقت تبني روابط قوية مع بعضها البعض.

لاحظ Hochreiter ومعاونيه أن الباحثين كانوا يبحثون عن نماذج أفضل لاسترجاع الذاكرة ، رأوا صلة بين كيفية استرجاع شبكات Hopfield الذكريات وكيفية أداء المحولات للانتباه. قاموا بتحديث شبكة هوبفيلد ، وتحويلها بشكل أساسي إلى محول. قال ويتينغتون إن هذا التغيير سمح للنموذج بتخزين واستعادة المزيد من الذكريات بسبب الاتصالات الأكثر فعالية. أثبت هوبفيلد نفسه ، جنبًا إلى جنب مع دميتري كروتوف في MIT-IBM Watson AI Lab ، أن شبكة Hopfield القائمة على المحولات كانت معقولة بيولوجيًا.

ثم، في وقت سابق من هذا العاموساعد كل من Whittington و Behrens في تعديل نهج Hochreiter ، وتعديل المحول بحيث بدلاً من التعامل مع الذكريات كتسلسل خطي - مثل سلسلة من الكلمات في جملة - قام بترميزها على أنها إحداثيات في فضاءات ذات أبعاد أعلى. هذا "الالتواء" ، كما أسماه الباحثون ، أدى إلى زيادة تحسين أداء النموذج في مهام علم الأعصاب. أظهروا أيضًا أن النموذج كان مكافئًا رياضيًا لنماذج أنماط إطلاق الخلايا الشبكية التي يراها علماء الأعصاب في فحوصات التصوير بالرنين المغناطيسي الوظيفي.

قال كاسويل باري ، عالم الأعصاب في يونيفرسيتي كوليدج لندن: "تتمتع الخلايا الشبكية بهذا النوع من التركيب المثير ، الجميل ، المنتظم ، وأنماط مدهشة من غير المرجح أن تظهر عشوائياً". أظهر العمل الجديد كيف أن المحولات تكرر بالضبط تلك الأنماط التي لوحظت في الحُصين. "لقد أدركوا أن المحول يمكنه معرفة مكانه بناءً على الحالات السابقة وكيفية نقله ، وبطريقة مرتبطة بالنماذج التقليدية لخلايا الشبكة."

تشير أعمال أخرى حديثة إلى أن المحولات يمكن أن تعزز فهمنا لوظائف الدماغ الأخرى أيضًا. في العام الماضي ، مارتن شريمف ، عالم الأعصاب الحاسوبي في معهد ماساتشوستس للتكنولوجيا ، حلل 43 نموذجًا مختلفًا للشبكة العصبية لمعرفة مدى تنبؤهم بقياسات النشاط العصبي البشري كما ورد في التصوير بالرنين المغناطيسي الوظيفي والتخطيط الكهربائي للقشرة. وجد أن المحولات هي الشبكات العصبونية الحديثة والرائدة حاليًا ، وتتنبأ تقريبًا بكل الاختلاف الموجود في التصوير.

وها مع زميل عالم الكمبيوتر يوجين تانغ، صمم مؤخرًا نموذجًا يمكنه إرسال كميات كبيرة من البيانات عن قصد عبر محول بطريقة عشوائية وغير منظمة ، لمحاكاة كيفية نقل جسم الإنسان للملاحظات الحسية إلى الدماغ. يمكن لمحولهم ، مثل أدمغتنا ، أن يتعامل بنجاح مع التدفق المضطرب للمعلومات.

قال تانغ: "الشبكات العصبية موصولة بأسلاك قوية لقبول مدخلات معينة". لكن في الحياة الواقعية ، غالبًا ما تتغير مجموعات البيانات بسرعة ، وليس لدى معظم الذكاء الاصطناعي أي طريقة للتكيف. "أردنا تجربة بنية يمكن أن تتكيف بسرعة كبيرة."

على الرغم من علامات التقدم هذه ، يرى بيرنس أن المحولات مجرد خطوة نحو نموذج دقيق للدماغ - وليس نهاية البحث. قال "يجب أن أكون هنا عالم أعصاب متشكك". "لا أعتقد أن المحولات ستصبح في النهاية هي الطريقة التي نفكر بها حول اللغة في الدماغ ، على سبيل المثال ، على الرغم من أن لديهم أفضل نموذج حالي للجمل."

"هل هذا هو الأساس الأكثر فعالية لعمل تنبؤات حول مكاني وما سأراه بعد ذلك؟ قال باري: "إذا كنت صريحًا ، فمن السابق لأوانه معرفة ذلك".

لاحظ Schrimpf أيضًا أنه حتى المحولات الأفضل أداءً محدودة ، وتعمل جيدًا للكلمات والعبارات القصيرة ، على سبيل المثال ، ولكن ليس للمهام اللغوية واسعة النطاق مثل سرد القصص.

قال شريمبف "إحساسي أن هذه البنية ، هذا المحول ، يضعك في المكان المناسب لفهم بنية الدماغ ، ويمكن تحسينه من خلال التدريب". "هذا اتجاه جيد ، لكن المجال معقد للغاية."

الطابع الزمني:

اكثر من كوانتماجازين