رقاقة جديدة توسع إمكانيات الذكاء الاصطناعي لبيانات PlatoBlockchain. البحث العمودي. عاي.

رقاقة جديدة توسع إمكانيات الذكاء الاصطناعي

المُقدّمة

لا يمكن لخوارزميات الذكاء الاصطناعي أن تستمر في النمو بوتيرتها الحالية. الخوارزميات مثل الشبكات العصبية العميقة - المستوحاة بشكل فضفاض من الدماغ ، مع طبقات متعددة من الخلايا العصبية الاصطناعية المرتبطة ببعضها البعض عبر قيم عددية تسمى الأوزان - تزداد كل عام. لكن في هذه الأيام ، لم تعد تحسينات الأجهزة تواكب الكمية الهائلة من الذاكرة وسعة المعالجة المطلوبة لتشغيل هذه الخوارزميات الضخمة. قريبًا ، قد يصطدم حجم خوارزميات الذكاء الاصطناعي بالحائط.

وحتى إذا استطعنا الاستمرار في توسيع نطاق الأجهزة لتلبية متطلبات الذكاء الاصطناعي ، فهناك مشكلة أخرى: تشغيلها على أجهزة الكمبيوتر التقليدية يهدر قدرًا هائلاً من الطاقة. إن انبعاثات الكربون العالية الناتجة عن تشغيل خوارزميات الذكاء الاصطناعي الكبيرة ضارة بالفعل بالبيئة ، وستزداد سوءًا مع نمو الخوارزميات بشكل أكبر من أي وقت مضى.

أحد الحلول ، يسمى الحوسبة العصبية ، يستلهم من العقول البيولوجية لإنشاء تصميمات موفرة للطاقة. لسوء الحظ ، في حين أن هذه الرقائق يمكن أن تفوق أجهزة الكمبيوتر الرقمية في الحفاظ على الطاقة ، إلا أنها تفتقر إلى القوة الحسابية اللازمة لتشغيل شبكة عصبية عميقة كبيرة. هذا جعل من السهل على باحثي الذكاء الاصطناعي التغاضي عنها.

تغير ذلك أخيرًا في أغسطس ، عندما وير وان, H.-S. فيليب وونغ, غيرت كاوينبيرغس وزملائهم كشفت عن شريحة عصبية جديدة يسمى NeuRRAM الذي يتضمن 3 ملايين خلية ذاكرة وآلاف من الخلايا العصبية المدمجة في أجهزتها لتشغيل الخوارزميات. يستخدم نوعًا جديدًا نسبيًا من الذاكرة يسمى ذاكرة الوصول العشوائي المقاومة ، أو RRAM. على عكس رقائق RRAM السابقة ، فإن NeuRRAM مبرمج للعمل بطريقة تناظرية لتوفير المزيد من الطاقة والمساحة. بينما الذاكرة الرقمية ثنائية - تخزين إما 1 أو 0 - يمكن لخلايا الذاكرة التناظرية في شريحة NeuRRAM أن تخزن قيمًا متعددة على طول نطاق مستمر بالكامل. يسمح ذلك للشريحة بتخزين المزيد من المعلومات من خوارزميات الذكاء الاصطناعي الضخمة في نفس القدر من مساحة الشريحة.

ونتيجة لذلك ، يمكن للرقاقة الجديدة أن تعمل بالإضافة إلى أجهزة الكمبيوتر الرقمية في مهام الذكاء الاصطناعي المعقدة مثل التعرف على الصور والكلام ، ويزعم المؤلفون أنها أكثر كفاءة في استخدام الطاقة بما يصل إلى 1,000 مرة ، مما يفتح إمكانية تشغيل الرقائق الصغيرة لخوارزميات معقدة بشكل متزايد داخل أجهزة صغيرة لم تكن مناسبة سابقًا للذكاء الاصطناعي مثل الساعات الذكية والهواتف.

لقد تأثر الباحثون الذين لم يشاركوا في العمل بعمق بالنتائج. قال "هذه الورقة فريدة من نوعها إلى حد ما" Zhongrui وانغ، باحث RRAM منذ فترة طويلة في جامعة هونغ كونغ. "إنها تقدم مساهمات على مستويات مختلفة - على مستوى الجهاز ، وعلى مستوى بنية الدائرة ، وعلى مستوى الخوارزمية."

خلق ذكريات جديدة

في أجهزة الكمبيوتر الرقمية ، فإن الكميات الهائلة من الطاقة المهدرة أثناء تشغيلها لخوارزميات الذكاء الاصطناعي ناتجة عن عيب تصميمي بسيط وواسع الانتشار يجعل كل عملية حسابية غير فعالة. عادةً ما يتم وضع ذاكرة الكمبيوتر - التي تحتفظ بالبيانات والقيم العددية التي يتم سحقها أثناء الحساب - على اللوحة الأم بعيدًا عن المعالج ، حيث تتم الحوسبة.

قال وان ، عالم الكمبيوتر الذي كان يعمل سابقًا في جامعة ستانفورد ، والذي انتقل مؤخرًا إلى شركة Aizip الناشئة للذكاء الاصطناعي ، بالنسبة للمعلومات التي تتجول من خلال المعالج ، "يبدو الأمر وكأنك تقضي ثماني ساعات في التنقل ، لكنك تقوم بساعتين من العمل".

المُقدّمة

يبدو أن إصلاح هذه المشكلة باستخدام شرائح الكل في واحد الجديدة التي تضع الذاكرة والحساب في نفس المكان أمرًا سهلاً. إنها أيضًا أقرب إلى كيفية معالجة أدمغتنا للمعلومات ، نظرًا لأن العديد من علماء الأعصاب يعتقدون أن الحساب يحدث داخل مجموعات من الخلايا العصبية ، بينما تتشكل الذكريات عندما تقوي نقاط الاشتباك العصبي بين الخلايا العصبية أو تضعف روابطها. لكن ثبت أن إنشاء مثل هذه الأجهزة أمر صعب ، لأن الأشكال الحالية للذاكرة غير متوافقة مع التكنولوجيا في المعالجات.

طور علماء الكمبيوتر منذ عقود المواد اللازمة لإنشاء شرائح جديدة تؤدي عمليات حسابية في مكان تخزين الذاكرة - وهي تقنية تُعرف باسم الحوسبة في الذاكرة. ولكن مع أداء أجهزة الكمبيوتر الرقمية التقليدية بشكل جيد ، تم التغاضي عن هذه الأفكار لعقود.

قال وونغ ، الأستاذ في جامعة ستانفورد: "هذا العمل ، تمامًا مثل معظم الأعمال العلمية ، كان نوعًا من النسيان".

والواقع أن أول جهاز من هذا القبيل يعود تاريخه إلى عام 1964 على الأقل ، عندما اكتشف المهندسون الكهربائيون في جامعة ستانفورد أن بإمكانهم التلاعب بمواد معينة ، تسمى أكاسيد المعادن ، لتشغيل قدرتها على توصيل الكهرباء وإيقافها. هذا مهم لأن قدرة المادة على التبديل بين حالتين توفر العمود الفقري لتخزين الذاكرة التقليدية. عادةً ، في الذاكرة الرقمية ، تتوافق حالة الجهد العالي مع 1 ، والجهد المنخفض يساوي 0.

للحصول على جهاز RRAM للتبديل بين الحالات ، يمكنك تطبيق جهد عبر أقطاب معدنية متصلة بطرفين من أكسيد المعدن. عادةً ما تكون أكاسيد المعادن عوازل ، مما يعني أنها لا توصل الكهرباء. ولكن مع وجود جهد كافي ، يتراكم التيار ، ويدفع في النهاية عبر النقاط الضعيفة للمادة ويشق طريقًا إلى القطب الكهربائي على الجانب الآخر. بمجرد كسر التيار ، يمكن أن يتدفق بحرية على طول هذا المسار.

يشبه Wong هذه العملية بالبرق: عندما تتراكم شحنة كافية داخل السحابة ، فإنها تجد سريعًا مسارًا منخفض المقاومة وضربات البرق. ولكن على عكس البرق ، الذي يختفي مساره ، يبقى المسار عبر أكسيد الفلز ، مما يعني أنه يظل موصلًا إلى أجل غير مسمى. ومن الممكن محو مسار الموصل عن طريق تطبيق جهد آخر على المادة. لذلك يمكن للباحثين تبديل RRAM بين حالتين واستخدامهما لتخزين الذاكرة الرقمية.

لم يتعرف الباحثون في منتصف القرن على إمكانات الحوسبة الموفرة للطاقة ، ولم يحتاجوا إليها بعد باستخدام الخوارزميات الأصغر التي كانوا يعملون بها. استغرق الأمر حتى أوائل عام 2000 ، مع اكتشاف أكاسيد معدنية جديدة ، حتى يدرك الباحثون الاحتمالات.

يتذكر وونغ ، الذي كان يعمل في شركة IBM في ذلك الوقت ، أن زميلًا حائزًا على جوائز يعمل في RRAM اعترف بأنه لم يفهم تمامًا الفيزياء المعنية. يتذكر وونغ أنه "إذا لم يفهمها ، فربما لا يجب أن أحاول فهمها".

ولكن في عام 2004 ، أعلن باحثون في Samsung Electronics أنهم قد فعلوا ذلك تم دمج ذاكرة RRAM بنجاح مبني على شريحة حوسبة تقليدية ، مما يشير إلى أن شريحة الحوسبة في الذاكرة قد تكون ممكنة أخيرًا. قرر وونغ على الأقل المحاولة.

رقائق حساب في الذاكرة للذكاء الاصطناعي

 لأكثر من عقد من الزمان ، عمل باحثون مثل Wong على بناء تقنية RRAM إلى درجة تمكنها من التعامل مع مهام الحوسبة عالية الطاقة بشكل موثوق. في حوالي عام 2015 ، بدأ علماء الكمبيوتر في التعرف على الإمكانات الهائلة لهذه الأجهزة الموفرة للطاقة لخوارزميات الذكاء الاصطناعي الكبيرة ، والتي كانت قد بدأت في الظهور. في ذلك العام ، عمل علماء في جامعة كاليفورنيا ، سانتا باربرا أظهرت أن أجهزة RRAM يمكنها القيام بأكثر من مجرد تخزين الذاكرة بطريقة جديدة. يمكنهم تنفيذ مهام الحوسبة الأساسية بأنفسهم - بما في ذلك الغالبية العظمى من العمليات الحسابية التي تتم داخل الخلايا العصبية الاصطناعية للشبكة العصبية ، والتي هي مهام ضرب مصفوفة بسيطة.

في شريحة NeuRRAM ، يتم دمج الخلايا العصبية السيليكونية في الأجهزة ، وتخزن خلايا ذاكرة RRAM الأوزان - القيم التي تمثل قوة الاتصالات بين الخلايا العصبية. ولأن خلايا ذاكرة NeuRRAM تناظرية ، فإن الأوزان التي تخزنها تمثل النطاق الكامل لحالات المقاومة التي تحدث أثناء تبديل الجهاز بين حالة المقاومة المنخفضة إلى حالة المقاومة العالية. يتيح ذلك كفاءة طاقة أعلى مما يمكن أن تحققه ذاكرة RRAM الرقمية لأن الرقاقة يمكنها تشغيل العديد من حسابات المصفوفات بشكل متوازٍ - وليس بخطوة واحدة تلو الأخرى ، كما هو الحال في إصدارات المعالجة الرقمية.

ولكن نظرًا لأن المعالجة التناظرية لا تزال متأخرة عقودًا عن المعالجة الرقمية ، فلا يزال هناك العديد من المشكلات التي يجب حلها. أحدهما هو أن رقائق RRAM التناظرية يجب أن تكون دقيقة بشكل غير عادي لأن العيوب الموجودة على الشريحة المادية يمكن أن تؤدي إلى التباين والضوضاء. (بالنسبة للرقائق التقليدية ، مع حالتين فقط ، فإن هذه العيوب لا تهم كثيرًا.) وهذا يجعل من الصعب جدًا على أجهزة RRAM التناظرية تشغيل خوارزميات الذكاء الاصطناعي ، بالنظر إلى أن دقة التعرف على الصورة ، على سبيل المثال ، ستعاني إذا الحالة الموصلة لجهاز RRAM ليست هي نفسها تمامًا في كل مرة.

قال وونغ: "عندما ننظر إلى مسار الإضاءة ، يكون الأمر مختلفًا في كل مرة". "ونتيجة لذلك ، تُظهر RRAM درجة معينة من العشوائية - في كل مرة تقوم فيها ببرمجتها تكون مختلفة قليلاً." أثبت Wong وزملاؤه أن أجهزة RRAM يمكنها تخزين أوزان الذكاء الاصطناعي المستمرة وتظل دقيقة مثل أجهزة الكمبيوتر الرقمية إذا تم تدريب الخوارزميات على التعود على الضوضاء التي تواجهها على الشريحة ، وهو تقدم مكنهم من إنتاج شريحة NeuRRAM.

المُقدّمة

هناك مشكلة رئيسية أخرى كان عليهم حلها وهي المرونة اللازمة لدعم الشبكات العصبية المتنوعة. في الماضي ، كان على مصممي الرقائق أن يصطفوا أجهزة RRAM الصغيرة في منطقة واحدة بجوار الخلايا العصبية السيليكونية الأكبر حجمًا. كانت أجهزة RRAM والخلايا العصبية موصولة بأسلاك صلبة دون إمكانية البرمجة ، لذلك لا يمكن إجراء الحساب إلا في اتجاه واحد. لدعم الشبكات العصبية بحساب ثنائي الاتجاه ، كانت الأسلاك والدوائر الإضافية ضرورية ، مما يؤدي إلى تضخيم الطاقة واحتياجات الفضاء.

لذلك صمم فريق Wong بنية رقاقة جديدة حيث تم مزج أجهزة ذاكرة RRAM وخلايا السيليكون العصبية معًا. أدى هذا التغيير الصغير في التصميم إلى تقليل المساحة الإجمالية وتوفير الطاقة.

قال "اعتقدت أن [الترتيب] كان جميلًا حقًا" ميليكا بايفاند، باحث في علم الأعصاب في المعهد الفيدرالي السويسري للتكنولوجيا في زيورخ. "أنا أعتبره بالتأكيد عملًا رائدًا."

لعدة سنوات ، عمل فريق Wong مع متعاونين لتصميم وتصنيع واختبار ومعايرة وتشغيل خوارزميات الذكاء الاصطناعي على شريحة NeuRRAM. لقد فكروا في استخدام أنواع أخرى ناشئة من الذاكرة التي يمكن استخدامها أيضًا في شريحة الحوسبة في الذاكرة ، لكن RRAM كانت لها ميزة بسبب مزاياها في البرمجة التناظرية ، ولأنها كانت سهلة نسبيًا للتكامل مع مواد الحوسبة التقليدية.

تمثل نتائجهم الأخيرة أول شريحة RRAM التي يمكنها تشغيل خوارزميات الذكاء الاصطناعي الكبيرة والمعقدة - وهو إنجاز لم يكن ممكنًا في السابق إلا في عمليات المحاكاة النظرية. قال "عندما يتعلق الأمر بالسيليكون الحقيقي ، كانت هذه القدرة مفقودة" أنوب داس، عالم كمبيوتر في جامعة دريكسل. "هذا العمل هو العرض الأول."

قال Cauwenberghs: "تتسم أنظمة الذكاء الاصطناعي الرقمية بالمرونة والدقة ، إلا أنها أقل كفاءة من حيث الحجم". الآن ، قال Cauwenberghs ، لقد نجحت شريحة RRAM التناظرية المرنة والدقيقة والموفرة للطاقة في "سد الفجوة لأول مرة".

زيادة

يحافظ تصميم الفريق على صغر حجم شريحة NeuRAM - بحجم ظفر الإصبع فقط - مع الضغط على 3 ملايين من أجهزة ذاكرة RRAM التي يمكن أن تعمل كمعالجات تناظرية. وبينما يمكنها تشغيل الشبكات العصبية على الأقل كما تفعل أجهزة الكمبيوتر الرقمية ، تستطيع الشريحة أيضًا (ولأول مرة) تشغيل خوارزميات تؤدي العمليات الحسابية في اتجاهات مختلفة. يمكن لشريحتهم إدخال جهد إلى صفوف مصفوفة RRAM وقراءة المخرجات من الأعمدة كما هو قياسي لرقائق RRAM ، ولكن يمكنها أيضًا القيام بذلك للخلف من الأعمدة إلى الصفوف ، بحيث يمكن استخدامها في الشبكات العصبية التي تعمل مع تدفق البيانات في اتجاهات مختلفة.

كما هو الحال مع تقنية RRAM نفسها ، كان هذا ممكنًا منذ فترة طويلة ، لكن لم يفكر أحد في القيام بذلك. "لماذا لم نفكر في هذا من قبل؟" سأل Payvand. "بعد فوات الأوان ، لا أعرف."

قال داس: "هذا في الواقع يفتح الكثير من الفرص الأخرى". على سبيل المثال ، ذكر قدرة نظام بسيط على تشغيل الخوارزميات الهائلة اللازمة لمحاكاة الفيزياء متعددة الأبعاد أو السيارات ذاتية القيادة.

لكن الحجم هو مشكلة. تحتوي أكبر الشبكات العصبية الآن على مليارات الأوزان ، وليس الملايين الموجودة في الرقائق الجديدة. يخطط Wong للتوسع من خلال تكديس عدة شرائح NeuRRAM فوق بعضها البعض.

سيكون من المهم أيضًا الحفاظ على انخفاض تكاليف الطاقة في الأجهزة المستقبلية ، أو تقليصها إلى أبعد من ذلك. طريقة واحدة للوصول إلى هناك هي عن طريق نسخ الدماغ بشكل أكثر قربًا لتبني إشارة الاتصال المستخدمة بين الخلايا العصبية الحقيقية: السنبلة الكهربائية. إنها إشارة تنطلق من خلية عصبية إلى أخرى عندما يصل الفرق في الجهد بين داخل الخلية وخارجها إلى عتبة حرجة.

قال "هناك تحديات كبيرة" توني كينيون، باحث في تكنولوجيا النانو في يونيفرسيتي كوليدج لندن. "لكننا ما زلنا نرغب في التحرك في هذا الاتجاه ، لأن ... من المحتمل أن يكون لديك كفاءة أكبر في استخدام الطاقة إذا كنت تستخدم طفرات متفرقة للغاية." ومع ذلك ، أشار كينيون إلى أن تشغيل الخوارزميات التي ترتفع على شريحة NeuRRAM الحالية من المحتمل أن تتطلب بنية مختلفة تمامًا.

في الوقت الحالي ، خلقت كفاءة الطاقة التي حققها الفريق أثناء تشغيل خوارزميات ذكاء اصطناعي كبيرة على شريحة NeuRRAM أملاً جديدًا في أن تقنيات الذاكرة قد تمثل مستقبل الحوسبة باستخدام الذكاء الاصطناعي. ربما في يوم من الأيام سنكون قادرين على مطابقة 86 مليار خلية عصبية في الدماغ البشري وتريليونات من نقاط الاشتباك العصبي التي تربطهم دون نفاد الطاقة.

الطابع الزمني:

اكثر من كوانتماجازين