الذكاء الاصطناعي التوليدي الجديد "المستوحى من الفيزياء" يتجاوز التوقعات | مجلة كوانتا

الذكاء الاصطناعي التوليدي الجديد "المستوحى من الفيزياء" يتجاوز التوقعات | مجلة كوانتا

الذكاء الاصطناعي التوليدي الجديد "المستوحى من الفيزياء" يتجاوز التوقعات | مجلة كوانتا ذكاء البيانات PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

المُقدّمة

كانت أدوات الذكاء الاصطناعي -الشبكات العصبية على وجه الخصوص- مفيدة للفيزيائيين. لسنوات عديدة، ساعدت هذه التكنولوجيا الباحثين على إعادة بناء مسارات الجسيمات في تجارب المسرعات، والبحث عن أدلة على وجود جسيمات جديدة، واكتشاف موجات الجاذبية والكواكب الخارجية. وفي حين من الواضح أن أدوات الذكاء الاصطناعي يمكن أن تفعل الكثير لعلماء الفيزياء، فإن السؤال الآن، وفقا لماكس تيجمارك، عالم الفيزياء في معهد ماساتشوستس للتكنولوجيا، هو: "هل يمكننا رد أي شيء في المقابل؟"

يعتقد تيجمارك أن أقرانه من الفيزيائيين يمكنهم تقديم مساهمات كبيرة في علم الذكاء الاصطناعي، وقد جعل هذا الأمر على رأس أولوياته البحثية. وقال إن إحدى الطرق التي يمكن للفيزيائيين من خلالها المساعدة في تطوير تكنولوجيا الذكاء الاصطناعي هي استبدال خوارزميات "الصندوق الأسود" للشبكات العصبية، التي تكون أعمالها غامضة إلى حد كبير، بمعادلات مفهومة جيدًا للعمليات الفيزيائية.

الفكرة ليست جديدة تمامًا. نماذج الذكاء الاصطناعي التوليدية على أساس الانتشار - العملية التي، على سبيل المثال، تؤدي إلى انتشار الحليب المسكوب في فنجان من القهوة بشكل موحد - ظهرت لأول مرة في عام 2015، وتحسنت جودة الصور التي تولدها بشكل ملحوظ منذ ذلك الحين. تعمل هذه التقنية على تشغيل برامج إنتاج الصور المشهورة مثل DALL·E 2 وMidjourney. والآن، يتعلم تيجمارك وزملاؤه ما إذا كانت النماذج التوليدية الأخرى المستوحاة من الفيزياء قد تعمل بنفس كفاءة النماذج القائمة على الانتشار، أو حتى أفضل منها.

في أواخر العام الماضي، قدم فريق تيجمارك طريقة جديدة واعدة لإنتاج الصور تسمى نموذج تدفق بواسون التوليدي (بفغم). وفيه، يتم تمثيل البيانات بواسطة جسيمات مشحونة، والتي تتحد لتكوين مجال كهربائي تعتمد خصائصه على توزيع الشحنات في أي لحظة معينة. يطلق عليه نموذج تدفق بواسون لأن حركة الشحنات تحكمها معادلة بواسون، والتي تستمد من المبدأ الذي ينص على أن القوة الكهروستاتيكية بين شحنتين تختلف عكسيا مع مربع المسافة بينهما (على غرار صياغة الجاذبية النيوتونية). .

هذه العملية الجسدية هي في قلب PFGM. وقال: "يمكن وصف نموذجنا بشكل شبه كامل من خلال قوة واتجاه المجال الكهربائي في كل نقطة في الفضاء". ييلون شو، طالب دراسات عليا في معهد ماساتشوستس للتكنولوجيا ومؤلف مشارك في هذه الورقة. "ما تتعلمه الشبكة العصبية أثناء عملية التدريب هو كيفية تقدير هذا المجال الكهربائي." ومن خلال القيام بذلك، يمكنه تعلم كيفية إنشاء الصور لأن الصورة في هذا النموذج يمكن وصفها بإيجاز بواسطة مجال كهربائي.

المُقدّمة

يمكن لـ PFGM إنشاء صور بنفس جودة تلك التي تنتجها الأساليب القائمة على الانتشار، والقيام بذلك بشكل أسرع بما يتراوح بين 10 إلى 20 مرة. وقال: "إنها تستخدم بناءًا فيزيائيًا، وهو المجال الكهربائي، بطريقة لم نشهدها من قبل". حنانئيل حزان، عالم الكمبيوتر في جامعة تافتس. "وهذا يفتح الباب أمام إمكانية تسخير الظواهر الفيزيائية الأخرى لتحسين شبكاتنا العصبية."

هناك الكثير من القواسم المشتركة بين نماذج الانتشار وتدفق بواسون، إلى جانب كونها مبنية على معادلات مستوردة من الفيزياء. أثناء التدريب، يبدأ نموذج الانتشار المصمم لتوليد الصور عادةً بصورة - كلب مثلًا - ثم يضيف ضوضاء بصرية، ويغير كل بكسل بطريقة عشوائية حتى تصبح ميزاته مغطاة تمامًا (على الرغم من عدم إزالتها بالكامل). يحاول النموذج بعد ذلك عكس العملية وإنشاء كلب قريب من الأصل. بمجرد تدريب النموذج، يمكنه إنشاء كلاب - وصور أخرى - بدءًا من لوحة قماشية تبدو فارغة.

تعمل نماذج تدفق بواسون بنفس الطريقة تقريبًا. أثناء التدريب، هناك عملية للأمام، تتضمن إضافة التشويش، بشكل تدريجي، إلى صورة كانت واضحة في السابق، وعملية عكسية يحاول فيها النموذج إزالة هذا التشويش، خطوة بخطوة، حتى يتم استعادة الإصدار الأولي في الغالب. وكما هو الحال مع التوليد المعتمد على الانتشار، يتعلم النظام في النهاية صنع صور لم يسبق له مثيل أثناء التدريب.

لكن الفيزياء التي تقوم عليها نماذج بواسون مختلفة تمامًا. يتم تحريك الانتشار بواسطة القوى الديناميكية الحرارية، في حين يتم دفع تدفق بواسون بواسطة القوى الكهروستاتيكية. يمثل الأخير صورة مفصلة باستخدام ترتيب من الشحنات التي يمكن أن تخلق مجالًا كهربائيًا معقدًا للغاية. ومع ذلك، يتسبب هذا المجال في انتشار الشحنات بشكل متساوٍ بمرور الوقت، تمامًا كما يتوزع الحليب بشكل طبيعي في فنجان القهوة. والنتيجة هي أن المجال نفسه يصبح أبسط وأكثر اتساقا. لكن هذا الحقل الموحد المليء بالضوضاء ليس صفحة بيضاء كاملة؛ فهو لا يزال يحتوي على بذور المعلومات التي يمكن تجميع الصور منها بسهولة.

في أوائل عام 2023، قام الفريق بتحديث نموذج بواسون الخاص بهم، تمديده لتشمل عائلة كاملة من النماذج. يتضمن الإصدار المعزز، PFGM++، معلمة جديدة، D، والذي يسمح للباحثين بضبط أبعاد النظام. يمكن أن يحدث هذا فرقًا كبيرًا: في الفضاء المألوف ثلاثي الأبعاد، ترتبط قوة المجال الكهربائي الناتج عن الشحنة عكسًا بمربع المسافة من تلك الشحنة. لكن في الأبعاد الأربعة، تتبع شدة المجال قانون المكعب العكسي. ولكل بعد من أبعاد الفضاء، ولكل قيمة D، هذه العلاقة مختلفة بعض الشيء.

المُقدّمة

أعطى هذا الابتكار الفردي لنماذج تدفق بواسون تنوعًا أكبر بكثير، حيث تقدم الحالات القصوى فوائد مختلفة. متى D على سبيل المثال، يكون النموذج منخفضًا، مما يعني أنه أكثر تحملاً للأخطاء التي تحدث في تقدير المجال الكهربائي. قال: "لا يستطيع النموذج التنبؤ بالمجال الكهربائي بشكل مثالي". زيمينغ ليو، طالب دراسات عليا آخر في معهد ماساتشوستس للتكنولوجيا ومؤلف مشارك لكلا الورقتين. "هناك دائما بعض الانحراف. لكن المتانة تعني أنه حتى لو كان خطأ التقدير الخاص بك مرتفعًا، فلا يزال بإمكانك إنشاء صور جيدة. لذلك قد لا ينتهي بك الأمر مع كلب أحلامك، ولكن سينتهي بك الأمر مع شيء يشبه الكلب.

وعلى الطرف الآخر متى D عالية، تصبح الشبكة العصبية أسهل في التدريب، وتتطلب بيانات أقل لإتقان مهاراتها الفنية. ليس من السهل تفسير السبب الدقيق، لكنه يرجع إلى حقيقة أنه عندما يكون هناك المزيد من الأبعاد، يكون لدى النموذج عدد أقل من المجالات الكهربائية التي يجب تتبعها، وبالتالي بيانات أقل لاستيعابها.

وقال النموذج المحسن، PFGM++، "يمنحك المرونة للاستيفاء بين هذين النقيضين". روز يو، عالم الكمبيوتر في جامعة كاليفورنيا، سان دييغو.

وفي مكان ما ضمن هذا النطاق تكمن القيمة المثالية لـ D وقال شو إن هذا يحقق التوازن الصحيح بين القوة وسهولة التدريب. "أحد أهداف العمل المستقبلي سيكون اكتشاف طريقة منهجية للعثور على تلك النقطة الجيدة، حتى نتمكن من اختيار أفضل ما يمكن D لموقف معين دون اللجوء إلى التجربة والخطأ.

هناك هدف آخر لباحثي معهد ماساتشوستس للتكنولوجيا يتضمن إيجاد المزيد من العمليات الفيزيائية التي يمكن أن توفر الأساس لعائلات جديدة من النماذج التوليدية. من خلال مشروع يسمى جينفيسلقد حدد الفريق بالفعل مرشحًا واعدًا واحدًا: إمكانات يوكاوا، والتي تتعلق بالقوة النووية الضعيفة. وقال ليو: "إنه يختلف عن نماذج تدفق وانتشار بواسون، حيث يتم الحفاظ على عدد الجسيمات دائمًا". "إن إمكانات يوكاوا تسمح لك بإبادة الجسيمات أو تقسيم الجسيم إلى قسمين. مثل هذا النموذج قد يحاكي، على سبيل المثال، الأنظمة البيولوجية حيث لا يجب أن يبقى عدد الخلايا كما هو.

وقال يو إن هذا قد يكون خطا مثمرا للتحقيق. "يمكن أن يؤدي ذلك إلى خوارزميات جديدة ونماذج توليدية جديدة مع تطبيقات محتملة تمتد إلى ما هو أبعد من توليد الصور."

وقد تجاوز PFGM++ وحده بالفعل التوقعات الأصلية لمخترعيه. لم يدركوا في البداية أنه متى D تم ضبطه على ما لا نهاية، ويصبح نموذج تدفق بواسون المضخم الخاص بهم غير قابل للتمييز عن نموذج الانتشار. اكتشف ليو هذا من خلال الحسابات التي أجراها في وقت سابق من هذا العام.

ميرت بيلانشيويعتبر عالم الكمبيوتر في جامعة ستانفورد أن هذا "التوحيد" هو أهم نتيجة تنبع من عمل فريق معهد ماساتشوستس للتكنولوجيا. قال: "تكشف ورقة PFGM++ أن كلا النموذجين جزء من فئة أوسع، الأمر الذي يثير سؤالًا مثيرًا للاهتمام: هل يمكن أن تكون هناك نماذج فيزيائية أخرى للذكاء الاصطناعي التوليدي تنتظر الاكتشاف، مما يشير إلى توحيد أكبر؟ "

الطابع الزمني:

اكثر من كوانتماجازين