نیا 'فزکس سے متاثر' جنریٹو AI توقعات سے زیادہ | کوانٹا میگزین

نیا 'فزکس سے متاثر' جنریٹو AI توقعات سے زیادہ | کوانٹا میگزین

New ‘Physics-Inspired’ Generative AI Exceeds Expectations | Quanta Magazine PlatoBlockchain Data Intelligence. Vertical Search. Ai.

تعارف

مصنوعی ذہانت کے اوزار - خاص طور پر عصبی نیٹ ورکس - طبیعیات دانوں کے لیے اچھے رہے ہیں۔ برسوں سے، اس ٹیکنالوجی نے محققین کو ایکسلریٹر تجربات میں ذرات کی رفتار کو دوبارہ بنانے، نئے ذرات کے ثبوت تلاش کرنے، اور کشش ثقل کی لہروں اور ایکسپوپلینٹس کا پتہ لگانے میں مدد کی ہے۔ اگرچہ اے آئی ٹولز واضح طور پر طبیعیات دانوں کے لیے بہت کچھ کر سکتے ہیں، لیکن میساچوسٹس انسٹی ٹیوٹ آف ٹیکنالوجی کے ماہر طبیعیات میکس ٹیگ مارک کے مطابق اب سوال یہ ہے: "کیا ہم کچھ واپس کر سکتے ہیں؟"

Tegmark کا خیال ہے کہ اس کے ماہر طبیعیات کے ساتھی AI کی سائنس میں اہم شراکت کر سکتے ہیں، اور اس نے اسے اپنی اولین تحقیقی ترجیح بنا لیا ہے۔ انہوں نے کہا کہ ایک طریقہ طبیعیات دان AI ٹیکنالوجی کو آگے بڑھانے میں مدد کر سکتے ہیں، یہ ہوگا کہ نیورل نیٹ ورکس کے "بلیک باکس" الگورتھم کو تبدیل کیا جائے، جن کے کام کرنے والے جسمانی عمل کی اچھی طرح سے سمجھی جانے والی مساوات کے ساتھ، بڑی حد تک ناقابل تسخیر ہیں۔

خیال بالکل نیا نہیں ہے۔ تخلیقی AI ماڈل پھیلاؤ کی بنیاد پر - وہ عمل جو، مثال کے طور پر، کافی کے کپ میں ڈالے گئے دودھ کو یکساں طور پر پھیلانے کا سبب بنتا ہے - پہلی بار 2015 میں سامنے آیا، اور اس کے بعد سے ان کی تخلیق کردہ تصاویر کے معیار میں نمایاں بہتری آئی ہے۔ یہ ٹیکنالوجی مقبول تصویر بنانے والے سافٹ ویئر جیسے DALL·E 2 اور Midjourney کو طاقت دیتی ہے۔ اب، ٹیگ مارک اور اس کے ساتھی یہ سیکھ رہے ہیں کہ آیا فزکس سے متاثر دیگر جنریٹو ماڈل بھی بازی پر مبنی ماڈلز کے ساتھ ساتھ کام کر سکتے ہیں، یا اس سے بھی بہتر۔

پچھلے سال کے آخر میں، ٹیگ مارک کی ٹیم نے تصاویر بنانے کا ایک امید افزا نیا طریقہ متعارف کرایا جسے کہا جاتا ہے۔ زہر کا بہاؤ پیدا کرنے والا ماڈل (PFGM)۔ اس میں، ڈیٹا کی نمائندگی چارج شدہ ذرات کے ذریعے کی جاتی ہے، جو مل کر ایک برقی میدان بناتے ہیں جس کی خصوصیات کسی بھی لمحے چارجز کی تقسیم پر منحصر ہوتی ہیں۔ اسے پوسن فلو ماڈل کہا جاتا ہے کیونکہ چارجز کی حرکت پوسن مساوات سے چلتی ہے، جو اس اصول سے ماخوذ ہے کہ دو چارجز کے درمیان الیکٹرو سٹیٹک قوت ان کے درمیان فاصلے کے مربع کے ساتھ الٹا مختلف ہوتی ہے (نیوٹنین کشش ثقل کی تشکیل کی طرح) .

وہ جسمانی عمل PFGM کے مرکز میں ہے۔ "ہمارے ماڈل کو خلا میں ہر مقام پر برقی میدان کی طاقت اور سمت سے تقریبا مکمل طور پر نمایاں کیا جا سکتا ہے،" کہا یلون سو، MIT میں گریجویٹ طالب علم اور مقالے کے شریک مصنف۔ "تربیت کے عمل کے دوران نیورل نیٹ ورک جو کچھ سیکھتا ہے وہ یہ ہے کہ اس برقی میدان کا اندازہ کیسے لگایا جائے۔" اور ایسا کرتے ہوئے، یہ تصاویر بنانا سیکھ سکتا ہے کیونکہ اس ماڈل میں ایک تصویر کو برقی میدان کے ذریعے مختصراً بیان کیا جا سکتا ہے۔

تعارف

PFGM اسی معیار کی تصاویر بنا سکتا ہے جو کہ بازی پر مبنی نقطہ نظر سے تیار کی جاتی ہیں اور 10 سے 20 گنا زیادہ تیزی سے کرتی ہیں۔ "یہ ایک جسمانی ساخت، برقی میدان کو اس طرح استعمال کرتا ہے جو ہم نے پہلے کبھی نہیں دیکھا،" کہا۔ حنانیل حزانٹفٹس یونیورسٹی میں کمپیوٹر سائنسدان۔ "اس سے ہمارے اعصابی نیٹ ورک کو بہتر بنانے کے لیے دیگر جسمانی مظاہر کے استعمال کے امکانات کا دروازہ کھل جاتا ہے۔"

فزکس سے درآمد کردہ مساوات پر مبنی ہونے کے علاوہ، ڈفیوژن اور پوسن فلو ماڈلز میں بہت کچھ مشترک ہے۔ تربیت کے دوران، تصویر بنانے کے لیے تیار کردہ ایک ڈفیوژن ماڈل عام طور پر ایک تصویر سے شروع ہوتا ہے — ایک کتا، آئیے کہتے ہیں — اور پھر بصری شور کو شامل کرتا ہے، ہر پکسل کو بے ترتیب طریقے سے تبدیل کرتا ہے جب تک کہ اس کے فیچرز کو مکمل طور پر ختم نہ کر دیا جائے (حالانکہ مکمل طور پر ختم نہیں ہو جاتا)۔ اس کے بعد ماڈل اس عمل کو ریورس کرنے کی کوشش کرتا ہے اور ایک ایسا کتا تیار کرتا ہے جو اصل کے قریب ہو۔ ایک بار تربیت حاصل کرنے کے بعد، ماڈل بظاہر خالی کینوس سے شروع ہو کر کامیابی کے ساتھ کتے — اور دیگر تصاویر بنا سکتا ہے۔

زہر کے بہاؤ کے ماڈل اسی طرح کام کرتے ہیں۔ تربیت کے دوران، ایک آگے کا عمل ہوتا ہے، جس میں ایک بار تیز تصویر میں شور، بتدریج، اور ایک الٹا عمل شامل ہوتا ہے جس میں ماڈل اس شور کو دور کرنے کی کوشش کرتا ہے، مرحلہ وار، جب تک کہ ابتدائی ورژن زیادہ تر بازیافت نہ ہو جائے۔ بازی پر مبنی نسل کی طرح، نظام آخر کار ایسی تصاویر بنانا سیکھتا ہے جو اس نے تربیت میں کبھی نہیں دیکھی تھی۔

لیکن Poisson ماڈلز کے تحت طبیعیات بالکل مختلف ہے۔ بازی تھرموڈینامک قوتوں سے چلتی ہے، جبکہ پوسن کا بہاؤ الیکٹرو اسٹاٹک قوتوں سے چلتا ہے۔ مؤخر الذکر چارجز کے انتظام کا استعمال کرتے ہوئے ایک تفصیلی تصویر کی نمائندگی کرتا ہے جو ایک بہت ہی پیچیدہ برقی میدان بنا سکتا ہے۔ تاہم، یہ فیلڈ وقت کے ساتھ ساتھ چارجز کو زیادہ یکساں طور پر پھیلانے کا سبب بنتی ہے - بالکل اسی طرح جیسے دودھ قدرتی طور پر کافی کے کپ میں پھیل جاتا ہے۔ نتیجہ یہ ہے کہ میدان خود آسان اور زیادہ یکساں ہو جاتا ہے۔ لیکن یہ شور مچانے والا یکساں میدان مکمل خالی سلیٹ نہیں ہے۔ اس میں اب بھی معلومات کے بیج موجود ہیں جن سے تصاویر کو آسانی سے جمع کیا جا سکتا ہے۔

2023 کے اوائل میں، ٹیم نے اپنے Poisson ماڈل کو اپ گریڈ کیا، اس کی توسیع ماڈلز کے پورے خاندان کو گھیرنے کے لیے۔ بڑھا ہوا ورژن، PFGM++، میں ایک نیا پیرامیٹر شامل ہے، D، جو محققین کو نظام کی جہت کو ایڈجسٹ کرنے کی اجازت دیتا ہے۔ اس سے بڑا فرق پڑ سکتا ہے: واقف سہ جہتی جگہ میں، چارج سے پیدا ہونے والے برقی میدان کی طاقت کا تعلق اس چارج سے فاصلے کے مربع سے الٹا ہوتا ہے۔ لیکن چار جہتوں میں، فیلڈ کی طاقت ایک الٹا مکعب قانون کی پیروی کرتی ہے۔ اور جگہ کی ہر جہت، اور ہر قدر کے لیے D، یہ رشتہ کچھ مختلف ہے۔

تعارف

اس واحد اختراع نے Poisson کے بہاؤ کے ماڈلز کو بہت زیادہ تغیر بخشا، جس میں انتہائی صورتیں مختلف فوائد کی پیشکش کرتی ہیں۔ کب D کم ہے، مثال کے طور پر، ماڈل زیادہ مضبوط ہے، یعنی یہ الیکٹرک فیلڈ کا تخمینہ لگانے میں ہونے والی غلطیوں کو زیادہ برداشت کرتا ہے۔ "ماڈل برقی میدان کی پوری طرح سے پیش گوئی نہیں کر سکتا،" نے کہا زیمنگ لیو، MIT میں ایک اور گریجویٹ طالب علم اور دونوں مقالوں کے شریک مصنف۔ "ہمیشہ کچھ انحراف ہوتا ہے۔ لیکن مضبوطی کا مطلب یہ ہے کہ اگر آپ کے تخمینے کی غلطی زیادہ ہے، تب بھی آپ اچھی تصاویر بنا سکتے ہیں۔" لہذا آپ اپنے خوابوں کے کتے کے ساتھ ختم نہیں ہوسکتے ہیں، لیکن آپ پھر بھی کتے سے ملتی جلتی چیز کے ساتھ ختم ہوجائیں گے۔

دوسری انتہا پر، جب D زیادہ ہے، اعصابی نیٹ ورک کو تربیت دینا آسان ہو جاتا ہے، اس کی فنکارانہ مہارت میں مہارت حاصل کرنے کے لیے کم ڈیٹا کی ضرورت ہوتی ہے۔ صحیح وجہ کی وضاحت کرنا آسان نہیں ہے، لیکن یہ اس حقیقت کا مرہون منت ہے کہ جب زیادہ جہتیں ہوتی ہیں، تو ماڈل میں ٹریک رکھنے کے لیے کم الیکٹرک فیلڈز ہوتے ہیں — اور اس وجہ سے ڈیٹا کو ضم کرنے کے لیے کم ہوتا ہے۔

بہتر ماڈل، PFGM++، "آپ کو ان دو انتہاؤں کے درمیان مداخلت کرنے کی لچک فراہم کرتا ہے،" نے کہا روز یو، یونیورسٹی آف کیلیفورنیا، سان ڈیاگو میں کمپیوٹر سائنسدان۔

اور اس حد کے اندر کہیں اس کے لیے ایک مثالی قدر ہے۔ D جو کہ مضبوطی اور تربیت میں آسانی کے درمیان صحیح توازن قائم کرتا ہے، سو نے کہا۔ "مستقبل کے کام کا ایک مقصد یہ ہوگا کہ اس میٹھی جگہ کو تلاش کرنے کا ایک منظم طریقہ معلوم کیا جائے، تاکہ ہم بہترین ممکنہ انتخاب کرسکیں۔ D آزمائش اور غلطی کا سہارا لیے بغیر دی گئی صورتحال کے لیے۔

MIT محققین کے لیے ایک اور مقصد میں مزید جسمانی عمل تلاش کرنا شامل ہے جو کہ تخلیقی ماڈلز کے نئے خاندانوں کی بنیاد فراہم کر سکتے ہیں۔ نامی ایک پروجیکٹ کے ذریعے GenPhysٹیم نے پہلے ہی ایک امید افزا امیدوار کی شناخت کر لی ہے: یوکاوا پوٹینشل، جو کمزور جوہری قوت سے متعلق ہے۔ لیو نے کہا کہ "یہ پوسن کے بہاؤ اور پھیلاؤ کے ماڈلز سے مختلف ہے، جہاں ذرات کی تعداد ہمیشہ محفوظ رہتی ہے۔" "یوکاوا کی صلاحیت آپ کو ذرات کو ختم کرنے یا ایک ذرہ کو دو حصوں میں تقسیم کرنے کی اجازت دیتی ہے۔ ایسا ماڈل، مثال کے طور پر، حیاتیاتی نظاموں کی تقلید کر سکتا ہے جہاں خلیوں کی تعداد کو ایک جیسا نہیں رہنا پڑتا ہے۔"

یہ انکوائری کی ایک نتیجہ خیز لائن ہو سکتی ہے، یو نے کہا۔ "یہ نئے الگورتھم اور نئے جنریٹو ماڈلز کا باعث بن سکتا ہے جس میں ممکنہ ایپلی کیشنز امیج جنریشن سے آگے بڑھ سکتی ہیں۔"

اور اکیلے PFGM++ پہلے ہی اپنے موجدوں کی اصل توقعات سے تجاوز کرچکا ہے۔ انہیں پہلے تو احساس ہی نہیں ہوا کہ کب D لامحدودیت پر سیٹ ہے، ان کا ایمپڈ اپ پوسن فلو ماڈل ڈفیوژن ماڈل سے الگ نہیں ہو سکتا۔ لیو نے اس سال کے شروع میں کیے گئے حسابات میں یہ دریافت کیا۔

میرٹ پیلانکیاسٹینفورڈ یونیورسٹی کے ایک کمپیوٹر سائنس دان، اس "اتحاد" کو MIT گروپ کے کام کا سب سے اہم نتیجہ سمجھتے ہیں۔ "PFGM++ پیپر،" انہوں نے کہا، "یہ ظاہر کرتا ہے کہ یہ دونوں ماڈلز ایک وسیع تر طبقے کا حصہ ہیں، [جو] ایک دلچسپ سوال اٹھاتا ہے: کیا دریافت کے منتظر AI کے لیے اور بھی فزیکل ماڈل ہوسکتے ہیں، جو اس سے بھی بڑے اتحاد کی طرف اشارہ کرتے ہیں؟ "

ٹائم اسٹیمپ:

سے زیادہ کوانٹا میگزین