اوپن اے آئی کوانٹم اے آئی پر اپنی شرطوں کو کیوں روک رہا ہے۔

اوپن اے آئی کوانٹم اے آئی پر اپنی شرطوں کو کیوں روک رہا ہے۔

کیوں OpenAI کوانٹم AI PlatoBlockchain ڈیٹا انٹیلی جنس پر اپنی شرط لگا رہا ہے۔ عمودی تلاش۔ عی

تجزیہ کوانٹم کمپیوٹنگ اب ایک دہائی سے ایک دہائی دور رہ گئی ہے، لیکن صنعت کے ماہرین کے مطابق یہ AI کی لاجواب بھوک کو روکنے کا راز رکھ سکتا ہے۔

ہر گزرتے مہینے کے ساتھ، بڑے، زیادہ پیرامیٹر والے ماڈل نمودار ہوتے ہیں اور AI کی تعیناتیوں کا پیمانہ مل کر پھیلتا ہے۔ اس سال اکیلے ہائپر اسکیلرز جیسے میٹا، منصوبہ بنا رہے ہیں۔ تعیناتی سیکڑوں ہزاروں ایکسلریٹر۔ یہاں تک کہ اب بھی OpenAI کے بانی سیم آلٹمین ہیں۔ یقین اگر ہم AI کو مزید تیار کرنا چاہتے ہیں تو ہمیں تیزی سے زیادہ حساب کی ضرورت ہوگی۔

اس لیے اس میں کوئی تعجب کی بات نہیں ہونی چاہیے کہ اس کے تازہ ترین کرایہ کے ساتھ، OpenAI گا کوانٹم کمپیوٹنگ پر اپنی دائو کو روکنے کے موقع پر یہ کر سکتا ہے۔ پچھلے ہفتے، AI juggernaut نے PsiQuantum کے سابق کوانٹم سسٹمز آرکیٹیکٹ بین بارٹلیٹ کو اپنی صفوں میں شامل کیا۔

ہم نے اوپن AI تک رسائی حاصل کی تاکہ اس بارے میں مزید معلومات حاصل کی جا سکیں کہ بارٹلیٹ AI ٹرینڈ سیٹر میں کیا کر رہا ہے، اور ہم نے کوئی جواب نہیں دیا۔ تاہم اس کے جیو کچھ اشارے پیش کرتا ہے کیونکہ اس کی زیادہ تر تحقیق نے کوانٹم فزکس، مشین لرننگ، اور نینو فوٹونکس کے درمیان چوراہے پر توجہ مرکوز کی ہے، اور "بنیادی طور پر میں فوٹون کے لیے ریس کے چھوٹے ٹریک ڈیزائن کرنے پر مشتمل ہوتا ہے جو انہیں مفید کمپیوٹیشن کرنے کے لیے دھوکہ دیتے ہیں"

تو اوپن اے آئی کوانٹم فزیکسٹ کے ساتھ بالکل کیا چاہ سکتا ہے؟ ٹھیک ہے، کوانٹم آپٹیمائزیشن کے استعمال سے لے کر ٹریننگ ڈیٹا سیٹس کو ہموار کرنے یا پیچیدہ گراف ڈیٹا بیس کو آف لوڈ کرنے کے لیے کوانٹم پروسیسنگ یونٹس (QPUs) کا استعمال کرنے سے لے کر جدید سیمی کنڈکٹر پیکیجنگ کی حدود سے باہر جانے کے لیے آپٹکس کا استعمال کرنے کے کچھ امکانات ہیں۔

عصبی نیٹ ورک صرف ایک اور اصلاحی مسئلہ ہیں۔

D-Wave کے مرے تھام نے بتایا کہ کوانٹم کمپیوٹنگ میں بڑے AI ماڈلز کی تربیت کی کارکردگی کو تیزی سے بہتر کرنے کی صلاحیت ہے، جس سے وہ کم پیرامیٹرز والے ماڈلز سے زیادہ درست جوابات حاصل کر سکتے ہیں۔ رجسٹر.

GPT-4 کے ایک ٹریلین پیرامیٹرز سے زیادہ ہونے کی افواہ کے ساتھ، یہ دیکھنا مشکل نہیں ہے کہ یہ پرکشش کیوں ہو سکتا ہے۔ کوانٹائزیشن اور دیگر کمپریشن حکمت عملیوں کا سہارا لیے بغیر، AI ماڈلز کو FP1 یا Int8 پریزیشن پر چلتے وقت ہر بلین پیرامیٹرز کے لیے تقریباً 8GB میموری کی ضرورت ہوتی ہے، اس سے کافی زیادہ۔

ٹریلین پیرامیٹر ماڈل اس حد کے قریب ہیں جو ایک واحد AI سرور مؤثر طریقے سے ایڈجسٹ کر سکتا ہے۔ بڑے ماڈلز کو سپورٹ کرنے کے لیے ایک سے زیادہ سرورز کو اکٹھا کیا جا سکتا ہے، لیکن باکس کو چھوڑنے سے کارکردگی کا جرمانہ ہوتا ہے۔

اور وہ آج ہے۔ اور اگر Altman درست ہے تو یہ ماڈل صرف بڑے اور زیادہ مقبول ہونے جا رہے ہیں۔ اس طرح، کوئی بھی ٹکنالوجی جو OpenAI کو پیرامیٹر کی گنتی کو معنی خیز طور پر بڑھائے بغیر اپنے ماڈلز کی صلاحیت کو بڑھانے دے سکتی ہے۔

"جب آپ کسی ماڈل کی تربیت کر رہے ہیں، تو ماڈل میں جانے والے پیرامیٹرز کی تعداد واقعی ماڈل کی تربیت کی لاگت اور پیچیدگی کو بڑھاتی ہے،" ٹریور لینٹنگ، سافٹ ویئر اور الگورتھم کے D-Wave VP بتاتے ہیں۔ رجسٹر.

اس کے ارد گرد حاصل کرنے کے لئے، وہ بتاتے ہیں، ڈویلپر اکثر ان خصوصیات کو ذیلی منتخب کریں گے جو ان کے خیال میں اس مخصوص ماڈل کی تربیت کے لیے سب سے اہم ہوں گی، جس کے نتیجے میں مطلوبہ پیرامیٹرز کی تعداد کم ہو جاتی ہے۔

لیکن روایتی نظاموں کا استعمال کرتے ہوئے ایسا کرنے کی کوشش کرنے کے بجائے، D-Wave اس معاملے کو بناتا ہے کہ کوانٹم آپٹیمائزیشن الگورتھم اس بات کا تعین کرنے میں زیادہ مؤثر ثابت ہو سکتے ہیں کہ کن خصوصیات کو اندر یا باہر چھوڑنا ہے۔

اگر آپ واقف نہیں ہیں تو، اصلاح کے مسائل، جیسا کہ عام طور پر پاتھ فائنڈنگ یا لاجسٹکس میں دیکھا جاتا ہے، کوانٹم کمپیوٹنگ کی اب تک کی سب سے امید افزا ایپلی کیشنز میں سے ایک ثابت ہوئی ہے۔

تھوم نے کہا، "ہمارے کوانٹم کمپیوٹرز جس چیز میں واقعی اچھے ہیں وہ ان چیزوں کو بہتر بنانا ہے جہاں چیزیں ہو رہی ہیں یا نہیں ہو رہی ہیں: جیسے کسی کو ایک خاص شیڈول تفویض کیا گیا ہو یا کوئی خاص ترسیل تفویض کی گئی ہو،" تھام نے کہا۔ "اگر یہ فیصلے آزاد تھے، تو یہ ٹھیک ہوگا، اور کلاسیکی کمپیوٹر کے لیے ایسا کرنا آسان ہوگا، لیکن وہ درحقیقت پول میں موجود دیگر وسائل کو متاثر کرتے ہیں اور ایک طرح کا نیٹ ورک اثر ہوتا ہے۔"

دوسرے الفاظ میں، حقیقی دنیا گندا ہے. سڑک پر ایک سے زیادہ گاڑیاں ہو سکتی ہیں، سڑک کی بندش، موسمی واقعات وغیرہ وغیرہ۔ کلاسیکی کمپیوٹرز کے مقابلے میں، کوانٹم کمپیوٹرز میں موجود منفرد صفات انہیں بہترین راستے کی شناخت کے لیے بیک وقت ان عوامل کو تلاش کرنے کی اجازت دیتی ہیں۔

یہ، "مکمل طور پر ایک عصبی نیٹ ورک کے مشابہ ہے جہاں نیوران یا تو فائر کر رہے ہیں یا فائر نہیں کر رہے ہیں، اور ان کے اور ان کے دوسرے نیورانوں کے ساتھ Synaptic کنکشن ہیں، جو یا تو دوسرے نیورانوں کو فائرنگ سے پرجوش یا روکتے ہیں،" تھام بتاتے ہیں۔

اور اس کا مطلب یہ ہے کہ کوانٹم الگورتھم کو مخصوص ضروریات کے لیے AI ٹریننگ ڈیٹاسیٹس کو بہتر بنانے کے لیے استعمال کیا جا سکتا ہے، جس کی تربیت کے بعد، ایک دبلا، زیادہ درست ماڈل ہوتا ہے، لینٹنگ نے دعویٰ کیا۔

کوانٹم سیمپلنگ اور آف لوڈنگ

طویل مدتی، D-Wave اور دیگر لوگ QPUs کو تربیتی عمل میں گہرائی تک لاگو کرنے کے طریقے تلاش کر رہے ہیں۔

ان میں سے ایک استعمال کے معاملات میں نمونے لینے کے لیے کوانٹم کمپیوٹنگ کا اطلاق شامل ہے۔ نمونے لینے سے مراد یہ ہے کہ AI ماڈلز، جیسے LLMs، یہ تعین کرتے ہیں کہ اگلا لفظ، یا خاص طور پر ٹوکن، امکانات کی تقسیم پر مبنی ہونا چاہیے۔ یہی وجہ ہے کہ اکثر یہ مذاق اڑایا جاتا ہے کہ ایل ایل ایم صرف سٹیرائڈز پر خود بخود مکمل ہوتے ہیں۔

"ہارڈ ویئر نمونے تیار کرنے میں بہت اچھا ہے، اور آپ تقسیم کو ٹیون کر سکتے ہیں، تاکہ آپ ان نمونوں کے وزن کو ٹیون کر سکیں۔ اور جو ہم تلاش کر رہے ہیں وہ یہ ہے کہ: کیا یہ واقعی اینیلنگ کوانٹم کمپیوٹنگ کو سخت اور براہ راست تربیتی کام کے بوجھ میں داخل کرنے کا ایک اچھا طریقہ ہے،" لینٹنگ نے وضاحت کی۔

فرانسیسی کوانٹم کمپیوٹنگ سٹارٹ اپ Pasqal بھی عام طور پر نیورل نیٹ ورکس میں پائے جانے والے گراف سٹرکچرڈ ڈیٹا سیٹس کو آف لوڈ کرنے کے لیے کوانٹم کمپیوٹنگ کا اطلاق کر رہا ہے۔

"مشین لرننگ میں ڈیٹا کو کلاسیکی طور پر پیش کرنے کا کوئی آسان طریقہ نہیں ہے، کیونکہ گراف ایک پیچیدہ چیز ہے،" پاسکال کے شریک سی ای او لوئک ہینریٹ نے ایک انٹرویو میں وضاحت کی۔ رجسٹر. "آپ نسبتاً قدرتی طور پر کوانٹم ڈائنامکس میں گراف ساختہ ڈیٹا کو سرایت کر سکتے ہیں، جو ڈیٹا کے ان ٹکڑوں کے علاج کے کچھ نئے طریقوں کو جنم دیتا ہے۔"

تاہم، اس کو حاصل کرنے سے پہلے، کوانٹم سسٹم کو بہت بڑا اور بہت تیز ہونا پڑے گا، ہینریٹ نے وضاحت کی۔

"بڑے ڈیٹاسیٹس اس لمحے کے لیے عملی نہیں ہیں،" انہوں نے کہا۔ اسی لیے ہم qubits کی تعداد کو بڑھا رہے ہیں۔ تکرار کی شرح. کیونکہ زیادہ کیوبٹس کے ساتھ آپ مزید ڈیٹا ایمبیڈ کر سکتے ہیں۔

کوانٹم گراف نیورل نیٹ ورک کے قابل عمل ہونے سے پہلے ہمیں کتنا انتظار کرنا پڑے گا یہ کہنا مشکل ہے۔ پاسکال کے پاس پہلے سے ہی 10,000 کیوبٹ سسٹم موجود ہے۔ کاموں میں. بدقسمتی سے، تحقیق بتاتی ہے کہ 10,000 غلطی کو درست کرنے والے کوئبٹس، یا تقریباً ایک ملین فزیکل qubits کے ساتھ ایک سسٹم بھی کافی نہیں ہو سکتا۔ مقابلہ جدید GPUs کے ساتھ۔

ایک سلکان فوٹوونکس پلے؟

غیر ملکی کوانٹم AI کے استعمال کے معاملات کو ایک طرف رکھتے ہوئے، ایسی دوسری ٹیکنالوجیز ہیں جو OpenAI کی پیروی کی جا سکتی ہیں جن کے لیے Bartlett بالکل ایک ماہر ہوتا ہے۔

خاص طور پر، بارٹلیٹ کا سابق آجر PsiQuantum سلیکون فوٹوونکس پر مبنی نظام تیار کر رہا ہے۔ اس سے پتہ چلتا ہے کہ اس کا کرایہ OpenAI سے متعلق ہوسکتا ہے۔ رپورٹ کے مطابق اپنی مرضی کے مطابق AI ایکسلریٹر پر کام کریں۔

کئی سلیکون فوٹوونکس اسٹارٹ اپس، بشمول Ayar Labs، Lightmatter، اور Celestial AI نے ٹیکنالوجی کو بینڈوتھ کی حدوں پر قابو پانے کے ایک ذریعہ کے طور پر آگے بڑھایا ہے، جو مشین سیکھنے کی کارکردگی کو محدود کرنے والا عنصر بن گیا ہے۔

یہاں خیال یہ ہے کہ آپ خالص برقی سگنل کے ساتھ روشنی کے ساتھ بہت زیادہ فاصلے پر بہت زیادہ ڈیٹا کو آگے بڑھا سکتے ہیں۔ ان میں سے بہت سے ڈیزائنوں میں، روشنی کو درحقیقت سیلیکون میں ڈالی گئی لہر گائیڈز کے ذریعے لے جایا جاتا ہے، جو کہ "فوٹانز کے لیے چھوٹی ریس ٹریکس کو ڈیزائن کرنا" جیسا خوفناک لگتا ہے۔

لائٹ میٹر خیال ہے یہ ٹکنالوجی ایک سے زیادہ سرعت کاروں کو ایک کے طور پر کام کرنے کی اجازت دے گی اور چپ چھوڑنے والے ڈیٹا پر بینڈوتھ جرمانہ لگائے بغیر۔ اسی دوران Celestial ایک دیکھتا ہے۔ موقع ایکسلریٹر ڈائی سے براہ راست متصل ماڈیولز کو کو-پیکیج کرنے کی ضرورت کو ختم کرکے GPUs کو دستیاب ہائی بینڈوڈتھ میموری کی مقدار میں وسیع پیمانے پر اضافہ کرنا۔ یہ دونوں صلاحیتیں بڑے پیمانے پر اے آئی سسٹمز کے ساتھ کام کرنے والی کمپنی کے لیے پرکشش ہوں گی۔

آیا OpenAI بالآخر کوانٹم AI کا تعاقب کرے گا یا سلیکون فوٹوونکس کو دیکھنا باقی ہے، لیکن ایک ایسی کمپنی کے لیے جس کا بانی طویل مدتی سرمایہ کاری کرنے میں کوئی اجنبی نہیں ہے، یہ سب سے عجیب بات نہیں ہوگی جس کی Altman نے حمایت کی ہے۔ ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر