OpenAI کے سی ای او سیم آلٹمین کا کہنا ہے کہ ان کی کمپنی اب GPT-5 بنا رہی ہے۔

OpenAI کے سی ای او سیم آلٹمین کا کہنا ہے کہ ان کی کمپنی اب GPT-5 بنا رہی ہے۔

OpenAI CEO Sam Altman Says His Company Is Now Building GPT-5 PlatoBlockchain Data Intelligence. Vertical Search. Ai.

مارچ میں ایک MIT ایونٹ میں، OpenAI کے شریک بانی اور CEO سیم آلٹمین نے کہا کہ ان کی ٹیم ابھی تک اپنے اگلے AI، GPT-5 کی تربیت نہیں کر رہی ہے۔ "ہم کچھ وقت کے لیے نہیں ہیں اور نہ ہوں گے" اس نے سامعین سے کہا.

اس ہفتے، تاہم، GPT-5 کی حیثیت کے بارے میں نئی ​​تفصیلات سامنے آئیں۔

ایک انٹرویو میں ، آلٹ مین نے بتایا فنانشل ٹائمز کمپنی اب GPT-5 تیار کرنے پر کام کر رہی ہے۔ اگرچہ مضمون میں یہ واضح نہیں کیا گیا کہ آیا ماڈل ٹریننگ میں ہے — ایسا نہیں ہے — آلٹ مین نے کہا کہ اسے مزید ڈیٹا کی ضرورت ہوگی۔ ڈیٹا عوامی آن لائن ذرائع سے آئے گا — جس طرح اس طرح کے الگورتھم، جنہیں بڑے لینگوئج ماڈل کہا جاتا ہے، پہلے تربیت یافتہ ہیں — اور ملکیتی نجی ڈیٹا سیٹس۔

کے ساتھ یہ لائنیں پچھلے ہفتے اوپن اے آئی کی کال تنظیموں کے لیے نجی ڈیٹاسیٹس پر تعاون کرنے کے ساتھ ساتھ بڑے پبلشرز سے قیمتی مواد حاصل کرنے کے لیے پیشگی کام ایسوسی ایٹڈ پریس اور خبریں کارپوریشن. ایک بلاگ پوسٹ میں، ٹیاس کی ٹیم نے کہا کہ وہ ٹیکسٹ، امیجز، آڈیو یا ویڈیو پر شراکت داری کرنا چاہتے ہیں لیکن خاص طور پر "منقطع ٹکڑوں کے بجائے طویل تحریر یا گفتگو" میں دلچسپی رکھتے ہیں جو "انسانی ارادے" کا اظہار کرتے ہیں۔

یہ کوئی تعجب کی بات نہیں ہے کہ OpenAI عوامی طور پر دستیاب نہیں اعلی معیار کے ذرائع کو ٹیپ کرنے کی کوشش کر رہا ہے۔ AI کی انتہائی ڈیٹا کی ضروریات اس کی ترقی میں ایک اہم نقطہ ہیں۔ چیٹ جی پی ٹی جیسے چیٹ بوٹس کے پیچھے زبان کے بڑے ماڈلز کا عروج زیادہ ڈیٹا استعمال کرنے والے ہمیشہ سے بڑے الگورتھم کے ذریعہ کارفرما تھا۔ ان دونوں میں سے، یہ ممکن ہے کہ اس سے بھی زیادہ ڈیٹا جو کہ اعلیٰ معیار کا ہے قریب ترین مدت کے زیادہ نتائج دے سکتا ہے۔ حالیہ تحقیق تجویز کرتا ہے کہ چھوٹے ماڈلز کو بڑی مقدار میں ڈیٹا کھلایا جائے۔ کم کھلایا بڑے ماڈلز سے بہتر کارکردگی کا مظاہرہ کریں۔

"مصیبت یہ ہے کہ، دیگر اعلیٰ انسانی ثقافتی مصنوعات کی طرح، اچھی نثر کا شمار معروف کائنات میں پیدا کرنا مشکل ترین چیزوں میں ہوتا ہے،" راس اینڈرسن نے لکھا بحر اوقیانوس اس سال. "یہ لامحدود فراہمی میں نہیں ہے، اور AI کے لیے، کوئی پرانا متن ایسا نہیں کرے گا: کتابوں پر تربیت یافتہ بڑے زبان کے ماڈلز سوشل میڈیا پوسٹس کے بڑے بیچوں پر تربیت یافتہ مصنفین سے کہیں زیادہ بہتر ہیں۔"

GPT-4 کو تربیت دینے کے لیے زیادہ تر انٹرنیٹ کو کھرچنے کے بعد، ایسا لگتا ہے کہ کم لٹکنے والے پھل کو بڑی حد تک چن لیا گیا ہے۔ محققین کی ایک ٹیم نے پچھلے سال عوامی طور پر قابل رسائی کی فراہمی کا اندازہ لگایا، اعلیٰ معیار کا آن لائن ڈیٹا 2026 تک ختم ہو جائے گا۔. اس کے ارد گرد ایک طریقہ، کم از کم قریبی مدت میں، نجی معلومات کے گروہ کے مالکان کے ساتھ سودے کرنا ہے۔

کمپیوٹنگ ایک اور روڈ بلاک ہے جس کو انٹرویو میں Altman نے خطاب کیا۔

OpenAI کے GPT-4 جیسے فاؤنڈیشن ماڈلز کو گرافکس پروسیسنگ یونٹس (GPUs) کی وسیع فراہمی کی ضرورت ہوتی ہے، ایک قسم کی خصوصی کمپیوٹر چپ جو وسیع پیمانے پر AI کو تربیت دینے اور چلانے کے لیے استعمال ہوتی ہے۔ Chipmaker Nvidia GPUs کا سب سے بڑا فراہم کنندہ ہے، اور ChatGPT کے آغاز کے بعد، اس کی چپس ٹیک میں سب سے زیادہ گرم اشیاء رہی ہیں۔ آلٹ مین نے کہا کہ انہوں نے حال ہی میں کمپنی کی تازہ ترین H100 چپس کی ایک کھیپ کی ڈیلیوری لی ہے، اور انہیں توقع ہے کہ 2024 میں سپلائی مزید کم ہو جائے گی۔

زیادہ دستیابی کے علاوہ، نئے چپس بھی تیز نظر آتے ہیں۔

کی طرف سے اس ہفتے جاری ٹیسٹ میں AI بینچ مارکنگ تنظیم MLPerf، چپس نے صرف پانچ ماہ قبل سیٹ کیے گئے نشان سے تقریباً تین گنا تیز زبان کے ماڈلز کو تربیت دی۔ (چونکہ MLPerf نے پانچ سال پہلے AI چپس کو بینچ مارک کرنا شروع کیا تھا، مجموعی کارکردگی میں 49 کے عنصر سے بہتری آئی ہے۔)

لائنوں کے درمیان پڑھنا — جو کہ کے طور پر زیادہ مشکل ہو گیا ہے۔ صنعت کم شفاف ہو گئی ہے—جی پی ٹی-5 کام جس کی طرف Altman اشارہ کر رہا ہے وہ الگورتھم کی تربیت کے بجائے ضروری اجزاء کو جمع کرنے کے بارے میں زیادہ ہے۔ کمپنی سرمایہ کاروں سے فنڈنگ ​​محفوظ کرنے کے لیے کام کر رہی ہے۔GPT-4 کی تربیت پر 100 ملین ڈالر سے زیادہ لاگت آئی ہے۔Nvidia سے چپس، اور کوالٹی ڈیٹا جہاں سے وہ اس پر ہاتھ رکھ سکتے ہیں۔

Altman نے GPT-5 کی ریلیز کے لیے ٹائم لائن کا عہد نہیں کیا، لیکن یہاں تک کہ اگر ٹریننگ جلد ہی شروع ہو جاتی ہے، الگورتھم تھوڑی دیر کے لیے دن کی روشنی نہیں دیکھے گا۔ اس کے سائز اور ڈیزائن پر منحصر ہے، تربیت میں ہفتوں یا مہینے لگ سکتے ہیں۔ پھر خام الگورتھم کو محفوظ بنانے کے لیے بہت سے لوگوں کے ذریعے تناؤ کا تجربہ کرنا اور اسے ٹھیک کرنا ہوگا۔ اس نے کمپنی لے لی تربیت کے بعد GPT-4 پالش کرنے اور جاری کرنے کے لیے آٹھ ماہ. اور اگرچہ مسابقتی زمین کی تزئین اب زیادہ شدید ہے، یہ بات بھی قابل دید ہے کہ GPT-4 GPT-3 کے تقریباً تین سال بعد پہنچا۔

لیکن بہتر ہے کہ ورژن نمبرز میں زیادہ نہ پھنسیں۔ OpenAI اب بھی اپنی موجودہ ٹیکنالوجی کے ساتھ جارحانہ انداز میں آگے بڑھ رہا ہے۔ دو ہفتے پہلے، اس پر پہلی ڈویلپر کانفرنس، کمپنی نے اپنی مرضی کے مطابق چیٹ بوٹس شروع کیے، جسے GPTs کہا جاتا ہے، ساتھ ہی GPT-4 ٹربو۔ بہتر کردہ الگورتھم میں مزید تازہ ترین معلومات شامل ہیں — کٹ آف کو ستمبر 2021 سے اپریل 2023 تک بڑھانا — زیادہ طویل اشارے کے ساتھ کام کر سکتا ہے، اور ڈویلپرز کے لیے سستا ہے۔

اور حریف OpenAI کی ہیلس پر گرم ہیں۔ گوگل ڈیپ مائنڈ ہے۔ فی الحال اپنے اگلے AI الگورتھم پر کام کر رہا ہے۔، Gemini، اور بڑی ٹیک ہے بھاری سرمایہ کاری دوسرے معروف سٹارٹ اپس میں، جیسے Anthropic، Character.AI، اور Inflection AI۔ اس سارے عمل میں ہے۔ حکومتوں کی نظریں ضوابط پر ہیں۔ وہ امید کرتے ہیں کہ الگورتھمک تعصب، رازداری کے خدشات، اور دانشورانہ املاک کے حقوق کی خلاف ورزی سے پیدا ہونے والے قریبی مدتی خطرات کو کم کر سکتے ہیں، اور ساتھ ہی مستقبل کے الگورتھم کو محفوظ بنا سکتے ہیں۔

تاہم، طویل مدتی میں، یہ واضح نہیں ہے کہ آیا بڑے لینگویج ماڈلز سے وابستہ کوتاہیوں کو مزید ڈیٹا اور بڑے الگورتھم سے حل کیا جا سکتا ہے یا اس کے لیے نئی پیش رفت کی ضرورت ہوگی۔ ایک ___ میں ستمبر پروفائل, وائرڈ کا اسٹیون لیوی نے لکھا OpenAI ابھی تک اس بات کا یقین نہیں ہے کہ GPT-4 پر "تیزی سے طاقتور بہتری" کے لیے کیا کرے گا۔

اوپن اے آئی کے صدر، گریگ بروک مین نے لیوی کو بتایا، "سب سے بڑی چیز جس کی ہمیں کمی محسوس ہو رہی ہے وہ نئے آئیڈیاز کے ساتھ آرہا ہے۔ لیکن یہ خواب نہیں ہے۔ خواب ہماری ان مسائل کو حل کرنے میں مدد کرنا ہے جو ہم نہیں کر سکتے۔

یہ گوگل کا 2017 تھا۔ ٹرانسفارمرز کی ایجاد جس نے AI میں موجودہ لمحہ لایا۔ کئی سالوں سے، محققین نے اپنے الگورتھم کو بڑا بنایا، انہیں مزید ڈیٹا فراہم کیا، اور اس اسکیلنگ سے تقریباً خودکار، اکثر حیرت انگیز کارکردگی میں اضافہ ہوا۔

لیکن مارچ میں MIT ایونٹ میں، Altman نے کہا کہ اس نے سوچا۔ سکیلنگ کی عمر ختم ہو چکی تھی اور محققین الگورتھم کو بہتر بنانے کے دوسرے طریقے تلاش کریں گے۔ ممکن ہے اس کے بعد سے اس کی سوچ بدل گئی ہو۔ یہ بھی ممکن ہے کہ GPT-5 GPT-4 سے بہتر ہو جیسا کہ تازہ ترین سمارٹ فون پچھلے سے بہتر ہے، اور اگلے مرحلے میں تبدیلی کے قابل بنانے والی ٹیکنالوجی ابھی تک پیدا نہیں ہوئی ہے۔ Altman بھی مکمل طور پر یقین نہیں لگتا.

"جب تک ہم اس ماڈل کو تربیت نہیں دیتے، یہ ہمارے لیے ایک مزے کا اندازہ لگانے والا کھیل ہے،" انہوں نے بتایا FT. "ہم اسے بہتر کرنے کی کوشش کر رہے ہیں، کیونکہ میرے خیال میں صلاحیتوں کی پیشن گوئی کرنا حفاظتی نقطہ نظر سے اہم ہے۔ لیکن میں آپ کو یہ نہیں بتا سکتا کہ یہ بالکل وہی ہے جو GPT-4 نے نہیں کیا۔

اس دوران، ایسا لگتا ہے کہ ہمارے پاس مصروف رکھنے کے لیے کافی سے زیادہ چیزیں ہوں گی۔

تصویری کریڈٹ: میکسم برگ / Unsplash سے

ٹائم اسٹیمپ:

سے زیادہ یکسانیت مرکز