مسلسل سیکھنے کی طاقت

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

پلیٹو بلاکچین ڈیٹا انٹیلی جنس کو مسلسل سیکھنے کی طاقت۔ عمودی تلاش۔ عی

OpenAI میں اپنے پہلے 2.5 سالوں کے دوران، میں نے روبوٹکس ٹیم کے ساتھ ایک چاند کی تصویر پر کام کیا: ہم Rubik کیوب کو حل کرنے کے لیے ایک انسان نما روبوٹ ہاتھ سکھانا چاہتے تھے۔ یہ ایک بہت ہی دلچسپ، چیلنجنگ، اور جذباتی تجربہ تھا۔ ہم حل ڈیپ انفورسمنٹ لرننگ (RL)، ڈومین رینڈمائزیشن کی پاگل مقدار، اور حقیقی دنیا کے تربیتی ڈیٹا کے ساتھ چیلنج۔ زیادہ اہم بات یہ ہے کہ ہم نے ایک ٹیم کے طور پر چیلنج کو فتح کیا۔

نقلی اور آر ایل ٹریننگ سے لے کر وژن پرسیپشن اور ہارڈویئر فرم ویئر تک، ہم نے بہت قریب سے اور ہم آہنگی سے تعاون کیا۔ یہ ایک حیرت انگیز تجربہ تھا اور اس دوران میں اکثر اسٹیو جابز کے بارے میں سوچتا تھا۔ حقیقت کو مسخ کرنے کا میدان: جب آپ کسی چیز پر اتنا پختہ یقین رکھتے ہیں اور اسے مسلسل آگے بڑھاتے رہتے ہیں تو کسی طرح آپ ناممکن کو ممکن بنا سکتے ہیں۔

2021 کے آغاز سے، میں نے Applied AI ریسرچ ٹیم کی قیادت کرنا شروع کر دی۔ ایک ٹیم کو منظم کرنا چیلنجوں کا ایک مختلف مجموعہ پیش کرتا ہے اور اس کے لیے کام کرنے کے انداز میں تبدیلی کی ضرورت ہوتی ہے۔ مجھے اپلائیڈ اے آئی کے اندر لینگویج ماڈل سیفٹی سے متعلق کئی پروجیکٹس پر سب سے زیادہ فخر ہے:

ہم نے نفرت انگیز، جنسی یا پرتشدد مواد تیار کرنے کے لیے پہلے سے تربیت یافتہ زبان کے ماڈلز کے رجحان کا اندازہ لگانے کے لیے تشخیصی ڈیٹا اور کاموں کا ایک سیٹ ڈیزائن اور بنایا ہے۔
ہم نے ایک تفصیلی درجہ بندی بنائی اور اس کے لیے ایک مضبوط درجہ بندی بنایا ناپسندیدہ مواد کا پتہ لگائیں نیز مواد کے نامناسب ہونے کی وجہ۔
ہم مختلف تکنیکوں پر کام کر رہے ہیں تاکہ ماڈل کو غیر محفوظ نتائج پیدا کرنے کا امکان کم ہو۔

چونکہ اپلائیڈ AI ٹیم جدید ترین AI تکنیکوں کو استعمال کرنے کے بہترین طریقہ پر عمل کر رہی ہے، جیسے کہ بڑے پہلے سے تربیت یافتہ لینگویج ماڈل، ہم دیکھتے ہیں کہ وہ حقیقی دنیا کے کاموں کے لیے کتنے طاقتور اور مفید ہیں۔ ہم تکنیکوں کو محفوظ طریقے سے تعینات کرنے کی اہمیت سے بھی واقف ہیں، جیسا کہ اس میں زور دیا گیا ہے۔ ہمارا چارٹر.