محققین جمی اوپن اے آئی اور گوگل کے بند ماڈلز

محققین جمی اوپن اے آئی اور گوگل کے بند ماڈلز

Researchers jimmy OpenAI and Google's closed models PlatoBlockchain Data Intelligence. Vertical Search. Ai.

بوفنز نے اوپن اے آئی اور گوگل سے بند اے آئی سروسز کو ایک حملے کے ساتھ کھولنے میں کامیاب کیا ہے جو ٹرانسفارمر ماڈلز کے ایک اور چھپے ہوئے حصے کو بازیافت کرتا ہے۔

یہ حملہ جزوی طور پر ایک خاص قسم کے نام نہاد "بلیک باکس" ماڈل کو روشن کرتا ہے، جو API سوالات کے ذریعے ٹرانسفارمر ماڈل کی ایمبیڈنگ پروجیکشن پرت کو ظاہر کرتا ہے۔ ایسا کرنے کی لاگت چند ڈالر سے لے کر کئی ہزار تک ہوتی ہے، جس کا انحصار اس ماڈل کے سائز اور سوالات کی تعداد پر ہوتا ہے۔

گوگل ڈیپ مائنڈ، ای ٹی ایچ زیورخ، یونیورسٹی آف واشنگٹن، اوپن اے آئی، اور میک گل یونیورسٹی کے 13 سے کم کمپیوٹر سائنسدانوں نے لکھا ہے۔ ایک کاغذ حملے کی وضاحت کرنا، جو ایک ماڈل نکالنے والے حملے کی تکنیک پر استوار ہے۔ مجوزہ 2016.

"$20 USD سے کم کے لیے، ہمارا حملہ OpenAI کے ایڈا اور بیبیج لینگویج کے ماڈلز کا پورا پروجیکشن میٹرکس نکالتا ہے،" محققین نے اپنے مقالے میں بیان کیا۔ "ہم اس طرح پہلی بار تصدیق کرتے ہیں کہ بلیک باکس کے ان ماڈلز میں بالترتیب 1024 اور 2048 کی پوشیدہ جہت ہے۔ ہم gpt-3.5-ٹربو ماڈل کے عین پوشیدہ جہت کے سائز کو بھی بازیافت کرتے ہیں، اور اندازہ لگاتے ہیں کہ پورے پروجیکشن میٹرکس کو بازیافت کرنے کے لیے سوالات میں $2,000 سے کم لاگت آئے گی۔"

محققین نے اپنے نتائج کو اوپن اے آئی اور گوگل کو ظاہر کیا ہے، جن کے بارے میں کہا جاتا ہے کہ دونوں نے حملے کو کم کرنے کے لیے دفاعی اقدامات کیے ہیں۔ انہوں نے دو OpenAI gpt-3.5-turbo ماڈلز کے سائز کو شائع نہ کرنے کا انتخاب کیا، جو اب بھی استعمال میں ہیں۔ اڈا اور بیبیج ماڈل دونوں فرسودہ ہیں، اس لیے ان کے متعلقہ سائز کو ظاہر کرنا بے ضرر سمجھا گیا۔

اگرچہ یہ حملہ کسی ماڈل کو مکمل طور پر بے نقاب نہیں کرتا، محققین کا کہنا ہے کہ یہ ماڈل کے فائنل کو ظاہر کر سکتا ہے۔ وزن میٹرکس - یا اس کی چوڑائی، جو اکثر پیرامیٹر کی گنتی سے متعلق ہوتی ہے - اور ماڈل کی صلاحیتوں کے بارے میں معلومات فراہم کرتی ہے جو مزید تحقیقات کی اطلاع دے سکتی ہے۔ وہ وضاحت کرتے ہیں کہ پروڈکشن ماڈل سے کوئی بھی پیرامیٹرز حاصل کرنے کے قابل ہونا حیران کن اور ناپسندیدہ ہے، کیونکہ حملے کی تکنیک مزید معلومات کی بازیافت کے لیے قابل توسیع ہوسکتی ہے۔

"اگر آپ کے پاس وزن ہے، تو آپ کے پاس صرف مکمل ماڈل ہے،" گلیڈسٹون اے آئی کے سی ٹی او ایڈورڈ ہیرس نے ایک ای میل میں وضاحت کی۔ رجسٹر. "Google [et al.] نے جو کچھ کیا وہ مکمل ماڈل کے کچھ پیرامیٹرز کو استفسار کرکے دوبارہ تشکیل دینا تھا، جیسا کہ کوئی صارف کرے گا۔ وہ یہ دکھا رہے تھے کہ آپ وزن تک رسائی کے بغیر ماڈل کے اہم پہلوؤں کو دوبارہ تشکیل دے سکتے ہیں۔

ملکیتی ماڈل کے بارے میں کافی معلومات تک رسائی کسی کو اس کی نقل تیار کرنے کی اجازت دے سکتی ہے - ایک ایسا منظر جس پر گلیڈ اسٹون AI نے غور کیا ایک رپورٹ امریکی محکمہ خارجہ نے "گہرائی میں دفاع: اعلی درجے کی AI کی حفاظت اور حفاظت کو بڑھانے کے لئے ایک ایکشن پلان" کے عنوان سے کمیشن کیا ہے۔

رپورٹ کل جاری، تجزیہ اور سفارشات فراہم کرتا ہے کہ حکومت کو کس طرح AI کا استعمال کرنا چاہئے اور ان طریقوں سے بچنا چاہئے جن سے یہ قومی سلامتی کے لئے ممکنہ خطرہ ہے۔

رپورٹ کی سفارشات میں سے ایک یہ ہے کہ "امریکی حکومت فوری طور پر قابلیت یا کل ٹریننگ کمپیوٹ کی کلیدی حدوں سے اوپر اعلی درجے کے AI ماڈلز کی کھلی رسائی یا فروخت کو محدود کرنے کے طریقے تلاش کرے۔" اس میں ماڈل وزن سمیت اہم IP کی حفاظت کے لیے مناسب حفاظتی اقدامات شامل ہیں۔

گوگل کے نتائج کی روشنی میں گلیڈ اسٹون رپورٹ کی سفارشات کے بارے میں پوچھے جانے پر، ہیریس نے بھروسہ کیا، "بنیادی طور پر، اس طرح کے حملوں کو انجام دینے کے لیے، آپ کو - کم از کم ابھی کے لیے - ایسے نمونوں میں سوالات کو انجام دینے کی ضرورت ہے جو ماڈل کی خدمت کرنے والی کمپنی کے ذریعہ قابل شناخت ہوسکتی ہیں۔ ، جو GPT-4 کے معاملے میں OpenAI ہے۔ ہم اعلیٰ سطح کے استعمال کے نمونوں کو ٹریک کرنے کی تجویز کرتے ہیں، جو کہ رازداری کے تحفظ کے طریقے سے کیے جانے چاہئیں، تاکہ ان طریقوں کو استعمال کرتے ہوئے ماڈل پیرامیٹرز کی تشکیل نو کی کوششوں کی نشاندہی کی جا سکے۔

"یقیناً اس قسم کا فرسٹ پاس دفاع بھی ناقابل عمل ہو سکتا ہے، اور ہمیں مزید نفیس جوابی اقدامات تیار کرنے کی ضرورت پڑ سکتی ہے (مثال کے طور پر، قدرے بے ترتیب کرنا کہ کون سے ماڈلز کسی بھی وقت کون سے ردعمل پیش کرتے ہیں، یا دیگر نقطہ نظر)۔ تاہم ہم منصوبہ میں ہی اس سطح کی تفصیل میں نہیں آتے۔ ®

ٹائم اسٹیمپ:

سے زیادہ رجسٹر