LLaMA، میٹا کا تازہ ترین بڑی زبان کا ماڈل، آن لائن لیک ہو گیا ہے اور صرف تحقیقی مقاصد کے لیے رسائی کو محدود کرنے کی ظاہری کوششوں کے باوجود، ڈاؤن لوڈ کے لیے دستیاب ہے۔
فیس بک کا مالک کا اعلان کیا ہے فروری میں یہ ماڈل کو محدود انداز میں جاری کر رہا تھا تاکہ ماہرین تعلیم، حکومتی اقسام اور کمپنیوں کو خوف کے ساتھ کھیلنے کے لیے منتخب کیا جا سکے۔ لاما غلط استعمال کیا جا سکتا ہے. لیکن معلومات مفت ہونا چاہتی ہیں، یا کم از کم کچھ لوگ چاہتے ہیں کہ یہ ہو، اور میٹا کی تخلیق نے بہرحال آن لائن اپنا راستہ ڈھونڈ لیا ہے، جس کا آغاز ٹورینٹ لیک سے ہوتا ہے۔
جملے کی پیشین گوئی کرنے والے بڑے زبان کے ماڈلز، جو کہ ان پٹ پرامپٹ سے متن کے حوالے تیار کرتے ہیں، مستقل طور پر تیار ہوئے ہیں، کسی کی تحریر کو خودکار طریقے سے مکمل کرنے سے لے کر چیٹ بوٹس تک جو کام انجام دینے کے قابل ہیں جب کہ قدرتی زبان کا استعمال کرتے ہوئے ایسا کرنے کو کہا جاتا ہے۔
ماہرین نے خبردار کیا ہے کہ اس ٹیکنالوجی کو آنے والے برسوں تک بڑی مقدار میں جعلی خبروں، اسپام، فشنگ ای میلز، غلط معلومات، اشتعال انگیزی کی تیاری کے لیے استعمال کیا جا سکتا ہے۔ ان ماڈلز کو بنانے والی تنظیمیں اکثر سافٹ ویئر کو لپیٹ میں رکھتی ہیں، APIs کے پیچھے، یا محدود ورژن یا ڈیمو جاری کرتی ہیں۔
میٹا نے کہا پچھلا ہفتہ.
"دوسرے ماڈلز کی طرح، LLaMA ان چیلنجوں کا اشتراک کرتا ہے۔ ایک فاؤنڈیشن ماڈل کے طور پر، LLaMA کو ورسٹائل کے لیے ڈیزائن کیا گیا ہے اور اسے استعمال کے بہت سے مختلف کیسز پر لاگو کیا جا سکتا ہے، بمقابلہ ایک عمدہ ماڈل جو کہ ایک مخصوص کام کے لیے ڈیزائن کیا گیا ہے۔
"سالمیت کو برقرار رکھنے اور غلط استعمال کو روکنے کے لیے، ہم تحقیق کے استعمال کے معاملات پر مرکوز ایک غیر تجارتی لائسنس کے تحت اپنے ماڈل کو جاری کر رہے ہیں۔ ماڈل تک رسائی تعلیمی محققین کو کیس بہ کیس کی بنیاد پر دی جائے گی۔ وہ لوگ جو حکومت، سول سوسائٹی اور اکیڈمی میں تنظیموں سے وابستہ ہیں؛ اور دنیا بھر میں انڈسٹری ریسرچ لیبارٹریز۔"
رہنمائی کیسے کریں
لیکن LLaMA تک رسائی کو کنٹرول کرنے کے لیے میٹا کی کوششیں بیکار لگتی ہیں، یا ایسا لگتا ہے۔ منتخب بوفنز، اور انڈسٹری اور سول سوسائٹی میں شامل افراد کے ساتھ ماڈل کا اشتراک کرنے کے فوراً بعد، 4Chan پر کسی نے تفصیلات پوسٹ کیں کہ کس طرح پورے ماڈل کو پیئر ٹو پیئر فائل شیئرنگ کے ذریعے حاصل کیا جائے، اور آخر کار یہ سب ڈاؤن لوڈ کرنے کے طریقے کے بارے میں ہدایات GitHub پر شائع کیا گیا تھا۔
ہمیشہ کی طرح، ٹورینٹ سے اس طرح کی چیزیں لاتے وقت احتیاط برتیں اگر کسی نے وہاں کوئی ناپاک چیز چھپا رکھی ہو۔ ہمیں بتایا گیا ہے کہ 65-بلین پیرامیٹر ماڈل تقریباً 220GB ڈسک کی جگہ لیتا ہے۔
ہم نوٹ کرتے ہیں کہ GitHub کے ذریعے دستیاب LLaMA کی کاپیاں جائز معلوم ہوتی ہیں۔ شان پریسر، ایک اے آئی انجینئر جس نے مائیکروسافٹ کی کوڈ شیئرنگ سائٹ پر ڈاؤن لوڈ کی ہدایات لکھیں، ہمیں ماڈل سے کامیابی کے ساتھ متن تیار کرنے کے اسکرین شاٹس دکھائے۔ اس کا خیال ہے کہ ایک محقق جسے میٹا سے ماڈل تک رسائی دی گئی تھی اس نے اسے لیک کیا، جس کی وجہ سے اس کی توقع سے کہیں زیادہ وسیع تقسیم ہوئی۔
اپنے سازشی تھیوری کے انجن شروع کریں۔
پریسر کا خیال ہے کہ ماڈل کو بغیر کسی انتباہ کے آزادانہ طور پر جاری کرنا صرف منظور شدہ ماہرین تعلیم تک محدود رکھنے سے بہتر ہے۔ "میرے خیال میں اچھے برے سے کم از کم دس گنا زیادہ ہوں گے۔ شاید 100x کے قریب، "انہوں نے بتایا رجسٹر.
جدید ترین بڑے لینگوئج ماڈلز کی تربیت اور چلانا مہنگا ہے، عام طور پر؛ صرف وہ تنظیمیں جن کے پاس GPUs اور دیگر بنیادی ڈھانچے کے ڈھیروں تک رسائی ہے وہ ان کی تعمیر، موافقت اور جانچ کرنے کی پوزیشن میں ہیں۔ میٹا میں AI محققین LLaMA کو چھوٹا بنانے کے لیے بنایا، اسے آج کے تجارتی ماڈلز سے زیادہ کمپیکٹ بناتا ہے اور اس طرح ماہرین تعلیم اور ڈویلپرز کے لیے غیر معمولی IT بجٹ کے بغیر زیادہ قابل رسائی ہے۔
میٹا کے مشین لرننگ گروس نے دعویٰ کیا کہ ان کے سسٹم نے OpenAI کے GPT-3 سے بہتر کارکردگی کا مظاہرہ کیا ہے اور یہ دوسرے بڑے لینگویج ماڈلز جیسا کہ گوگل کے 540-بلین پیرامیٹر PaLM یا DeepMind کے 70-Billion-پیرامیٹر چنچیلا کی طرح اچھا ہے۔ چھوٹے سائز کا مطلب ہے کہ ان سائنسدانوں کے لیے استعمال کرنا آسان ہونا چاہیے جن کے پاس کمپیوٹیشنل وسائل کم ہیں۔ اور ہاں، تمام اشکال اور سائز کے زبان کے ماڈلز کی بہتات ہے۔ یہ صرف OpenAI اور Facebook سے زیادہ ہے۔
LLaMA کو اب بھی سینکڑوں گیگا بائٹس سٹوریج اور اسے چلانے کے لیے معقول رقم کی ضرورت ہے۔ ماڈل کو تیار کرنا اور چلانا بھی سیدھا نہیں ہے، جب تک کہ آپ اس قسم کے سسٹمز کو ہینڈل کرنے کے عادی نہ ہوں، اور اسے مزید مذموم سرگرمیوں کے لیے دوبارہ پیش کرنے کے لیے مزید تکنیکی مہارت کی ضرورت ہوگی۔ ماڈل کے لیک ہونے کے باوجود، میٹا نے کہا کہ وہ صرف منتخب محققین کے ساتھ LLaMA کا اشتراک جاری رکھے گی۔
ہمیں یقین ہے کہ ریلیز کی موجودہ حکمت عملی ہمیں ذمہ داری اور کھلے پن کو متوازن کرنے کی اجازت دیتی ہے۔
ایک ترجمان نے بتایا کہ "میٹا کا ہدف ہے کہ جدید ترین AI ماڈلز کو ریسرچ کمیونٹی کے ممبران کے ساتھ شیئر کیا جائے تاکہ ان ماڈلز کا جائزہ لینے اور ان کو بہتر بنانے میں ہماری مدد کی جا سکے۔" رجسٹر.
"LLaMA کو تحقیقی مقاصد کے لیے شیئر کیا گیا تھا، اس کے مطابق ہم نے پچھلے بڑے لینگوئج ماڈلز کو کس طرح شیئر کیا ہے۔ اگرچہ ماڈل سب کے لیے قابل رسائی نہیں ہے، اور کچھ نے منظوری کے عمل کو روکنے کی کوشش کی ہے، ہمیں یقین ہے کہ ریلیز کی موجودہ حکمت عملی ہمیں ذمہ داری اور کھلے پن کو متوازن کرنے کی اجازت دیتی ہے۔
دوسرے لفظوں میں، فیس بک گروپ اپنی ٹیکنالوجی کو تقسیم کرنے کے لیے اپنے نقطہ نظر پر قائم ہے۔
میٹا کی بڑی زبان کے ماڈلز کو جاری کرنے کی حالیہ کوششیں آسانی سے نہیں چلی ہیں۔ پچھلے سال اس کا چیٹی BlenderBot تھا۔ تنقید کا نشانہ بنایا غلط معلومات اور یہود مخالف خیالات پھیلانے کے لیے۔ Galactica، سائنسی علم کا خلاصہ کرنے کے لیے ڈیزائن کیا گیا تھا ہٹا دیا جعلی اور نسل پرستانہ مواد تیار کرنے کے لیے شروع کیے جانے کے تین دن بعد۔ ®
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو بلاک چین۔ Web3 Metaverse Intelligence. علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://go.theregister.com/feed/www.theregister.com/2023/03/08/meta_llama_ai_leak/
- : ہے
- $UP
- 7
- a
- ہمارے بارے میں
- اکیڈمی
- تعلیمی
- تک رسائی حاصل
- قابل رسائی
- سرگرمیوں
- پتہ
- وابستہ
- کے بعد
- AI
- تمام
- کی اجازت دیتا ہے
- ہمیشہ
- کے ساتھ
- رقم
- مقدار
- اور
- APIs
- واضح
- ظاہر
- اطلاقی
- نقطہ نظر
- منظوری
- کی منظوری دے دی
- کیا
- ارد گرد
- AS
- At
- کوششیں
- خود کار طریقے سے
- دستیاب
- برا
- متوازن
- بنیاد
- BE
- پیچھے
- کیا جا رہا ہے
- یقین ہے کہ
- خیال ہے
- بہتر
- تعصب
- بجٹ
- تعمیر
- عمارت
- by
- کر سکتے ہیں
- صلاحیت رکھتا
- کیس
- مقدمات
- کچھ
- چیلنجوں
- چیٹ بٹس
- دعوی کیا
- قریب
- CO
- کس طرح
- تبصروں
- تجارتی
- کمیونٹی
- کمپنیاں
- کمپیوٹنگ
- متواتر
- سازش
- مواد
- جاری
- کنٹرول
- سکتا ہے
- مخلوق
- موجودہ
- دن
- Deepmind
- ڈیمو
- ڈیزائن
- کے باوجود
- تفصیلات
- ڈویلپرز
- مختلف
- بے چینی
- تقسیم کرو
- تقسیم
- ڈاؤن لوڈ، اتارنا
- ڈرامہ
- ڈرائیو
- آسان
- کوششوں
- ای میل
- انجن
- اندازہ
- آخر میں
- وضع
- ورزش
- مہنگی
- مہارت
- فیس بک
- جعلی
- جعلی خبر کے
- فیشن
- خدشات
- فروری
- فائل
- توجہ مرکوز
- کے لئے
- آگے
- ملا
- فاؤنڈیشن
- مفت
- سے
- مزید
- عام طور پر
- پیدا
- پیدا کرنے والے
- حاصل کرنے
- GitHub کے
- دی
- مقصد
- اچھا
- گوگل
- حکومت
- GPUs
- عطا کی
- گروپ
- ہینڈلنگ
- ہے
- مدد
- پوشیدہ
- کس طرح
- کیسے
- HTTPS
- سینکڑوں
- i
- کو بہتر بنانے کے
- in
- صنعت
- معلومات
- انفراسٹرکچر
- ان پٹ
- ہدایات
- سالمیت
- IT
- میں
- فوٹو
- رکھیں
- بچے
- علم
- زبان
- بڑے
- آخری
- آخری سال
- تازہ ترین
- شروع
- معروف
- لیک
- لیک
- علامہ
- لائسنس
- کی طرح
- LIMIT
- لمیٹڈ
- لاما
- برقرار رکھنے کے
- بنانا
- بہت سے
- کا مطلب ہے کہ
- میگا
- اراکین
- میٹا
- مائیکروسافٹ
- غلط معلومات
- ماڈل
- ماڈل
- زیادہ
- نام
- قدرتی
- ضروریات
- خبر
- حاصل
- of
- on
- ایک
- آن لائن
- اوپنائی
- اوپنپن
- تنظیمیں
- دیگر
- مالک
- پام
- ہم مرتبہ ہم مرتبہ
- لوگ
- کارکردگی کا مظاہرہ
- شاید
- فشنگ
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- کھیلیں
- چمکتا
- پوزیشن
- پوسٹ کیا گیا
- کی روک تھام
- پچھلا
- شاید
- عمل
- شائع
- مقاصد
- RE
- حال ہی میں
- جاری
- کی ضرورت
- کی ضرورت ہے
- تحقیق
- محقق
- محققین
- وسائل
- ذمہ داری
- خطرات
- چل رہا ہے
- s
- کہا
- سائنسی
- سائنسدانوں
- اسکرین شاٹس
- منتخب
- سائز
- سیکنڈ اور
- مشترکہ
- حصص
- اشتراک
- جلد ہی
- ہونا چاہئے
- سائٹ
- سائز
- سائز
- چھوٹے
- آسانی سے
- So
- سوسائٹی
- سافٹ ویئر کی
- کچھ
- کسی
- کچھ
- خلا
- سپیم سے
- بات
- مخصوص
- ترجمان
- پھیلانا
- کھڑا ہے
- شروع
- ریاستی آرٹ
- ابھی تک
- ذخیرہ
- براہ راست
- حکمت عملی
- کامیابی کے ساتھ
- اس طرح
- مختصر
- کے نظام
- سسٹمز
- لیتا ہے
- ٹاسک
- کاموں
- ٹیک
- ٹیکنیکل
- ٹیکنالوجی
- ٹیسٹ
- کہ
- ۔
- دنیا
- ان
- ان
- وہاں.
- یہ
- تین
- کرنے کے لئے
- آج
- نامہ
- اقسام
- کے تحت
- us
- استعمال کی شرائط
- بیکار
- ورسٹائل
- بنام
- کی طرف سے
- خیالات
- راستہ..
- ہفتے
- جس
- جبکہ
- ڈبلیو
- پوری
- گے
- ساتھ
- بغیر
- الفاظ
- دنیا
- تحریری طور پر
- سال
- سال
- تم
- اور
- زیفیرنیٹ