دراما LLaMA مع تسرب نموذج لغة Meta الضخم

دراما LLaMA مع تسرب نموذج لغة Meta الضخم

دراما LLaMA حيث يقوم نموذج اللغة الضخم لشركة Meta بتسريب ذكاء بيانات PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

تم تسريب LLaMA ، أحدث نموذج بلغة كبيرة لشركة Meta ، عبر الإنترنت وهو متاح للتنزيل ، على الرغم من المحاولات الواضحة لتقييد الوصول لأغراض البحث فقط.

صاحب الفيسبوك أعلن في فبراير ، تم إطلاق النموذج بطريقة محدودة لاختيار أكاديميين وأنواع حكومية وشركات للعب معهم وسط مخاوف. المكالمات يمكن أن يساء استخدامها. لكن المعلومات تريد أن تكون مجانية ، أو على الأقل يريدها بعض الأشخاص ، وقد وجد إنشاء Meta طريقه عبر الإنترنت على أي حال ، بدءًا من تسريب التورنت.

تطورت نماذج اللغة الكبيرة للتنبؤ بالجمل ، والتي تولد مقاطع نصية من مطالبات الإدخال ، بشكل مطرد ، من الإكمال التلقائي للكتابة إلى روبوتات الدردشة القادرة على أداء المهام عندما يُطلب منها القيام بذلك باستخدام لغة طبيعية.

حذر الخبراء من أن هذه التكنولوجيا يمكن استخدامها لأتمتة تصنيع كميات كبيرة من الأخبار المزيفة ، والبريد العشوائي ، ورسائل البريد الإلكتروني المخادعة ، والمعلومات المضللة ، والتحريض ، سمها ما شئت ، لسنوات قادمة. غالبًا ما تحتفظ المؤسسات التي تبني هذه النماذج بالبرمجيات في طي الكتمان ، أو خلف واجهات برمجة التطبيقات ، أو تطلق إصدارات أو عروض توضيحية محدودة. 

"لا يزال هناك المزيد من الأبحاث التي يجب إجراؤها لمعالجة مخاطر التحيز والتعليقات السامة والهلوسة في نماذج اللغات الكبيرة" ، محمد الاسبوع الماضى.

"مثل النماذج الأخرى ، تشارك LLaMA هذه التحديات. كنموذج أساس ، تم تصميم LLaMA ليكون متعدد الاستخدامات ويمكن تطبيقه على العديد من حالات الاستخدام المختلفة ، مقابل نموذج دقيق مصمم لمهمة محددة.

"للحفاظ على النزاهة ومنع إساءة الاستخدام ، نقوم بإصدار نموذجنا بموجب ترخيص غير تجاري يركز على حالات الاستخدام البحثي. سيتم منح الوصول إلى النموذج على أساس كل حالة على حدة للباحثين الأكاديميين ؛ المنتسبون إلى منظمات في الحكومة والمجتمع المدني والأوساط الأكاديمية ؛ ومختبرات أبحاث الصناعة حول العالم ".

كيف ترشد

لكن يبدو أن جهود Meta للتحكم في الوصول إلى LLaMA ذهبت سدى ، أو هكذا يبدو. بعد وقت قصير من مشاركة النموذج مع خبراء مختارين ، وأولئك العاملين في الصناعة والمجتمع المدني ، نشر شخص ما على 4Chan تفاصيل حول كيفية الحصول على النموذج بالكامل عبر مشاركة الملفات من نظير إلى نظير ، وفي النهاية إرشادات حول كيفية تنزيله بالكامل تم نشرها على جيثب.

كما هو الحال دائمًا ، توخ الحذر عند جلب أشياء مثل هذه من السيول في حالة إخفاء شخص ما شيئًا شنيعًا هناك. نموذج 65 مليار متغير يشغل حوالي 220 جيجا بايت من مساحة القرص ، كما قيل لنا.

نلاحظ أن نسخ LLaMA المتاحة عبر GitHub تبدو شرعية. شون بريسر ، أن مهندس ذكاء اصطناعي الذي كتب تعليمات التنزيل على موقع مشاركة التعليمات البرمجية لمايكروسوفت ، أظهر لنا لقطات شاشة له وهو يقوم بإنشاء نص من النموذج بنجاح. وهو يعتقد أن الباحث الذي تم منحه حق الوصول إلى النموذج من Meta سربه ، مما أدى إلى توزيعه ربما على نطاق أوسع من المتوقع.

ابدأ محركات نظرية المؤامرة الخاصة بك.

يعتقد بريسر أن إطلاق النموذج بحرية دون أي محاذير أفضل من مجرد قصره على الأكاديميين المعتمدين. "أعتقد أن الخير سيفوق الشر بعشرة أضعاف على الأقل. ربما أقرب إلى 100 ضعف ، "قال السجل

التدريب وتشغيل النماذج اللغوية الكبيرة الحديثة مكلف بشكل عام ؛ فقط المؤسسات التي لديها حق الوصول إلى أكوام من وحدات معالجة الرسومات والبنية التحتية الأخرى هي في وضع يمكنها من بنائها وتعديلها واختبارها. باحثو الذكاء الاصطناعي في ميتا بنيت LLaMA لتكون أصغر، مما يجعلها أكثر إحكاما من النماذج التجارية الحالية وبالتالي يسهل الوصول إليها للأكاديميين والمطورين دون ميزانيات تقنية المعلومات غير التافهة. 

ادعى معلمو التعلم الآلي في Meta أن نظامهم يفوق أداء OpenAI's GPT-3 وهو جيد مثل نماذج اللغات الكبيرة الأخرى ، مثل 540 مليار متغير PaLM أو شينشيلا DeepMind's 70 مليار. يعني الحجم الأصغر أنه يجب أن يكون أسهل في الاستخدام للعلماء الذين لديهم موارد حسابية أقل. ونعم ، هناك عدد كبير من نماذج اللغة من جميع الأشكال والأحجام ؛ إنه أكثر من مجرد OpenAI و Facebook.

لا يزال LLaMA يتطلب مئات الجيجابايت من التخزين وكمية مناسبة من الحوسبة لتشغيله. إن الحصول على النموذج وتشغيله ليس أمرًا مباشرًا أيضًا ، إلا إذا كنت معتادًا على التعامل مع أنظمة من هذا النوع ، وسيتطلب أيضًا إعادة توجيهه لأنشطة شائنة مزيدًا من الخبرة الفنية. على الرغم من تسريب النموذج ، قالت Meta إنها ستستمر في مشاركة LLaMA مع باحثين مختارين فقط. 

نعتقد أن استراتيجية الإصدار الحالية تسمح لنا بالموازنة بين المسؤولية والانفتاح

قال متحدث باسم Meta: "إن هدف Meta هو مشاركة أحدث نماذج الذكاء الاصطناعي مع أعضاء المجتمع البحثي لمساعدتنا في تقييم هذه النماذج وتحسينها". السجل.

"تمت مشاركة LLaMA لأغراض البحث ، بما يتفق مع كيفية مشاركة نماذج اللغات الكبيرة السابقة. في حين أن النموذج غير متاح للجميع ، وحاول البعض التحايل على عملية الموافقة ، نعتقد أن استراتيجية الإصدار الحالية تسمح لنا بالموازنة بين المسؤولية والانفتاح ".

بعبارة أخرى ، تقف مجموعة Facebook إلى جانب نهجها لتوزيع تقنيتها.

لم تسر محاولات Meta الأخيرة لإصدار نماذج لغات كبيرة بسلاسة. في العام الماضي كان BlenderBot الثرثار وانتقد لنشر معلومات مضللة ووجهات نظر معادية للسامية. تم تصميم Galactica لتلخيص المعرفة العلمية إزالة بعد ثلاثة أيام من إطلاقه لنشر محتوى مزيف وعنصري. ®

الطابع الزمني:

اكثر من السجل