التنبؤ بإساءة استخدام النماذج اللغوية المحتملة لحملات المعلومات المضللة - وكيفية تقليل المخاطر

التنبؤ بإساءة استخدام النماذج اللغوية المحتملة لحملات المعلومات المضللة - وكيفية تقليل المخاطر

التنبؤ بحالات إساءة الاستخدام المحتملة لنماذج اللغة في حملات التضليل - وكيفية تقليل مخاطر ذكاء بيانات PlatoBlockchain. البحث العمودي. منظمة العفو الدولية.

تعاون باحثو OpenAI مع مركز الأمن والتكنولوجيا الناشئة بجامعة جورجتاون ومرصد الإنترنت في ستانفورد للتحقيق في كيفية إساءة استخدام النماذج اللغوية الكبيرة لأغراض التضليل. تضمن التعاون ورشة عمل في أكتوبر 2021 جمعت 30 باحثًا في مجال المعلومات المضللة وخبراء التعلم الآلي ومحللي السياسات ، وبلغت ذروتها في تقرير شارك في تأليفه بناءً على أكثر من عام من البحث. يوضح هذا التقرير التهديدات التي تشكلها النماذج اللغوية على بيئة المعلومات إذا تم استخدامها لزيادة حملات المعلومات المضللة ويقدم إطارًا لتحليل عمليات التخفيف المحتملة. اقرأ التقرير الكامل هنا.

اقرأ التقرير

مع تحسن نماذج اللغة التوليدية ، فإنها تفتح إمكانيات جديدة في مجالات متنوعة مثل الرعاية الصحية والقانون والتعليم والعلوم. ولكن ، كما هو الحال مع أي تقنية جديدة ، يجدر النظر في كيفية إساءة استخدامها. على خلفية عمليات التأثير المتكررة عبر الإنترنت -خفي or مخادع جهود للتأثير على آراء الجمهور المستهدف - تطلب الورقة:

كيف يمكن أن تؤثر نماذج اللغة على العمليات ، وما هي الخطوات التي يمكن اتخاذها للتخفيف من هذا التهديد؟

جمع عملنا بين الخلفيات والخبرات المختلفة - باحثون لديهم أسس في التكتيكات والتقنيات والإجراءات الخاصة بحملات التضليل عبر الإنترنت ، بالإضافة إلى خبراء التعلم الآلي في مجال الذكاء الاصطناعي التوليدي - لبناء تحليلنا على الاتجاهات في كلا المجالين.

نعتقد أنه من الأهمية بمكان تحليل تهديد عمليات التأثير المدعومة بالذكاء الاصطناعي وتحديد الخطوات التي يمكن اتخاذها قبل تستخدم نماذج اللغة لعمليات التأثير على نطاق واسع. نأمل أن يطلع بحثنا صانعي السياسات على ما هو جديد في مجالات الذكاء الاصطناعي أو المعلومات المضللة ، ويحفز البحث المتعمق في استراتيجيات التخفيف المحتملة لمطوري الذكاء الاصطناعي وصناع السياسات وباحثي المعلومات المضللة.

كيف يمكن أن يؤثر الذكاء الاصطناعي على العمليات؟

عندما يقوم الباحثون بتقييم عمليات التأثير ، فإنهم يعتبرون الجهات الفاعلة والسلوكيات والمحتوى. إن التوافر الواسع للتكنولوجيا المدعومة بنماذج اللغة لديه القدرة على التأثير على الجوانب الثلاثة:

  1. الجهات الفاعلة: يمكن للنماذج اللغوية أن تخفض تكلفة إدارة عمليات التأثير ، مما يجعلها في متناول الممثلين الجدد وأنواع الممثلين. وبالمثل ، فإن دعاة الأجر الذين يقومون بأتمتة إنتاج النص قد يكتسبون مزايا تنافسية جديدة.

  2. سلوك: سيصبح قياس عمليات التأثير باستخدام النماذج اللغوية أسهل ، وقد تصبح التكتيكات باهظة الثمن حاليًا (على سبيل المثال ، إنشاء محتوى مخصص). قد تتيح النماذج اللغوية أيضًا ظهور تكتيكات جديدة - مثل إنشاء المحتوى في الوقت الفعلي في روبوتات المحادثة.

  3. وصف المنتج: قد تولد أدوات إنشاء النص المدعومة بنماذج اللغة رسائل أكثر تأثيرًا أو إقناعًا مقارنةً بالدعاية ، وخاصة أولئك الذين يفتقرون إلى المعرفة اللغوية أو الثقافية المطلوبة لهدفهم. كما أنها قد تجعل عمليات التأثير أقل قابلية للاكتشاف ، لأنها تنشئ محتوى جديدًا بشكل متكرر دون الحاجة إلى اللجوء إلى النسخ واللصق وغيرها من السلوكيات الملحوظة الموفرة للوقت.

حكمنا النهائي هو أن النماذج اللغوية ستكون مفيدة للدعاية ومن المرجح أن تغير عمليات التأثير عبر الإنترنت. حتى إذا تم الاحتفاظ بالنماذج الأكثر تقدمًا خاصة أو يتم التحكم فيها من خلال الوصول إلى واجهة برمجة التطبيقات (API) ، فمن المرجح أن ينجذب دعاة الدعاية نحو بدائل مفتوحة المصدر وقد تستثمر الدول القومية في التكنولوجيا نفسها.

المجهول الحرجة

تؤثر العديد من العوامل على ما إذا كان سيتم استخدام نماذج اللغة في عمليات التأثير ومدى استخدامها. تقريرنا يغوص في العديد من هذه الاعتبارات. علي سبيل المثال:

  • ما هي القدرات الجديدة للتأثير التي ستظهر كأثر جانبي للبحث حسن النية أو الاستثمار التجاري؟ من هم الفاعلون الذين سيضطلعون باستثمارات كبيرة في النماذج اللغوية؟
  • متى ستصبح الأدوات سهلة الاستخدام لإنشاء نص متاحة للجمهور؟ هل سيكون تصميم نماذج لغوية محددة لعمليات التأثير أكثر فاعلية ، بدلاً من تطبيق النماذج العامة؟
  • هل ستتطور المعايير التي ستثني الجهات الفاعلة التي تشن عمليات تأثير مدعومة بالذكاء الاصطناعي؟ كيف ستتطور نوايا الممثل؟

بينما نتوقع أن نرى انتشارًا للتكنولوجيا بالإضافة إلى تحسينات في قابلية استخدام النماذج اللغوية وموثوقيتها وكفاءتها ، تظل العديد من الأسئلة حول المستقبل بلا إجابة. نظرًا لأن هذه الاحتمالات الحاسمة يمكن أن تغير كيفية تأثير النماذج اللغوية على العمليات ، فإن البحث الإضافي لتقليل عدم اليقين يعد ذا قيمة عالية.

إطار للتخفيف

لتخطيط مسار إلى الأمام ، يحدد التقرير المراحل الرئيسية في نموذج اللغة للتأثير على خط أنابيب العملية. كل مرحلة من هذه المراحل هي نقطة للتخفيفات المحتملة ، وللقيام بعملية التأثير بنجاح باستخدام نموذج اللغة ، سيطلب القائمون على الدعاية ما يلي: (1) وجود نموذج ، (2) يمكنهم الوصول إليه بشكل موثوق ، (3) يمكنهم نشر المحتوى من النموذج ، و (4) يتأثر المستخدم النهائي. تقع العديد من استراتيجيات التخفيف الممكنة على طول هذه الخطوات الأربع ، كما هو موضح أدناه.

المرحلة في خط الأنابيب 1. البناء النموذجي 2. الوصول إلى النموذج 3. نشر المحتوى 4. تكوين العقيدة
التخفيفات التوضيحية يقوم مطورو الذكاء الاصطناعي ببناء نماذج أكثر حساسية للحقائق. يفرض مقدمو الذكاء الاصطناعي قيودًا أكثر صرامة على استخدام النماذج اللغوية. تنسق المنصات ومزودو الذكاء الاصطناعي لتحديد محتوى الذكاء الاصطناعي. تشارك المؤسسات في حملات التوعية الإعلامية.
ينشر المطورون البيانات المشعة لجعل النماذج التوليدية قابلة للاكتشاف. يطور مقدمو الذكاء الاصطناعي معايير جديدة حول إصدار النموذج. تتطلب المنصات "إثبات الشخصية" للنشر. يوفر المطورون أدوات الذكاء الاصطناعي التي تركز على المستهلك.
تفرض الحكومات قيودًا على جمع البيانات. يقوم مقدمو الذكاء الاصطناعي بإغلاق الثغرات الأمنية. تتخذ الكيانات التي تعتمد على المدخلات العامة خطوات لتقليل تعرضها لمحتوى مضلل للذكاء الاصطناعي.
تفرض الحكومات ضوابط وصول على أجهزة الذكاء الاصطناعي. تم اعتماد معايير المصدر الرقمي على نطاق واسع.

إذا كان التخفيف موجودًا ، فهل هو مرغوب فيه؟

فقط لأن التخفيف يمكن أن يقلل من خطر عمليات التأثير التي تدعم الذكاء الاصطناعي لا يعني أنه يجب وضعها موضع التنفيذ. تحمل بعض إجراءات التخفيف مخاطر سلبية خاصة بها. البعض الآخر قد لا يكون مجديا. في حين أننا لا نصادق صراحة على التخفيفات أو نصنفها ، تقدم الورقة مجموعة من الأسئلة الإرشادية لواضعي السياسات وغيرهم للنظر فيها:

  • الجدوى الفنية: هل التخفيف المقترح ممكن تقنيًا؟ هل يتطلب تغييرات كبيرة في البنية التحتية التقنية؟
  • الجدوى الاجتماعية: هل التخفيف ممكن من المنظور السياسي والقانوني والمؤسسي؟ هل يتطلب تنسيقًا مكلفًا ، وهل يتم تحفيز الجهات الفاعلة الرئيسية لتنفيذه ، وهل هو قابل للتنفيذ بموجب القانون والتنظيم الحالي ومعايير الصناعة؟
  • مخاطر الهبوط: ما هي الآثار السلبية المحتملة للتخفيف ، وما مدى أهميتها؟
  • التأثير: ما مدى فعالية التخفيف المقترح في الحد من التهديد؟

نأمل أن يحفز هذا الإطار الأفكار لاستراتيجيات التخفيف الأخرى ، وأن تساعد الأسئلة الإرشادية المؤسسات ذات الصلة على البدء في النظر فيما إذا كانت إجراءات التخفيف المختلفة تستحق المتابعة.

هذا التقرير بعيد كل البعد عن الكلمة الأخيرة بشأن الذكاء الاصطناعي ومستقبل عمليات التأثير. هدفنا هو تحديد البيئة الحالية والمساعدة في وضع جدول أعمال للبحث في المستقبل. نحن نشجع أي شخص مهتم بالتعاون أو مناقشة المشاريع ذات الصلة للتواصل معنا. لمزيد من المعلومات ، اقرأ التقرير الكامل هنا.

اقرأ التقرير

مؤلفو التقرير

جوش أ. غولدشتاين (مركز الأمن والتكنولوجيا الناشئة بجامعة جورجتاون)
جيريش ساستري (أوبن إيه آي)
ميكا موسر (مركز الأمن والتكنولوجيا الناشئة بجامعة جورجتاون)
رينيه ديريستا (مرصد ستانفورد للإنترنت)
ماثيو جنتزل (Longview Philanthropy) (العمل المنجز في OpenAI)
كاترينا سيدوفا (وزارة الخارجية الأمريكية) (العمل المنجز في مركز الأمن والتكنولوجيا الناشئة قبل الخدمة الحكومية)

الطابع الزمني:

اكثر من OpenAI