أنشأ العلماء "OpinionGPT" لاستكشاف التحيز البشري الصريح، ويمكنك اختباره بنفسك

أنشأ العلماء "OpinionGPT" لاستكشاف التحيز البشري الصريح، ويمكنك اختباره بنفسك

قام فريق من الباحثين من جامعة هومبولت في برلين بتطوير نموذج ذكاء اصطناعي كبير الحجم يتميز بأنه تم ضبطه عمدًا لتوليد مخرجات ذات تحيز واضح.

يُطلق على نموذج الفريق اسم OpinionGPT، وهو عبارة عن نسخة معدلة من Meta's Llama 2، وهو نظام ذكاء اصطناعي مشابه في القدرة لنظام ChatGPT الخاص بـ OpenAI أو Anthropic's Claude 2.

باستخدام عملية تسمى الضبط الدقيق القائم على التعليمات، يمكن لـ OpinionGPT الاستجابة للمطالبات كما لو كانت تمثل واحدة من 11 مجموعة متحيزة: أمريكي، ألماني، أمريكا اللاتينية، شرق أوسطي، مراهق، شخص يزيد عمره عن 30 عامًا، شخص كبير السن رجلاً أو امرأة، ليبرالياً، أو محافظاً.

تم تحسين OpinionGPT بناءً على مجموعة من البيانات المستمدة من مجتمعات "AskX"، والتي تسمى subreddits، على Reddit. من أمثلة هذه المنتديات الفرعية "اسأل امرأة" و"اسأل أمريكيًا".

بدأ الفريق بالعثور على منشورات فرعية على موقع Reddit تتعلق بالتحيزات الـ11 المحددة وسحب 25 ألف مشاركة من أكثر المنشورات شعبيةً من كل منها. ثم احتفظوا فقط بالمشاركات التي استوفت الحد الأدنى من الأصوات المؤيدة، ولم تحتوي على اقتباس مضمن، وكانت أقل من 80 كلمة.

مع ما تبقى، يبدو كما لو أنهم استخدموا نهج على غرار الذكاء الاصطناعي الدستوري الخاص بشركة Anthropic. بدلًا من إنشاء نماذج جديدة تمامًا لتمثيل كل علامة تحيز، قاموا بشكل أساسي بضبط نموذج Llama7 الفردي المكون من 2 مليار معلمة مع مجموعات تعليمات منفصلة لكل تحيز متوقع.

هذا الموضوع ذو علاقة بـ: إن استخدام الذكاء الاصطناعي على وسائل التواصل الاجتماعي لديه القدرة على التأثير على معنويات الناخبين

النتيجة، بناءً على المنهجية والهندسة المعمارية والبيانات وصف في الورقة البحثية للفريق الألماني، يبدو أنه نظام ذكاء اصطناعي يعمل كمولد للصور النمطية أكثر من كونه أداة لدراسة التحيز في العالم الحقيقي.

نظرًا لطبيعة البيانات التي تم تنقيح النموذج عليها، والعلاقة المشكوك فيها لتلك البيانات بالتسميات التي تحددها، لا يُخرج OpinionGPT بالضرورة نصًا يتوافق مع أي تحيز قابل للقياس في العالم الحقيقي. إنه ببساطة يقوم بإخراج نص يعكس انحياز بياناته.

ويدرك الباحثون أنفسهم بعض القيود التي يفرضها هذا على دراستهم، حيث يكتبون:

"على سبيل المثال، ينبغي فهم ردود "الأمريكيين" بشكل أفضل على أنها "أمريكيون ينشرون على موقع Reddit"، أو حتى "أمريكيون ينشرون على هذا الموقع الفرعي المحدد." وبالمثل، يجب أن يُفهم "الألمان" على أنهم "الألمان الذين ينشرون على هذا الموقع الفرعي المحدد، وما إلى ذلك."

يمكن تحسين هذه التحذيرات بشكل أكبر لتقول إن المنشورات تأتي من، على سبيل المثال، "أشخاص يزعمون أنهم أمريكيون وينشرون على موقع subreddit هذا"، حيث لا يوجد ذكر في الورقة للتحقق مما إذا كانت الملصقات الموجودة خلف منشور معين تمثل في الواقع من المجموعة الديموغرافية أو المتحيزة التي يدعون أنها.

ويواصل المؤلفون الإشارة إلى أنهم يعتزمون استكشاف النماذج التي تحدد التركيبة السكانية بشكل أكبر (على سبيل المثال: الألمانية الليبرالية، والألمانية المحافظة).

يبدو أن المخرجات المقدمة من OpinionGPT تتنوع بين تمثيل التحيز الذي يمكن إثباته والاختلاف بشكل كبير عن المعيار الثابت، مما يجعل من الصعب تمييز جدواه كأداة لقياس أو اكتشاف التحيز الفعلي.

أنشأ العلماء "OpinionGPT" لاستكشاف التحيز البشري الصريح - ويمكنك اختباره بنفسك PlatoBlockchain Data Intelligence. البحث العمودي. منظمة العفو الدولية.
المصدر: لقطة شاشة، الجدول 2: هالر وآخرون. آل، 2023

وفقًا لـ OpinionGPT، كما هو موضح في الصورة أعلاه، على سبيل المثال، فإن الأمريكيين اللاتينيين متحيزون تجاه كرة السلة باعتبارها رياضتهم المفضلة.

لكن البحث التجريبي واضح يشير أن كرة القدم (وتسمى أيضًا كرة القدم في بعض البلدان) والبيسبول هي الرياضات الأكثر شعبية من حيث نسبة المشاهدة والمشاركة في جميع أنحاء أمريكا اللاتينية.

يوضح الجدول نفسه أيضًا أن OpinionGPT تُخرج "كرة الماء" كرياضتها المفضلة عندما يُطلب منها إعطاء "إجابة مراهق"، وهي إجابة تبدو إحصائيًا من غير المحتمل أن نكون ممثلين لمعظم الأشخاص الذين تتراوح أعمارهم بين 13 و19 عامًا حول العالم.

وينطبق الشيء نفسه على فكرة أن الطعام المفضل لدى المواطن الأمريكي العادي هو "الجبن". لقد وجدنا العشرات من الدراسات الاستقصائية عبر الإنترنت تدعي أن البيتزا والهامبرغر هي الأطعمة المفضلة في أمريكا، ولكن لم نتمكن من العثور على دراسة استقصائية واحدة أو دراسة تدعي أن الطبق الأول للأمريكيين هو الجبن ببساطة.

في حين أن OpinionGPT قد لا يكون مناسبًا تمامًا لدراسة التحيز البشري الفعلي، إلا أنه قد يكون مفيدًا كأداة لاستكشاف الصور النمطية المتأصلة في مستودعات المستندات الكبيرة مثل subreddits الفردية أو مجموعات تدريب الذكاء الاصطناعي.

بالنسبة لأولئك الذين لديهم فضول، قام الباحثون بعمل OpinionGPT متاح على الانترنت للاختبار العام. ومع ذلك، وفقًا للموقع، يجب على المستخدمين المحتملين أن يدركوا أن "المحتوى الذي تم إنشاؤه يمكن أن يكون كاذبًا أو غير دقيق أو حتى فاحشًا".

الطابع الزمني:

اكثر من Cointelegraph