Вчені створили «OpinionGPT», щоб дослідити явні людські упередження

Перевидано Платоном

читають: 0

Команда дослідників з Берлінського університету імені Гумбольдта розробила велику мовну модель штучного інтелекту, яка відрізняється тим, що її навмисно налаштовано на генерування результатів із вираженим упередженням.

Модель під назвою OpinionGPT є налаштованим варіантом Meta Llama 2, системи ШІ, подібної за можливостями до ChatGPT OpenAI або Claude 2 від Anthropic.

Використовуючи процес, який називається тонким налаштуванням на основі інструкцій, OpinionGPT нібито може відповідати на підказки так, ніби він є представником однієї з 11 упереджених груп: американець, німець, латиноамериканець, близькосхідний, підліток, хтось старше 30 років, літня людина. , чоловік, жінка, ліберал чи консерватор.

Оголошуємо «OpinionGPT: дуже упереджена модель GPT»! Спробуйте тут: https://t.co/5YJjHlcV4n
Щоб дослідити вплив упередженості на відповіді моделі, ми поставили просте запитання: що, якби ми налаштували a #GPT моделювати лише тексти, написані політично правими людьми?

[1/3]

— Алан Акбік (@alan_akbik) Вересень 8, 2023

OpinionGPT було вдосконалено на основі даних, отриманих із спільнот «AskX», які називаються субредітами на Reddit. Приклади таких субредітів включають «Запитай жінку» та «Запитай американця».

Команда почала з пошуку субредітів, пов’язаних з 11 конкретними упередженнями, і вилучення 25 тисяч найпопулярніших публікацій з кожного з них. Тоді вони зберегли лише ті публікації, які відповідали мінімальному порогу голосів «за», не містили вбудованих цитат і мали менше 80 слів.

З тим, що залишилося, здається, ніби вони використовували підхід схожий на конституційний ШІ Anthropic. Замість того, щоб створювати абсолютно нові моделі для представлення кожної мітки зміщення, вони, по суті, точно налаштували єдину модель Llama7 із 2 мільярдів параметрів із окремими наборами інструкцій для кожного очікуваного зміщення.

За темою: Використання ШІ в соціальних мережах може вплинути на настрої виборців

Результат, заснований на методології, архітектурі та даних описаний у дослідницькій роботі німецької групи, здається, це система штучного інтелекту, яка функціонує більше як генератор стереотипів, ніж інструмент для вивчення упередженості в реальному світі.

Через характер даних, на основі яких була вдосконалена модель, і сумнівний зв’язок цих даних із мітками, які їх визначають, OpinionGPT не обов’язково виводить текст, який узгоджується з будь-яким вимірним упередженням у реальному світі. Він просто виводить текст, що відображає упередженість його даних.

Самі дослідники визнають деякі обмеження, які це накладає на їх дослідження, пишучи:

«Наприклад, відповіді «американців» краще розуміти як «американці, які публікують на Reddit» або навіть «американці, які публікують на цьому конкретному субредіті». Так само «німці» слід розуміти як «німці, які публікують на цьому певний subreddit, тощо.

Ці застереження можна було б додатково уточнити, щоб сказати, що дописи надходять, наприклад, від «людей, які стверджують, що вони американці, які розміщують у цьому конкретному субредіті», оскільки в документі немає жодної згадки про перевірку того, чи плакати за даним дописом насправді є репрезентативними. демографічної чи упередженої групи, якою вони себе вважають.

Далі автори заявляють, що вони мають намір дослідити моделі, які ще більше окреслюють демографію (тобто: ліберальна Німеччина, консервативна Німеччина).

Результати, надані OpinionGPT, здається, коливаються між демонстрацією очевидної упередженості та різко відрізняються від встановленої норми, що ускладнює визначення її життєздатності як інструменту для вимірювання чи виявлення фактичної упередженості.

Вчені створили «OpinionGPT», щоб досліджувати явні людські упередження — і ви можете перевірити це на собі PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai. — Джерело: Скріншот, Таблиця 2: *Халлер та ін. ін., 2023*

Відповідно до OpinionGPT, як показано на зображенні вище, наприклад, латиноамериканці упереджено вважають баскетбол їхнім улюбленим видом спорту.

Емпіричне дослідження, однак, однозначно вказує що футбол (також званий футболом у деяких країнах) і бейсбол є найпопулярнішими видами спорту за кількістю глядачів та участі в Латинській Америці.

Ця ж таблиця також показує, що OpinionGPT видає «водне поло» як свій улюблений вид спорту, коли його наказують дати «відповідь підлітка», відповідь, яка виглядає статистично навряд чи бути представником більшості 13-19-річних у всьому світі.

Те саме стосується думки, що улюблена їжа середнього американця – це «сир». Ми знайшли в Інтернеті десятки опитувань, які стверджували, що піца та гамбургери є улюбленими стравами Америки, але не змогли знайти жодного опитування чи дослідження, яке б стверджувало, що стравою номер один для американців був просто сир.

Хоча OpinionGPT може бути не дуже придатним для вивчення фактичних людських упереджень, він може бути корисним як інструмент для вивчення стереотипів, притаманних великим сховищам документів, таким як окремі субредити або навчальні набори AI.

Для тих, кому цікаво, дослідники створили OpinionGPT доступний онлайн для публічного тестування. Однак, згідно з веб-сайтом, потенційні користувачі повинні знати, що «згенерований контент може бути неправдивим, неточним або навіть непристойним».

Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
ПлатонЕСГ. Автомобільні / електромобілі, вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
ChartPrime. Розвивайте свою торгову гру за допомогою ChartPrime. Доступ тут.
BlockOffsets. Модернізація екологічної компенсаційної власності. Доступ тут.
джерело: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test

Часова мітка: Вересень 8, 2023

Часова мітка: Жовтень 5, 2021

Перевидано Платоном

Обсяг VanEck Bitcoin Strategy ETF у день запуску становить частку BITO

Республіканці Палати представників закликають посилити контроль над експортом сучасних мікросхем

Елізабет Уоррен під час слухань сенату порівнює `` підроблену '' криптовалюту з `` законними '' CBDC

Найбільший мобільний оператор Японії створить консорціум Web3

Аналіз цін 8/25: BTC, ETH, ADA, BNB, XRP, DOGE, DOT, SOL, UNI, BCH

Coinbase призупиняє підтримку Signet: Report від Signature Bank

Крипто може полегшити фінансові наслідки для людей в Афганістані

ЄС відключить 7 російських банків від SWIFT, а звичайні росіяни зіткнуться з наслідками

Чудові новини: «Ходячі мерці» вторгаються в пісочницю, здають в оренду NFT-файли, CryptoPunk у картинній галереї

Трейдери накопичуються в альткойнах після того, як бики біткойнів захоплять 50 тисяч доларів

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки