Команда дослідників з Берлінського університету імені Гумбольдта розробила велику мовну модель штучного інтелекту, яка відрізняється тим, що її навмисно налаштовано на генерування результатів із вираженим упередженням.
Модель під назвою OpinionGPT є налаштованим варіантом Meta Llama 2, системи ШІ, подібної за можливостями до ChatGPT OpenAI або Claude 2 від Anthropic.
Використовуючи процес, який називається тонким налаштуванням на основі інструкцій, OpinionGPT нібито може відповідати на підказки так, ніби він є представником однієї з 11 упереджених груп: американець, німець, латиноамериканець, близькосхідний, підліток, хтось старше 30 років, літня людина. , чоловік, жінка, ліберал чи консерватор.
Оголошуємо «OpinionGPT: дуже упереджена модель GPT»! Спробуйте тут: https://t.co/5YJjHlcV4n
Щоб дослідити вплив упередженості на відповіді моделі, ми поставили просте запитання: що, якби ми налаштували a #GPT моделювати лише тексти, написані політично правими людьми?[1/3]
— Алан Акбік (@alan_akbik) Вересень 8, 2023
OpinionGPT було вдосконалено на основі даних, отриманих із спільнот «AskX», які називаються субредітами на Reddit. Приклади таких субредітів включають «Запитай жінку» та «Запитай американця».
Команда почала з пошуку субредітів, пов’язаних з 11 конкретними упередженнями, і вилучення 25 тисяч найпопулярніших публікацій з кожного з них. Тоді вони зберегли лише ті публікації, які відповідали мінімальному порогу голосів «за», не містили вбудованих цитат і мали менше 80 слів.
З тим, що залишилося, здається, ніби вони використовували підхід схожий на конституційний ШІ Anthropic. Замість того, щоб створювати абсолютно нові моделі для представлення кожної мітки зміщення, вони, по суті, точно налаштували єдину модель Llama7 із 2 мільярдів параметрів із окремими наборами інструкцій для кожного очікуваного зміщення.
За темою: Використання ШІ в соціальних мережах може вплинути на настрої виборців
Результат, заснований на методології, архітектурі та даних описаний у дослідницькій роботі німецької групи, здається, це система штучного інтелекту, яка функціонує більше як генератор стереотипів, ніж інструмент для вивчення упередженості в реальному світі.
Через характер даних, на основі яких була вдосконалена модель, і сумнівний зв’язок цих даних із мітками, які їх визначають, OpinionGPT не обов’язково виводить текст, який узгоджується з будь-яким вимірним упередженням у реальному світі. Він просто виводить текст, що відображає упередженість його даних.
Самі дослідники визнають деякі обмеження, які це накладає на їх дослідження, пишучи:
«Наприклад, відповіді «американців» краще розуміти як «американці, які публікують на Reddit» або навіть «американці, які публікують на цьому конкретному субредіті». Так само «німці» слід розуміти як «німці, які публікують на цьому певний subreddit, тощо.
Ці застереження можна було б додатково уточнити, щоб сказати, що дописи надходять, наприклад, від «людей, які стверджують, що вони американці, які розміщують у цьому конкретному субредіті», оскільки в документі немає жодної згадки про перевірку того, чи плакати за даним дописом насправді є репрезентативними. демографічної чи упередженої групи, якою вони себе вважають.
Далі автори заявляють, що вони мають намір дослідити моделі, які ще більше окреслюють демографію (тобто: ліберальна Німеччина, консервативна Німеччина).
Результати, надані OpinionGPT, здається, коливаються між демонстрацією очевидної упередженості та різко відрізняються від встановленої норми, що ускладнює визначення її життєздатності як інструменту для вимірювання чи виявлення фактичної упередженості.
Відповідно до OpinionGPT, як показано на зображенні вище, наприклад, латиноамериканці упереджено вважають баскетбол їхнім улюбленим видом спорту.
Емпіричне дослідження, однак, однозначно вказує що футбол (також званий футболом у деяких країнах) і бейсбол є найпопулярнішими видами спорту за кількістю глядачів та участі в Латинській Америці.
Ця ж таблиця також показує, що OpinionGPT видає «водне поло» як свій улюблений вид спорту, коли його наказують дати «відповідь підлітка», відповідь, яка виглядає статистично навряд чи бути представником більшості 13-19-річних у всьому світі.
Те саме стосується думки, що улюблена їжа середнього американця – це «сир». Ми знайшли в Інтернеті десятки опитувань, які стверджували, що піца та гамбургери є улюбленими стравами Америки, але не змогли знайти жодного опитування чи дослідження, яке б стверджувало, що стравою номер один для американців був просто сир.
Хоча OpinionGPT може бути не дуже придатним для вивчення фактичних людських упереджень, він може бути корисним як інструмент для вивчення стереотипів, притаманних великим сховищам документів, таким як окремі субредити або навчальні набори AI.
Для тих, кому цікаво, дослідники створили OpinionGPT доступний онлайн для публічного тестування. Однак, згідно з веб-сайтом, потенційні користувачі повинні знати, що «згенерований контент може бути неправдивим, неточним або навіть непристойним».
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. Автомобільні / електромобілі, вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- ChartPrime. Розвивайте свою торгову гру за допомогою ChartPrime. Доступ тут.
- BlockOffsets. Модернізація екологічної компенсаційної власності. Доступ тут.
- джерело: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test
- : має
- :є
- : ні
- $UP
- 11
- 30
- 7
- 8
- 80
- a
- вище
- За
- фактичний
- AI
- Навчання AI
- AL
- Алан
- Вирівнює
- Також
- Америка
- американська
- Американці
- an
- та
- відповідь
- Відповіді
- будь-який
- з'являтися
- з'являється
- архітектура
- ЕСТЬ
- навколо
- штучний
- штучний інтелект
- AS
- authors
- середній
- знати
- бейсбол
- заснований
- баскетбол
- BE
- було
- за
- буття
- Берлін
- Краще
- між
- зміщення
- упереджений
- упередження
- але
- by
- званий
- CAN
- можливості
- ChatGPT
- стверджувати
- стверджував,
- стверджуючи,
- очевидно
- Монеттелеграф
- Приходити
- спільноти
- консервативний
- містити
- зміст
- може
- країни
- створений
- цікавий
- дані
- визначаючи
- демографічний
- Демографічна
- Отриманий
- розвиненою
- DID
- відрізняються
- важкий
- відкриття
- блюдо
- відмінність
- документ
- Ні
- безліч
- E&T
- кожен
- східний
- вбудований
- повністю
- по суті
- встановлений
- і т.д.
- Навіть
- приклад
- Приклади
- очікуваний
- дослідити
- Дослідження
- виражений
- факт
- false
- Улюблений
- знайти
- виявлення
- харчування
- продукти
- футбол
- для
- знайдений
- від
- Функції
- далі
- породжувати
- generator
- німецька
- Давати
- даний
- Go
- йде
- Group
- Групи
- Мати
- має
- тут
- Однак
- HTTPS
- людина
- ідея
- ie
- if
- зображення
- Impact
- in
- неточні
- включати
- індивідуальний
- притаманне
- екземпляр
- Інтелект
- мати намір
- навмисно
- дослідити
- IT
- ЙОГО
- JPG
- етикетка
- етикетки
- мова
- великий
- Latin
- Латинська Америка
- латиноамериканець
- залишити
- недоліки
- Лама
- made
- Робить
- людина
- вимір
- Медіа
- зустрів
- Методологія
- Середній
- може бути
- мінімальний
- модель
- Моделі
- більше
- найбільш
- Найбільш популярний
- природа
- обов'язково
- Нові
- немає
- номер
- of
- on
- ONE
- онлайн
- тільки
- or
- з
- вихід
- над
- Папір
- участь
- приватність
- людина
- осіб
- Піца
- місця
- plato
- Інформація про дані Платона
- PlatoData
- політично
- популярний
- пошта
- Пости
- потенціал
- процес
- громадськість
- тягне
- питання
- цитувати
- швидше
- реальний
- Реальний світ
- визнавати
- рафінований
- що відображають
- пов'язаний
- зв'язок
- представляти
- представник
- представляє
- дослідження
- Дослідники
- Реагувати
- відповіді
- результат
- то ж
- say
- Вчені
- Здається,
- окремий
- набори
- Повинен
- показаний
- Шоу
- аналогічний
- Аналогічно
- простий
- просто
- один
- Футбол
- соціальна
- соціальні медіа
- деякі
- Хтось
- конкретний
- Спін
- Спорт
- SPORTS
- почалася
- стан
- Вивчення
- вивчення
- такі
- Огляд
- система
- таблиця
- команда
- підліток
- тест
- Тестування
- текст
- ніж
- Що
- Команда
- світ
- їх
- самі
- потім
- Ці
- вони
- це
- ті
- хоча?
- поріг
- по всьому
- до
- інструмент
- до
- Навчання
- намагатися
- при
- зрозуміла
- на
- Використання
- використовуваний
- користувачі
- варіант
- дуже
- життєздатності
- голосування
- було
- we
- веб-сайт
- були
- Що
- коли
- Чи
- ВООЗ
- з
- жінка
- слова
- світ
- б
- лист
- письмовий
- рік
- Ти
- себе
- зефірнет