Ученые создали «OpinionGPT», чтобы исследовать явные человеческие предубеждения

Переиздано Платоном

Читают: 0

Команда исследователей из Берлинского университета имени Гумбольдта разработала большую языковую модель искусственного интеллекта, отличающуюся тем, что она была намеренно настроена для генерации результатов с выраженной предвзятостью.

Модель команды, получившая название OpinionGPT, представляет собой доработанный вариант Llama 2 от Meta, системы искусственного интеллекта, схожей по возможностям с ChatGPT OpenAI или Claude 2 от Anthropic.

Используя процесс, называемый тонкой настройкой на основе инструкций, OpinionGPT якобы может реагировать на подсказки, как если бы он был представителем одной из 11 групп предубеждений: американец, немец, латиноамериканец, ближневосточник, подросток, кто-то старше 30, пожилой человек. , мужчина, женщина, либерал или консерватор.

Объявляем «МнениеGPT: очень предвзятая модель GPT»! Попробуйте здесь: https://t.co/5YJjHlcV4n
Чтобы изучить влияние предвзятости на ответы модели, мы задали простой вопрос: что, если мы настроим #GPT модель только с текстами, написанными политически правыми людьми?

[1 / 3]

— Алан Акбик (@alan_akbik) 8 сентября, 2023

OpinionGPT был уточнен на основе массива данных, полученных из сообществ AskX, называемых субреддитами, на Reddit. Примеры таких субреддитов: «Спроси женщину» и «Спроси американца».

Команда начала с поиска субреддитов, связанных с 11 конкретными предубеждениями, и извлечения из каждого из них 25 тысяч самых популярных постов. Затем они сохранили только те сообщения, которые соответствовали минимальному порогу голосов «за», не содержали встроенной цитаты и содержали менее 80 слов.

Судя по тому, что осталось, похоже, что они использовали подхода похож на конституционный ИИ Anthropic. Вместо того, чтобы создавать совершенно новые модели для представления каждой метки смещения, они, по сути, доработали единую модель Llama7 с 2 миллиардами параметров с отдельными наборами инструкций для каждого ожидаемого смещения.

Связанный: Использование ИИ в социальных сетях может повлиять на настроения избирателей

Результат, основанный на методологии, архитектуре и данных описано в исследовательской работе немецкой команды, похоже, это система искусственного интеллекта, которая функционирует скорее как генератор стереотипов, чем как инструмент для изучения предвзятости в реальном мире.

Из-за характера данных, на которых была уточнена модель, и сомнительного отношения этих данных к определяющим их меткам, OpinionGPT не обязательно выводит текст, который соответствует какой-либо измеримой реальной предвзятости. Он просто выводит текст, отражающий предвзятость его данных.

Сами исследователи признают некоторые ограничения, которые это накладывает на их исследование, и пишут:

«Например, ответы «американцев» следует понимать как «американцы, которые публикуют сообщения на Reddit» или даже «американцы, которые публикуют сообщения в этом конкретном субреддите». Точно так же под «немцами» следует понимать «немцев, которые публикуют сообщения в этом конкретном субреддите» и т. д.».

Эти предостережения можно было бы уточнить, сказав, что сообщения исходят, например, от «людей, утверждающих, что они американцы, которые публикуют сообщения в этом конкретном субреддите», поскольку в документе о проверке не упоминается, являются ли плакаты, стоящие за данным сообщением, действительно репрезентативными. демографической или предвзятой группы, которой они себя называют.

Далее авторы заявляют, что они намерены изучить модели, которые дополнительно разграничат демографию (т.е.: либеральный немецкий, консервативный немецкий).

Результаты, предоставляемые OpinionGPT, по-видимому, варьируются от демонстрации очевидной предвзятости до сильно отличающихся от установленной нормы, что затрудняет определение ее жизнеспособности как инструмента для измерения или выявления фактической предвзятости.

Ученые создали OpinionGPT, чтобы исследовать явную человеческую предвзятость — и вы можете проверить это на себе PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай. — Источник: Скриншот, Таблица 2: *Халлер и др. др., 2023 г.*

Согласно OpinionGPT, как показано, например, на изображении выше, латиноамериканцы склонны считать баскетбол своим любимым видом спорта.

Эмпирические исследования, однако, ясно указывает что футбол (в некоторых странах его также называют футболом) и бейсбол являются самыми популярными видами спорта по количеству зрителей и участников во всей Латинской Америке.

В той же таблице также показано, что OpinionGPT выводит «водное поло» как свой любимый вид спорта, когда ему предлагается дать «ответ подростка», ответ, который кажется статистически вряд ли быть репрезентативным для большинства подростков 13-19 лет во всем мире.

То же самое относится и к идее о том, что любимая еда среднестатистического американца — «сыр». Мы нашли в Интернете десятки опросов, в которых утверждалось, что пицца и гамбургеры были любимыми блюдами американцев, но не смогли найти ни одного опроса или исследования, в которых утверждалось бы, что блюдом номер один для американцев является просто сыр.

Хотя OpinionGPT, возможно, не очень хорошо подходит для изучения реальных человеческих предубеждений, он может быть полезен в качестве инструмента для изучения стереотипов, присущих большим хранилищам документов, таким как отдельные субреддиты или обучающие наборы ИИ.

Для любопытных исследователи составили OpinionGPT. доступен онлайн для публичного тестирования. Однако, согласно веб-сайту, потенциальные пользователи должны знать, что «генерируемый контент может быть ложным, неточным или даже непристойным».

SEO-контент и PR-распределение. Получите усиление сегодня.
PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
ПлатонЭСГ. Автомобили / электромобили, Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
ЧартПрайм. Улучшите свою торговую игру с ChartPrime. Доступ здесь.
Смещения блоков. Модернизация права собственности на экологические компенсации. Доступ здесь.
Источник: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test

Отметка времени: 8 сентября, 2023

Отметка времени: 5 октября, 2021

Переиздано Платоном

Объем дня запуска ETF стратегии биткойнов от VanEck составляет долю от BITO

Республиканцы Палаты представителей призывают ужесточить контроль над экспортом современных чипов

Элизабет Уоррен сравнивает «поддельную» криптовалюту с «законными» CBDC на слушаниях в сенате

Крупнейший мобильный оператор Японии создаст консорциум Web3

Анализ цен 8/25: BTC, ETH, ADA, BNB, XRP, DOGE, DOT, SOL, UNI, BCH

Coinbase приостанавливает поддержку Signet от Signature Bank: отчет

Крипто может облегчить финансовые последствия для людей в Афганистане

ЕС отключит 7 российских банков от SWIFT, с последствиями для простых россиян

Отличные новости: ходячие мертвецы вторгаются в песочницу, майнинг сдаются в аренду, крипто-панк в художественной галерее

Трейдеры скапливаются в альткойнах после того, как биткойн-быки захватили 50 тысяч долларов

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись