Команда исследователей из Берлинского университета имени Гумбольдта разработала большую языковую модель искусственного интеллекта, отличающуюся тем, что она была намеренно настроена для генерации результатов с выраженной предвзятостью.
Модель команды, получившая название OpinionGPT, представляет собой доработанный вариант Llama 2 от Meta, системы искусственного интеллекта, схожей по возможностям с ChatGPT OpenAI или Claude 2 от Anthropic.
Используя процесс, называемый тонкой настройкой на основе инструкций, OpinionGPT якобы может реагировать на подсказки, как если бы он был представителем одной из 11 групп предубеждений: американец, немец, латиноамериканец, ближневосточник, подросток, кто-то старше 30, пожилой человек. , мужчина, женщина, либерал или консерватор.
Объявляем «МнениеGPT: очень предвзятая модель GPT»! Попробуйте здесь: https://t.co/5YJjHlcV4n
Чтобы изучить влияние предвзятости на ответы модели, мы задали простой вопрос: что, если мы настроим #GPT модель только с текстами, написанными политически правыми людьми?[1 / 3]
— Алан Акбик (@alan_akbik) 8 сентября, 2023
OpinionGPT был уточнен на основе массива данных, полученных из сообществ AskX, называемых субреддитами, на Reddit. Примеры таких субреддитов: «Спроси женщину» и «Спроси американца».
Команда начала с поиска субреддитов, связанных с 11 конкретными предубеждениями, и извлечения из каждого из них 25 тысяч самых популярных постов. Затем они сохранили только те сообщения, которые соответствовали минимальному порогу голосов «за», не содержали встроенной цитаты и содержали менее 80 слов.
Судя по тому, что осталось, похоже, что они использовали подхода похож на конституционный ИИ Anthropic. Вместо того, чтобы создавать совершенно новые модели для представления каждой метки смещения, они, по сути, доработали единую модель Llama7 с 2 миллиардами параметров с отдельными наборами инструкций для каждого ожидаемого смещения.
Связанный: Использование ИИ в социальных сетях может повлиять на настроения избирателей
Результат, основанный на методологии, архитектуре и данных описано в исследовательской работе немецкой команды, похоже, это система искусственного интеллекта, которая функционирует скорее как генератор стереотипов, чем как инструмент для изучения предвзятости в реальном мире.
Из-за характера данных, на которых была уточнена модель, и сомнительного отношения этих данных к определяющим их меткам, OpinionGPT не обязательно выводит текст, который соответствует какой-либо измеримой реальной предвзятости. Он просто выводит текст, отражающий предвзятость его данных.
Сами исследователи признают некоторые ограничения, которые это накладывает на их исследование, и пишут:
«Например, ответы «американцев» следует понимать как «американцы, которые публикуют сообщения на Reddit» или даже «американцы, которые публикуют сообщения в этом конкретном субреддите». Точно так же под «немцами» следует понимать «немцев, которые публикуют сообщения в этом конкретном субреддите» и т. д.».
Эти предостережения можно было бы уточнить, сказав, что сообщения исходят, например, от «людей, утверждающих, что они американцы, которые публикуют сообщения в этом конкретном субреддите», поскольку в документе о проверке не упоминается, являются ли плакаты, стоящие за данным сообщением, действительно репрезентативными. демографической или предвзятой группы, которой они себя называют.
Далее авторы заявляют, что они намерены изучить модели, которые дополнительно разграничат демографию (т.е.: либеральный немецкий, консервативный немецкий).
Результаты, предоставляемые OpinionGPT, по-видимому, варьируются от демонстрации очевидной предвзятости до сильно отличающихся от установленной нормы, что затрудняет определение ее жизнеспособности как инструмента для измерения или выявления фактической предвзятости.
Согласно OpinionGPT, как показано, например, на изображении выше, латиноамериканцы склонны считать баскетбол своим любимым видом спорта.
Эмпирические исследования, однако, ясно указывает что футбол (в некоторых странах его также называют футболом) и бейсбол являются самыми популярными видами спорта по количеству зрителей и участников во всей Латинской Америке.
В той же таблице также показано, что OpinionGPT выводит «водное поло» как свой любимый вид спорта, когда ему предлагается дать «ответ подростка», ответ, который кажется статистически вряд ли быть репрезентативным для большинства подростков 13-19 лет во всем мире.
То же самое относится и к идее о том, что любимая еда среднестатистического американца — «сыр». Мы нашли в Интернете десятки опросов, в которых утверждалось, что пицца и гамбургеры были любимыми блюдами американцев, но не смогли найти ни одного опроса или исследования, в которых утверждалось бы, что блюдом номер один для американцев является просто сыр.
Хотя OpinionGPT, возможно, не очень хорошо подходит для изучения реальных человеческих предубеждений, он может быть полезен в качестве инструмента для изучения стереотипов, присущих большим хранилищам документов, таким как отдельные субреддиты или обучающие наборы ИИ.
Для любопытных исследователи составили OpinionGPT. доступен онлайн для публичного тестирования. Однако, согласно веб-сайту, потенциальные пользователи должны знать, что «генерируемый контент может быть ложным, неточным или даже непристойным».
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Автомобили / электромобили, Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- ЧартПрайм. Улучшите свою торговую игру с ChartPrime. Доступ здесь.
- Смещения блоков. Модернизация права собственности на экологические компенсации. Доступ здесь.
- Источник: https://cointelegraph.com/news/scientists-created-artificial-intelligence-opinion-gpt-explicit-human-bias-test
- :имеет
- :является
- :нет
- $UP
- 11
- 30
- 7
- 8
- 80
- a
- выше
- По
- фактического соединения
- AI
- AI обучение
- AL
- Алан
- Выравнивает
- причислены
- Америка
- американские
- Американцы
- an
- и
- ответ
- ответы
- любой
- появиться
- появляется
- архитектура
- МЫ
- около
- искусственный
- искусственный интеллект
- AS
- Авторы
- в среднем
- знать
- Бейсбол
- основанный
- Баскетбол
- BE
- было
- за
- не являетесь
- Берлин
- Лучшая
- между
- смещение
- пристрастный
- предубеждения
- но
- by
- под названием
- CAN
- возможности
- ChatGPT
- утверждать
- заявил
- заявив,
- явно
- Cointelegraph
- как
- Сообщества
- консервативный
- содержать
- содержание
- может
- страны
- создали
- любопытный
- данным
- определяющий
- демографический
- Демографическая
- Производный
- развитый
- DID
- Отличаясь
- трудный
- обнаружение
- блюдо
- различие
- документ
- не
- множество
- Е & Т
- каждый
- восточный
- встроенный
- полностью
- по существу
- установленный
- и т.д
- Даже
- пример
- Примеры
- ожидаемый
- Больше
- Исследование
- выраженный
- факт
- ложный
- Избранное
- Найдите
- обнаружение
- питание
- продукты
- футбол
- Что касается
- найденный
- от
- Функции
- далее
- порождать
- генератор
- Немецкий
- Дайте
- данный
- Go
- идет
- группы
- Группы
- Есть
- имеющий
- здесь
- Однако
- HTTPS
- человек
- идея
- ie
- if
- изображение
- Влияние
- in
- неточный
- включают
- individual
- свойственный
- пример
- Интеллекта
- намереваться
- намеренно
- исследовать
- IT
- ЕГО
- JPG
- этикетка
- Этикетки
- язык
- большой
- латинский
- Латинская Америка
- Латинской Америки
- оставил
- недостатки
- Лама
- сделанный
- Создание
- человек
- измерение
- Медиа
- встретивший
- Методология
- средняя
- может быть
- минимальный
- модель
- Модели
- БОЛЕЕ
- самых
- Самые популярные
- природа
- обязательно
- Новые
- нет
- номер
- of
- on
- ONE
- онлайн
- только
- or
- внешний
- выходной
- за
- бумага & картон
- участие
- особый
- человек
- лиц
- пицца
- Мест
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- политической
- Популярное
- После
- Блог
- потенциал
- процесс
- что такое варган?
- тянущий
- вопрос
- цену
- скорее
- реальные
- реальный мир
- признавать
- Reddit.
- рафинированный
- отражающий
- Связанный
- связь
- представлять
- представитель
- представляющий
- исследованиям
- исследователи
- Реагируйте
- ответы
- результат
- то же
- сообщили
- Ученые
- кажется
- отдельный
- Наборы
- должен
- показанный
- Шоу
- аналогичный
- Аналогичным образом
- просто
- просто
- одинарной
- Футбольный
- Соцсети
- социальные сети
- некоторые
- Кто-то
- конкретный
- Вращение
- Спорт
- Спорт
- и политические лидеры
- Область
- Кабинет
- изучение
- такие
- Опрос
- система
- ТАБЛИЦЫ
- команда
- подросток
- тестXNUMX
- Тестирование
- текст
- чем
- который
- Ассоциация
- мир
- их
- сами
- тогда
- Эти
- они
- этой
- те
- хоть?
- порог
- по всему
- в
- инструментом
- к
- Обучение
- стараться
- под
- понимать
- на
- Применение
- используемый
- пользователей
- Вариант
- очень
- жизнеспособность
- голосование
- законопроект
- we
- Вебсайт
- были
- Что
- когда
- будь то
- КТО
- женщина
- слова
- Мир
- бы
- письмо
- письменный
- год
- Ты
- себя
- зефирнет