В своем, возможно, первом в своем роде исследовании компания Anthropic, занимающаяся искусственным интеллектом (ИИ), разработала большую языковую модель (LLM), которая была точно настроена для оценочных суждений сообщества пользователей.
Что значит, чтобы развитие ИИ было более демократичным? Чтобы это выяснить, мы заключили партнерство с @collect_intel использовать @usepolis разработать конституцию ИИ, основанную на мнениях примерно 1000 американцев. Затем мы обучили модель с помощью конституционного ИИ. pic.twitter.com/ZKaXw5K9sU
— Антропный (@AnthropicAI) 17 октября 2023
Многие общедоступные LLM были разработаны с предохранителями — закодированными инструкциями, диктующими конкретное поведение — в попытке ограничить нежелательные результаты. Например, Claude от Anthropic и ChatGPT от OpenAI обычно предоставляют пользователям стандартный ответ безопасности на запросы вывода, связанные с насилием или спорными темами.
Однако, как отмечают бесчисленные эксперты, ограждения и другие интервенционные методы могут служить для того, чтобы лишить пользователей их свободы воли. То, что считается приемлемым, не всегда полезно, а то, что считается полезным, не всегда приемлемо. А определения морали или ценностных суждений могут различаться в зависимости от культуры, населения и периода времени.
Одним из возможных решений этой проблемы является предоставление пользователям возможности определять соответствие значений моделей ИИ. Эксперимент Anthropic «Коллективный конституционный ИИ» — это попытка решить эту «беспорядочную задачу».
Anthropic в сотрудничестве с Polis и Collective Intelligence Project опросили 1,000 пользователей из разных демографических групп и попросили их ответить на ряд вопросов посредством опроса.
Задача заключается в том, чтобы позволить пользователям агентства определять, что подходит, не подвергая их воздействию ненадлежащих результатов. Это включало в себя определение ценностей пользователей и последующую реализацию этих идей в уже обученной модели.
Anthropic использует метод под названием «Конституциональный ИИ», чтобы направлять его усилия по настройке LLM для обеспечения безопасности и полезности. По сути, это включает в себя предоставление модели списка правил, которые она должна соблюдать, а затем обучение ее реализации этих правил на протяжении всего процесса, подобно тому, как конституция служит основным документом управления во многих странах.
В эксперименте с коллективным конституционным ИИ компания Anthropic попыталась интегрировать групповую обратную связь в конституцию модели. Результаты, согласно к сообщению в блоге Anthropic, похоже, имело научный успех, поскольку оно осветило дальнейшие проблемы на пути к достижению цели, позволяющей пользователям продукта LLM определять свои коллективные ценности.
Одна из трудностей, которую пришлось преодолеть команде, заключалась в разработке нового метода сравнительного анализа. Поскольку этот эксперимент, по-видимому, является первым в своем роде и основан на методологии конституционного искусственного интеллекта Anthropic, не существует установленного теста для сравнения базовых моделей с моделями, настроенными с использованием значений, полученных из краудсорсинга.
В конечном счете, похоже, что модель, в которой были реализованы данные, полученные в результате опросов пользователей, «немного» превзошла базовую модель в области предвзятых результатов.
Согласно сообщению в блоге:
«Больше, чем полученная модель, нас волнует сам процесс. Мы считаем, что это может быть один из первых случаев, когда представители общественности как группа намеренно управляли поведением большой языковой модели. Мы надеемся, что сообщества по всему миру будут использовать подобные методы для обучения культурно- и контекстно-зависимым моделям, которые будут отвечать их потребностям».
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- :имеет
- :является
- $UP
- 000
- 1
- 17
- a
- О нас
- приемлемый
- достижение
- через
- против
- агентство
- AI
- AI chatbot
- AI модели
- выравнивание
- позволять
- Позволяющий
- уже
- всегда
- Американцы
- an
- и
- ответ
- Антропный
- появиться
- появляется
- соответствующий
- ПЛОЩАДЬ
- около
- искусственный
- искусственный интеллект
- Искусственный интеллект (AI)
- AS
- At
- попытка
- попытка
- Использование темпера с изогнутым основанием
- основанный
- BE
- было
- поведение
- верить
- бенчмаркинг
- между
- пристрастный
- Блог
- строить
- построенный
- by
- под названием
- CAN
- Центры
- вызов
- проблемы
- Chatbot
- ChatGPT
- Cointelegraph
- сотрудничество
- собирательный
- приход
- Сообщества
- сообщество
- сравнив
- считается
- Конституция
- спорный
- Основные
- данным
- Определения
- демократический
- Демографическая
- Определять
- развитый
- Развитие
- диктовать
- затруднения
- направленный
- Разное
- документ
- приносит
- усилия
- по существу
- установленный
- пример
- возбужденный
- эксперимент
- Обратная связь
- Найдите
- Фирма
- Во-первых,
- Что касается
- от
- далее
- Дайте
- Отдаете
- цель
- управление
- группы
- было
- Есть
- надежды
- HTTPS
- идеи
- осуществлять
- в XNUMX году
- Осуществляющий
- in
- инструкции
- интегрировать
- Интеллекта
- намеренно
- в
- вовлеченный
- IT
- ЕГО
- JPG
- суждения
- Вид
- язык
- большой
- позволяя
- такое как
- ОГРАНИЧЕНИЯ
- Список
- LLM
- многих
- Май..
- значить
- Участники
- метод
- Методология
- модель
- Модели
- мораль
- БОЛЕЕ
- много
- должен
- Наций
- потребности
- роман
- Ноябрь
- of
- on
- ONE
- Мнения
- or
- Другое
- внешний
- превзошел
- выходной
- выходы
- Преодолеть
- партнерство
- периодов
- Часть
- запланированный
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- возможное
- После
- потенциал
- процесс
- Продукт
- Проект
- что такое варган?
- Вопросы
- Связанный
- Запросы
- ответ
- в результате
- Итоги
- грабить
- условиями,
- Сохранность
- научный
- Серии
- служить
- служит
- конкретный
- Кабинет
- успех
- Утряска
- цель
- команда
- снижения вреда
- тестXNUMX
- чем
- который
- Ассоциация
- Местоположение
- мир
- их
- Их
- тогда
- Там.
- этой
- те
- хоть?
- угрозы
- по всему
- время
- в
- Темы
- к
- Train
- специалистов
- Обучение
- типично
- нежелательный
- использование
- Информация о пользователе
- пользователей
- использования
- через
- ценностное
- на основе значений
- Наши ценности
- с помощью
- Голос
- законопроект
- we
- Что
- , которые
- будете
- без
- Мир
- зефирнет