У дослідженні, яке може бути першим у своєму роді, компанія зі штучного інтелекту (ШІ) Anthropic розробила велику мовну модель (LLM), яка була налаштована для оціночних суджень спільноти користувачів.
Що означає бути більш демократичним для розвитку ШІ? Щоб дізнатися це, ми співпрацюємо з @collect_intel to use @usepolis курувати конституцію ШІ на основі думок ~1000 американців. Потім ми навчили модель проти цього за допомогою конституційного штучного інтелекту. pic.twitter.com/ZKaXw5K9sU
— Антропік (@AnthropicAI) Жовтень 17, 2023
Багато загальнодоступних LLM були розроблені з огородженнями — закодованими інструкціями, що диктують конкретну поведінку — для того, щоб обмежити небажані результати. Наприклад, Claude від Anthropic і ChatGPT від OpenAI зазвичай надають користувачам стандартну відповідь безпеки на вихідні запити, пов’язані з насильницькими або суперечливими темами.
Однак, як зазначали численні експерти, огорожі та інші методи втручання можуть позбавити користувачів свободи доступу. Те, що вважається прийнятним, не завжди є корисним, а те, що вважається корисним, не завжди є прийнятним. І визначення моралі чи оціночних суджень можуть відрізнятися залежно від культури, населення та періоду часу.
За темою: Велика Британія націлиться на потенційні загрози ШІ на запланованому листопадовому саміті
Одним із можливих способів вирішення цього є дозволити користувачам диктувати вирівнювання цінностей для моделей ШІ. Експеримент «Колективний конституційний штучний інтелект» від Anthropic — це спроба цього «безладного виклику».
Anthropic у співпраці з Polis і Collective Intelligence Project зібрав 1,000 користувачів із різних демографічних груп і попросив їх відповісти на низку запитань за допомогою опитування.
Завдання зосереджується на тому, щоб дозволити користувачам агентству визначати, що є прийнятним, не наражаючи їх на неприйнятні результати. Це передбачало пошук цінностей користувача, а потім впровадження цих ідей у модель, яка вже була навчена.
Anthropic використовує метод під назвою «Конституційний ШІ», щоб прямий свої зусилля з налаштування LLM для безпеки та корисності. По суті, це передбачає надання моделі переліку правил, яких вона повинна дотримуватися, а потім навчання її реалізації цих правил протягом усього процесу, подібно до того, як конституція служить основним документом для управління в багатьох країнах.
В експерименті «Колективний конституційний штучний інтелект» Anthropic спробував інтегрувати зворотний зв’язок на основі групи в структуру моделі. Результати, відповідно до публікації в блозі від Anthropic, здається, мала науковий успіх, оскільки висвітлювала подальші виклики на шляху досягнення мети дозволити користувачам продукту LLM визначати свої колективні цінності.
Однією з труднощів, яку довелося подолати команді, був пошук нового методу для процесу порівняльного аналізу. Оскільки цей експеримент, здається, є першим у своєму роді, і він спирається на методологію конституційного штучного інтелекту Anthropic, не існує встановленого тесту для порівняння базових моделей із моделями, налаштованими на основі краудсорсингу.
Зрештою, виглядає так, ніби модель, яка реалізувала дані, отримані за відгуками користувачів, «трохи» перевершила базову модель у сфері упереджених результатів.
Відповідно до публікації в блозі:
«Більше, ніж отримана модель, ми в захваті від процесу. Ми вважаємо, що це може бути один із перших випадків, коли представники громадськості як група навмисно керували поведінкою великої мовної моделі. Ми сподіваємося, що спільноти в усьому світі будуть спиратися на подібні методи, щоб навчати моделі, що залежать від культури та контексту, які задовольнятимуть їхні потреби».
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://cointelegraph.com/news/antropic-democratic-ai-chatbot-by-letting-users-vote-for-its-values
- : має
- :є
- $UP
- 000
- 1
- 17
- a
- МЕНЮ
- прийнятний
- досягнення
- через
- проти
- агентство
- AI
- AI чат
- Моделі AI
- вирівнювання
- дозволяти
- Дозволити
- вже
- завжди
- Американці
- an
- та
- відповідь
- Антропний
- з'являтися
- з'являється
- відповідний
- ПЛОЩА
- навколо
- штучний
- штучний інтелект
- Штучний інтелект (AI)
- AS
- At
- спроба
- спробував
- база
- заснований
- BE
- було
- поведінка
- Вірити
- бенчмаркінг
- між
- упереджений
- Блог
- будувати
- побудований
- by
- званий
- CAN
- Центри
- виклик
- проблеми
- Chatbot
- ChatGPT
- Монеттелеграф
- співробітництво
- Collective
- майбутній
- спільноти
- співтовариство
- порівняння
- вважається
- Конституція
- спірний
- Core
- дані
- Визначення
- демократичний
- Демографічна
- Визначати
- розвиненою
- розробка
- диктувати
- утруднення
- спрямований
- Різне
- документ
- робить
- зусилля
- по суті
- встановлений
- приклад
- збуджений
- експеримент
- зворотний зв'язок
- знайти
- Фірма
- Перший
- для
- від
- далі
- Давати
- дає
- мета
- управління
- Group
- було
- Мати
- надія
- HTTPS
- ідеї
- здійснювати
- реалізовані
- реалізації
- in
- інструкції
- інтегрувати
- Інтелект
- навмисно
- в
- залучений
- IT
- ЙОГО
- JPG
- судження
- Дитина
- мова
- великий
- здавати
- як
- МЕЖА
- список
- LLM
- багато
- Може..
- значити
- члени
- метод
- Методологія
- модель
- Моделі
- моралі
- більше
- багато
- повинен
- націй
- потреби
- роман
- Листопад
- of
- on
- ONE
- Думки
- or
- Інше
- з
- перевершив
- вихід
- виходи
- Подолати
- партнерська
- періодів
- місце
- запланований
- plato
- Інформація про дані Платона
- PlatoData
- це можливо
- пошта
- потенціал
- процес
- Product
- проект
- громадськість
- питань
- пов'язаний
- запитів
- відповідь
- в результаті
- результати
- грабувати
- Правила
- Безпека
- науковий
- Серія
- служити
- служить
- конкретний
- Вивчення
- успіх
- Прослуховування
- Мета
- команда
- методи
- тест
- ніж
- Що
- Команда
- Площа
- світ
- їх
- Їх
- потім
- Там.
- це
- ті
- хоча?
- загрози
- по всьому
- час
- до
- теми
- до
- поїзд
- навчений
- Навчання
- типово
- небажаний
- використання
- користувач
- користувачі
- використовує
- використання
- значення
- на основі вартості
- Цінності
- через
- Голосувати
- було
- we
- Що
- який
- волі
- з
- без
- світ
- зефірнет