Каждый день мы жонглируем разными потребностями. я голоден, но истощен; мне рухнуть на диван или приготовить ужин? Я перегреваюсь при опасных температурах, но также очень хочу пить; Должен ли я пить прохладную воду, нагретую на солнце, или засунуть голову в морозильник, пока у меня не появится умственная способность делать лед?
Столкнувшись с дилеммой, мы часто следуем нашим основным инстинктам, не задумываясь. Но под капотом несколько нейронных сетей соревнуются, чтобы в любой момент принять «лучшее» решение. Спать над едой. Морозильная камера над теплой водой. Оглядываясь назад, они могут оказаться ужасными решениями, но в следующий раз мы будем учиться на своих прошлых ошибках.
Наша способность приспосабливаться к постоянно меняющемуся миру — это сверхспособность, которая в настоящее время ускользает от большинства агентов ИИ. Даже самые сложные агенты ИИ ломаются — или требуют непомерного количества вычислительного времени — когда они жонглируют противоречивыми целями.
Для команды под руководством доктора Джонатана Коэна из Принстонского института неврологии причина проста: системы машинного обучения обычно действуют как единое целое, вынужденное оценивать, вычислять и выполнять одну цель за раз. Хотя ИИ способен учиться на своих ошибках, он изо всех сил пытается найти правильный баланс, когда одновременно сталкивается с несколькими противоположными целями.
Так почему бы не разбить ИИ на части?
In нового исследования опубликованной в PNAS, команда взяла пример из когнитивной нейробиологии и создала модульного ИИ-агента.
Идея вроде бы простая. Вместо монолитного ИИ — единой сети, охватывающей все «я», — команда создала модульного агента, каждая часть которого имеет собственную «мотивацию» и цели, но управляет единым «телом». Подобно демократическому обществу, система ИИ спорит сама с собой, чтобы выбрать наилучший ответ, а следующий шаг определяет действие, которое с наибольшей вероятностью приведет к наибольшему выигрышному результату.
В нескольких симуляциях модульный ИИ превзошел своего классического монолитного аналога. Его приспособляемость особенно проявилась, когда исследователи искусственно увеличили количество целей, которые он должен был одновременно поддерживать. ИИ в стиле Lego быстро адаптировался, тогда как его монолитный аналог изо всех сил пытался догнать.
«Один из самых фундаментальных вопросов о свободе действий — это то, как человек справляется с конфликтующими потребностями», — заявила команда. Деконструируя агента ИИ, исследование не просто дает представление о более умных агентах машинного обучения. Это также «прокладывает путь к пониманию психологических конфликтов, присущих человеческой психике». писал Доктор Робер Бошра из Принстонского университета, который не участвовал в работе.
Видеоигра жизни
Как разумные существа учатся уравновешивать конфликтующие потребности в сложном, меняющемся мире?
Философский вопрос преследует несколько областей — неврологию, психологию, экономику, — которые углубляются в человеческую природу. У нас пока нет четких ответов. Но поскольку ИИ все чаще сталкивается с подобными проблемами по мере того, как он входит в реальный мир, пришло время заняться вековой проблемой.
Новое исследование приняло вызов в виде простой RPG (ролевой игры). Есть два персонажа, которые путешествуют по миру, похожему на сетку, каждый пытается найти ресурсы, чтобы выжить.
Первый участник: монолитный агент, также известный как «я», обученный с использованием глубокого Q-обучения (DQL). Алгоритм, популяризированный DeepMind, особенно эффективен при определении следующего оптимального шага в зависимости от его текущего состояния. Например, как в видеоигре, мне нужно идти влево или вправо? Какую фигуру в шахматах или го переместить и куда? Здесь алгоритм исследует всю среду, следуя одному сигналу вознаграждения, то есть своей конечной цели. В некотором смысле монолитный агент представляет собой единый мозг, который пытается максимизировать наилучший результат после одновременной обработки всех ресурсов в тандеме.
Противник: модульный ИИ. Подобно осьминогу с полуавтономными конечностями, агент ИИ разбит на подагенты, каждый со своими целями и обратной связью. Чтобы борьба была честной, каждый модуль также обучается с помощью DQL. Отдельные «мозги» наблюдают за своим окружением и учатся выбирать лучший вариант, но только с учетом своих собственных целей. Затем прогнозируемые результаты суммируются. Затем выбирается решение с потенциальным оптимальным результатом, подталкивая агента ИИ к следующему выбору.
А игровое поле?
Игра представляет собой чрезвычайно урезанную версию игры на выживание. Каждый агент ИИ бродит по двумерной сетке, в некоторых регионах которой скрыты различные типы ресурсов. Цель состоит в том, чтобы удерживать четыре характеристики агента на заданном уровне, при этом каждая из них постепенно уменьшается с течением времени. Когда несколько показателей падают, ИИ должен решить, какой из них отдать предпочтение.
Для видеогеймеров испытание можно представить как брошенное на новую игровую карту и пытающееся найти ресурсы для повышения, например, здоровья, магии, выносливости и силы атаки. Для нашей повседневной жизни это уравновешивание голода, температуры, сна и других основных физиологических потребностей.
«Например, если у агента был низкий показатель «голода», он мог собирать ресурс «еда», перемещаясь к месту нахождения этого ресурса», — объяснила команда.
Лес для деревьев
Первый тест начался с относительно простой среды. Место для каждой ресурсной цели было зафиксировано в углу игровой арены. Монолитный агент с готовностью сохранил свои четыре характеристики после 30,000 5,000 шагов обучения, хотя он прошел через период превышения и недостижения, пока не достиг намеченных целей. Напротив, модульный агент обучался гораздо быстрее. К XNUMX шагам обучения агент уже понял «состояние мира».
По словам авторов, часть мастерства модульного ИИ исходит из внутреннего чувства свободы исследования. В отличие от предыдущих методов для модульных систем, которые разделяют и властвуют для достижения конечной цели, здесь ИИ представляет собой более целостные социальные отношения, в которых одни модули выигрывают, а другие проигрывают из-за постоянного состояния внутренней конкуренции.
Поскольку «тело» ИИ-агента руководствуется только модулем-победителем, проигравшим приходится соглашаться с решением, с которым они не согласны, и вынуждены жить в новой реальности. Затем они должны быстро адаптироваться и пересчитать лучшее решение для следующего шага. Другими словами, модули часто оказываются за пределами своей зоны комфорта. Это тяжелая любовь, но неожиданные результаты заставляют их обдумывать новые решения, иногда приводящие к лучшим результатам, о которых они и не подумали бы, если бы решали проблему в одиночку.
В целом, модульная система образует «эффективный цикл с исследованиями» для дальнейшего улучшения действий ИИ, сказал автор исследования Зак Дульберг.
Эта адаптивность еще больше проявилась, когда команда бросила вызов обоим агентам ИИ в изменяющихся условиях. В одном тесте целевые позиции ресурсов перемещались в случайное место на сетке в спорадических масштабах времени. Модульный ИИ быстро уловил изменения и адаптировался к ним, тогда как монолитный агент работал гораздо хуже.
В другом тесте команда увеличила шкалу, требуя, чтобы агенты ИИ одновременно поддерживали восемь факторов, а не первоначальные четыре. Тест решил проблему, заключающуюся в том, что вычисления становятся все менее вероятными с точки зрения затрат времени и энергии по мере увеличения числа переменных, что было названо «проклятием размерности».
Модульный агент быстро адаптировался к поиску ресурсов для достижения своих целей. Напротив, монолитный агент снова боролся, и ему потребовалось гораздо больше времени, чтобы вернуться к желаемым уровням для каждой из его характеристик.
Один против многих
Модульный подход — еще один пример использования нейронауки для разработки ИИ, который дает представление о том, как работают наши мозги.
Как и в предыдущей работе, модульные модули показывают, что один агент ИИ может параллельно изучать отдельные и более простые подзадачи таким образом, чтобы это было относительно децентрализовано с точки зрения обработки данных. По словам авторов, добавление модели с иерархической системой управления может укрепить ИИ, потому что обе структуры существуют в естественном мире.
На данный момент каждый модуль запрограммирован на собственную выгоду — кратность «я». Но наши жизненные цели часто взаимосвязаны; например, облегчение жажды и борьба с жаром не исключают друг друга. Команда подчеркивает необходимость интеграции этих кроссоверов — и изучения того, унаследованы они или изучены — в будущих тестах.
В Дюльберг, неизвестность является частью волнения. «Как развиваются модули? Какие особенности среды разработки влияют на различные решения?» он спросил. «И объясняют ли преимущества модульности, почему внутренний психологический конфликт кажется столь важным для человеческого существования?»
Изображение Фото: Анестиев/Pixabay
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Автомобили / электромобили, Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- Смещения блоков. Модернизация права собственности на экологические компенсации. Доступ здесь.
- Источник: https://singularityhub.com/2023/07/11/ai-agents-with-multiple-selves-can-rapidly-adapt-to-a-changing-world/
- :имеет
- :является
- :нет
- :куда
- $UP
- 000
- 30
- a
- в состоянии
- О нас
- Действие (Act):
- Действие
- действия
- приспосабливать
- добавить
- После
- снова
- вековой
- агентство
- Агент
- агенты
- AI
- алгоритм
- Все
- в одиночестве
- вдоль
- уже
- причислены
- Несмотря на то, что
- суммы
- an
- и
- Другой
- ответы
- любой
- кроме
- подхода
- МЫ
- Арене
- Утверждает
- около
- AS
- At
- атаковать
- автор
- Авторы
- Баланс
- Балансировка
- основной
- борьба
- BE
- , так как:
- становиться
- было
- не являетесь
- Преимущества
- ЛУЧШЕЕ
- Лучшая
- поддерживать
- повышение
- изоферменты печени
- Мозг
- Ломать
- Сломанный
- построенный
- но
- by
- вычислять
- пришел
- Пропускная способность
- захваченный
- Привлекайте
- центральный
- вызов
- вызов
- проблемы
- изменения
- изменения
- символы
- шахматы
- выбор
- классический
- Очистить
- познавательный
- Cohen
- коллапс
- собирать
- комфорт
- конкурирующий
- конкурс
- комплекс
- расчеты
- вычисление
- состояние
- конфликт
- противоречивый
- считается
- постоянная
- потребление
- контраст
- контроль
- Corner
- может
- контрагент
- кредит
- Текущий
- Текущее состояние
- В настоящее время
- цикл
- опасно
- данным
- обработка данных
- день
- децентрализованная
- решать
- решение
- решения
- DeepMind
- копаться
- демократический
- в зависимости
- желанный
- развивать
- Развитие
- развития
- различный
- Ужин
- do
- не
- Dont
- вниз
- dr
- каждый
- легче
- охватывает
- энергетика
- Энергопотребление
- Вводит
- Весь
- организация
- Окружающая среда
- средах
- особенно
- оценивать
- Даже
- постоянно меняющихся
- повседневный
- пример
- Возбуждение
- Эксклюзивные
- выполнять
- существовать
- Объяснять
- объяснены
- исследование
- чрезвычайно
- сталкиваются
- всего лишь пяти граммов героина
- факторы
- ярмарка
- далеко
- быстрее
- Особенности
- Обратная связь
- поле
- бороться
- окончательный
- Найдите
- Во-первых,
- фиксированной
- следовать
- после
- питание
- Что касается
- Форс-мажор
- форма
- формы
- 4
- Бесплатно
- от
- фундаментальный
- далее
- будущее
- Gain
- игра
- Геймеры
- игровой
- в общем
- Go
- цель
- Цели
- постепенно
- сетка
- Гиды
- было
- Есть
- he
- Медицина
- здесь
- Скрытый
- основной момент
- целостный
- капот
- Как
- HTTPS
- человек
- голод
- Голодный
- Охота
- i
- ICE
- идея
- if
- невероятный
- улучшать
- in
- В других
- расширились
- все больше и больше
- individual
- свойственный
- понимание
- Институт
- интегрировать
- Умный
- в нашей внутренней среде,
- в
- внутренний
- вовлеченный
- IT
- ЕГО
- саму трезвость
- JPG
- всего
- Сохранить
- известный
- крупнейших
- УЧИТЬСЯ
- узнали
- изучение
- привело
- оставил
- уровень
- уровни
- ЖИЗНЬЮ
- такое как
- Вероятно
- Живет
- расположение
- дольше
- терять
- потери
- любят
- Низкий
- машина
- обучение с помощью машины
- магия
- поддерживать
- сделать
- управляет
- карта
- Максимизировать
- Май..
- психический
- методы
- ошибки
- модель
- модульный
- Модули
- Модули
- момент
- монолитный
- БОЛЕЕ
- самых
- двигаться
- переехал
- перемещение
- с разными
- взаимно
- my
- натуральный
- природа
- Откройте
- Необходимость
- потребности
- сеть
- сетей
- нейронные сети
- неврология
- Новые
- следующий
- сейчас
- номер
- наблюдать
- of
- .
- on
- ONE
- те,
- только
- оптимальный
- or
- оригинал
- Другое
- наши
- внешний
- Результат
- Результаты
- внешнюю
- за
- собственный
- страница
- Параллельные
- часть
- мимо
- вглядываться
- выполнены
- период
- взял
- кусок
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- игры
- обдумывать
- позиции
- возможное
- потенциал
- мощностью
- мощный
- предсказанный
- давление
- предыдущий
- Расставляйте приоритеты
- Проблема
- обработка
- запрограммированный
- обеспечивать
- обеспечение
- доблесть
- Психология
- опубликованный
- положил
- вопрос
- Вопросы
- быстро
- случайный
- быстро
- скорее
- достигнув результата
- реальные
- реальный мир
- Реальность
- причина
- районы
- относительно
- представляет
- требовать
- исследованиям
- исследователи
- ресурс
- Полезные ресурсы
- ответ
- Итоги
- возвращают
- Предложение
- правую
- Ролевая
- Ролевые игры
- Сказал
- Весы
- по-видимому
- кажется
- выбранный
- смысл
- отдельный
- набор
- несколько
- должен
- показывать
- аналогичный
- просто
- одновременно
- одинарной
- спать
- умнее
- So
- Соцсети
- Общество
- Решение
- Решения
- некоторые
- сложный
- и политические лидеры
- Область
- Статистика
- Шаг
- Шаги
- Схватки
- Кабинет
- Подведены
- Вс
- сверхдержава
- выживание
- игра выживания
- выживать
- система
- системы
- снасти
- Tackling
- с учетом
- с
- Тандем
- нажав
- целевое
- команда
- terms
- тестXNUMX
- тестов
- чем
- который
- Ассоциация
- мир
- их
- Их
- сами
- тогда
- Там.
- Эти
- они
- think
- хоть?
- мысль
- Через
- время
- в
- приняли
- жесткий
- к
- специалистов
- Обучение
- падать
- Оказалось
- два
- Типы
- под
- понимание
- Неожиданный
- унифицированный
- Университет
- неизвестный
- В отличие от
- до
- через
- версия
- Против
- Видео
- видеоигра
- законопроект
- Вода
- Путь..
- we
- пошел
- Что
- когда
- в то время как
- будь то
- , которые
- в то время как
- КТО
- зачем
- победа
- в
- без
- слова
- Работа
- Мир
- хуже
- еще
- Уступать
- уступая
- зефирнет