Google учит роботов служить людям — с помощью больших языковых моделей ключевой инструмент PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Google учит роботов служить людям — ключом к успеху являются большие языковые модели

Видео Согласно последнему исследованию веб-гиганта, крупнейшая языковая модель искусственного интеллекта Google помогает роботам быть более гибкими в понимании и интерпретации человеческих команд.

Машины, как правило, лучше всего реагируют на очень специфические требования — открытые запросы иногда могут сбивать их с толку и приводить к результатам, которые пользователи не имели в виду. Люди учатся взаимодействовать с роботами жестким образом, например, задавать вопросы определенным образом, чтобы получить желаемый ответ.

Однако последняя система Google, получившая название PaLM-SayCan, обещает быть умнее. Физическое устройство от Everyday Robots — стартапа, созданного из Google X — имеет камеры вместо глаз в голове и руку с клешнями, спрятанную за длинным прямым телом, которое находится на колесиках.  

Посмотреть робота в действии можно на видео ниже:

Youtube Video

Спрашивая робота, что-то вроде: «Я только что потренировался, ты можешь принести мне здоровую закуску?» подтолкнет его к получению яблока. «PaLM-SayCan [является] интерпретируемым и общим подходом к использованию знаний из языковых моделей, который позволяет роботу следовать текстовым инструкциям высокого уровня для выполнения физически обоснованных задач», — ученые-исследователи из команды Google Brain. объяснены.

Google представила свою самую большую языковую модель Пальма в апреле этого года. PaLM обучался на данных, взятых из Интернета, но вместо того, чтобы выдавать открытые текстовые ответы, система была адаптирована для создания списка инструкций, которым должен следовать робот.

Сказав: «Я пролил свою кока-колу на стол, как бы вы выбросили ее и принесли мне что-нибудь, чтобы помочь убрать?», PaLM побуждает понять вопрос и составить список шагов, которые робот может выполнить, чтобы выполнить задачу, например, пройтись по подобрать банку, бросить ее в мусорное ведро и получить губку.

Однако большие языковые модели (LLM), такие как PaLM, не понимают значения того, что они говорят. По этой причине исследователи обучили отдельную модель, используя обучение с подкреплением, чтобы преобразовать абстрактный язык в визуальные представления и действия. Таким образом, робот научится ассоциировать слово «Кока-кола» с изображением банки с газированным напитком.

PaLM-SayCan также изучает так называемые «функции возможности» — метод, который оценивает возможность выполнения определенного действия с учетом объектов в окружающей среде. Например, робот с большей вероятностью подберет губку, чем пылесос, если он обнаружит губку, но рядом с ней нет пылесоса. 

«Наш метод, SayCan, извлекает и использует знания LLM в физически обоснованных задачах», — объяснила команда в отчете. статья про исследование . «LLM (Say) обеспечивает основу для задачи, чтобы определить полезные действия для достижения цели высокого уровня, а изученные функции доступности (Can) обеспечивают основу для мира, чтобы определить, что можно выполнить в соответствии с планом. Мы используем обучение с подкреплением (RL) как способ изучения языковых условных функций ценности, которые обеспечивают доступность того, что возможно в мире».

Чтобы робот не отвлекался от задачи, его обучают выбирать действия только из 101 различных инструкций. Google научил его адаптироваться к кухне — PaLM-SayCan может доставлять закуски, напитки и выполнять простые задачи по уборке. Исследователи считают, что LLM — это первый шаг к тому, чтобы заставить роботов безопасно выполнять более сложные задачи с помощью абстрактных инструкций.

«Наши эксперименты над рядом реальных роботизированных задач демонстрируют способность планировать и выполнять долгосрочные абстрактные инструкции на естественном языке с высокой степенью успеха. Мы считаем, что интерпретируемость PaLM-SayCan обеспечивает безопасное взаимодействие пользователей с роботами в реальном мире», — заключили они. ®

Отметка времени:

Больше от Регистр