Google учит роботов служить людям — ключ к успеху

Переиздано Платоном

Читают: 0

Видео Согласно последнему исследованию веб-гиганта, крупнейшая языковая модель искусственного интеллекта Google помогает роботам быть более гибкими в понимании и интерпретации человеческих команд.

Машины, как правило, лучше всего реагируют на очень специфические требования — открытые запросы иногда могут сбивать их с толку и приводить к результатам, которые пользователи не имели в виду. Люди учатся взаимодействовать с роботами жестким образом, например, задавать вопросы определенным образом, чтобы получить желаемый ответ.

Однако последняя система Google, получившая название PaLM-SayCan, обещает быть умнее. Физическое устройство от Everyday Robots — стартапа, созданного из Google X — имеет камеры вместо глаз в голове и руку с клешнями, спрятанную за длинным прямым телом, которое находится на колесиках.

Посмотреть робота в действии можно на видео ниже:

Youtube Video

Спрашивая робота, что-то вроде: «Я только что потренировался, ты можешь принести мне здоровую закуску?» подтолкнет его к получению яблока. «PaLM-SayCan [является] интерпретируемым и общим подходом к использованию знаний из языковых моделей, который позволяет роботу следовать текстовым инструкциям высокого уровня для выполнения физически обоснованных задач», — ученые-исследователи из команды Google Brain. объяснены.

Google представила свою самую большую языковую модель Пальма в апреле этого года. PaLM обучался на данных, взятых из Интернета, но вместо того, чтобы выдавать открытые текстовые ответы, система была адаптирована для создания списка инструкций, которым должен следовать робот.

Сказав: «Я пролил свою кока-колу на стол, как бы вы выбросили ее и принесли мне что-нибудь, чтобы помочь убрать?», PaLM побуждает понять вопрос и составить список шагов, которые робот может выполнить, чтобы выполнить задачу, например, пройтись по подобрать банку, бросить ее в мусорное ведро и получить губку.

Однако большие языковые модели (LLM), такие как PaLM, не понимают значения того, что они говорят. По этой причине исследователи обучили отдельную модель, используя обучение с подкреплением, чтобы преобразовать абстрактный язык в визуальные представления и действия. Таким образом, робот научится ассоциировать слово «Кока-кола» с изображением банки с газированным напитком.

PaLM-SayCan также изучает так называемые «функции возможности» — метод, который оценивает возможность выполнения определенного действия с учетом объектов в окружающей среде. Например, робот с большей вероятностью подберет губку, чем пылесос, если он обнаружит губку, но рядом с ней нет пылесоса.

«Наш метод, SayCan, извлекает и использует знания LLM в физически обоснованных задачах», — объяснила команда в отчете. статья про исследование . «LLM (Say) обеспечивает основу для задачи, чтобы определить полезные действия для достижения цели высокого уровня, а изученные функции доступности (Can) обеспечивают основу для мира, чтобы определить, что можно выполнить в соответствии с планом. Мы используем обучение с подкреплением (RL) как способ изучения языковых условных функций ценности, которые обеспечивают доступность того, что возможно в мире».

Чтобы робот не отвлекался от задачи, его обучают выбирать действия только из 101 различных инструкций. Google научил его адаптироваться к кухне — PaLM-SayCan может доставлять закуски, напитки и выполнять простые задачи по уборке. Исследователи считают, что LLM — это первый шаг к тому, чтобы заставить роботов безопасно выполнять более сложные задачи с помощью абстрактных инструкций.

«Наши эксперименты над рядом реальных роботизированных задач демонстрируют способность планировать и выполнять долгосрочные абстрактные инструкции на естественном языке с высокой степенью успеха. Мы считаем, что интерпретируемость PaLM-SayCan обеспечивает безопасное взаимодействие пользователей с роботами в реальном мире», — заключили они. ®

Отметка времени: 18 августа 202218 августа 2022

Отметка времени: Август 31, 2023

Google учит роботов служить людям — ключом к успеху являются большие языковые модели

Переиздано Платоном

Больше от Регистр

Вдохновленные мозгом чипы обещают сверхэффективный ИИ, так почему же они не везде?

Конгресс заявил, что компании, занимающиеся искусственным интеллектом, должны платить за контент, защищенный авторским правом

Индия ищет искусственную мудрость и планирует создать цифровой двойник в масштабе города

Улыбка! Британские полицейские считают, что они сгладили гремлинов с помощью распознавания лиц в реальном времени

Adobe взмахивает палочкой искусственного интеллекта и волшебным образом повышает цены

Waymo превращает беспилотные автомобили в передвижные метеостанции

Генеративный ИИ вышел из-под контроля: «Ничего, навсегда» — пародия Сайнфельда ни о чем… навсегда

Аналитический центр предупреждает, что Северная Корея использует облака для боевого искусственного интеллекта

Разработчик Doom Джон Кармак считает, что AGI может дебютировать в 2030 году

ИИ побеждает людей в гонках дронов от первого лица

О Нас

Вертикальный поиск и AI

Платформа

Оставайтесь на связи

Учетная запись