Навчання активному захопленню кількома пальцями

Перевидано Платоном

читають: 0

Це огляд академічної статті 2020 року про використання систем навчання для тренування роботизованих рук і кистей хапати предмети.

Підходам до планування захоплення, що ґрунтуються на навчанні, віддають перевагу над аналітичними методами через їх здатність краще узагальнювати нові, частково спостережувані об’єкти. Однак збір даних залишається одним із найбільших вузьких місць для методів навчання хвату, особливо для рук з кількома пальцями. Відносно великий конфігураційний простір рук у поєднанні з різноманітністю об’єктів, поширених у повсякденному житті, вимагає значної кількості зразків для створення надійних і впевнених класифікаторів успішного захоплення. У цій статті дослідники представляють перший підхід активного глибокого навчання до захоплення, який уніфіковано здійснює пошук у просторі конфігурації захоплення та достовірності класифікатора. Дослідники ґрунтують свій підхід на нещодавньому успіху в плануванні захоплень кількома пальцями як імовірнісного висновку за допомогою навченої функції правдоподібності нейронної мережі. Вони вбудовують це в формулювання вибірки багаторуких бандитів. Вони показують, що їхній підхід до навчання з активним захопленням використовує меншу кількість тренувальних зразків для отримання показників успішності розуміння, порівнянних з пасивним методом навчання під наглядом, який навчається за допомогою даних розуміння, згенерованих аналітичним планувальником. У 2020 році дослідники також показали, що хватки, створені активним учнем, мають більшу якісну та кількісну різноманітність у формі.

Arxiv – навчання активному захопленню кількома пальцями

Планування захоплення, засноване на навчанні, стало популярним протягом останнього десятиліття завдяки його здатності добре узагальнювати нові об’єкти лише з частковою інформацією про об’єкти. Ці підходи вимагають великих обсягів даних для навчання, особливо тих, які використовують глибокі нейронні мережі. Проте збір великомасштабних даних залишається проблемою для захоплення кількома пальцями, оскільки (1)
об'єкти, звичайні в повсякденному житті, демонструють великі варіації з точки зору геометрії, текстури, інерційних властивостей і зовнішнього вигляду; і
(2) відносно великий розмір багатопальцевих конфігурацій захоплення (наприклад, 22 розміри для конфігурації
положення руки та зап’ястя в цьому документі).

Новіші підходи до активного навчання інтерактивно вивчають модель захоплення, яка краще охоплює простір конфігурації захоплення в різних об’єктах, використовуючи менше зразків порівняно з пасивним учнем із контрольованим захопленням. Замість пасивного висування гіпотези для пояснення наявних навчальних даних, як у стандартному керованому навчанні, активне навчання розробляє та перевіряє нові гіпотези постійно та в інтерактивному режимі.

Активне навчання є найбільш доцільним, коли 1) непозначених зразків даних багато, 2) багато позначених даних необхідно для навчання точної контрольованої системи навчання, і 3) зразки даних можна легко зібрати або синтезувати. Навчання захопленню задовольняє кожну з цих умов: 1) існує нескінченна кількість можливих захоплень, 2) велика кількість позначених навчальних зразків необхідна для покриття простору, і 3) робот є власним оракулом — він може спробувати захоплення й автоматично виявлення успіху чи невдачі без маркування людиною.

У Tesla вже є автоматичне маркування об’єктів у фізичному світі.

Брайан Ванг - лідер думок футуристів та популярний науковий блогер із 1 мільйоном читачів на місяць. Його блог Nextbigfuture.com посідає перше місце у блозі «Наукові новини». Він охоплює багато руйнівних технологій та тенденцій, включаючи космос, робототехніку, штучний інтелект, медицину, біотехнології проти старіння та нанотехнології.

Відомий тим, що визначає передові технології, в даний час він є співзасновником стартапу та збирання коштів для потенційних компаній на ранніх етапах. Він є керівником досліджень з питань розподілу інвестицій у глибокі технології та інвестором -ангелом у Space Angels.

Частий доповідач у корпораціях, він був спікером TEDx, спікером Університету Сингулярності та гостем у численних інтерв'ю для радіо та подкастів. Він відкритий для публічних виступів та консультування.

Часова мітка: Вересень 6, 2022Вересень 7, 2022