Aktywna nauka chwytania za pomocą wielu palców

Opublikowane ponownie przez Plato

Obserwuje: 0

Jest to przegląd artykułu akademickiego z 2020 roku na temat używania systemów uczenia się do trenowania robotycznych ramion i rąk do chwytania przedmiotów.

Podejścia do planowania chwytania oparte na uczeniu są preferowane nad metodami analitycznymi ze względu na ich zdolność do lepszego uogólniania na nowe, częściowo obserwowane obiekty. Jednak gromadzenie danych pozostaje jednym z największych wąskich gardeł dla metod uczenia się chwytania, szczególnie w przypadku rąk wielopalcowych. Stosunkowo duża przestrzeń konfiguracyjna rąk w połączeniu z różnorodnością obiektów powszechnych w codziennym życiu wymaga znacznej liczby próbek, aby stworzyć solidne i pewne klasyfikatory sukcesu. W tym artykule badacze przedstawiają pierwsze aktywne podejście do uczenia głębokiego do chwytania, które w ujednolicony sposób przeszukuje przestrzeń konfiguracji chwytania i pewność klasyfikatora. Naukowcy opierają swoje podejście na niedawnym sukcesie w planowaniu wielopalcowych uchwytów jako wnioskowania probabilistycznego z wyuczoną funkcją wiarygodności sieci neuronowej. Umieszczają to w wielorękim bandyckim sformułowaniu doboru próbek. Pokazują, że ich aktywne podejście do uczenia się chwytania wykorzystuje mniej próbek treningowych, aby uzyskać wskaźniki powodzenia chwytania porównywalne z pasywną metodą nadzorowanego uczenia się wytrenowaną z wykorzystaniem danych chwytania generowanych przez planistę analitycznego. W 2020 roku naukowcy dodatkowo pokazują, że chwytanie generowane przez aktywnego ucznia ma większą różnorodność jakościową i ilościową w kształcie.

Arxiv – wielopalcowe aktywne uczenie się chwytania

Planowanie chwytania oparte na uczeniu się stało się popularne w ciągu ostatniej dekady, ze względu na jego zdolność do dobrego uogólniania na nowe obiekty z jedynie częściową informacją o obiekcie. Podejścia te wymagają dużych ilości danych do uczenia, zwłaszcza tych, które wykorzystują głębokie sieci neuronowe. Jednak gromadzenie danych na dużą skalę pozostaje wyzwaniem dla chwytania wielopalcowego, ponieważ (1)
przedmioty powszechne w życiu codziennym wykazują duże zróżnicowanie pod względem geometrii, tekstury, właściwości bezwładności i wyglądu; oraz
(2) stosunkowo wysoki wymiar konfiguracji wielopalcowych uchwytów (np. 22 wymiary dla konfiguracji
rękę i nadgarstek w tym artykule).

Nowsze podejścia do aktywnego uczenia się interaktywnie uczą modelu chwytania, który lepiej pokrywa przestrzeń konfiguracji chwytania w różnych obiektach przy użyciu mniejszej liczby próbek w porównaniu z biernym, nadzorowanym uczniem chwytania. Zamiast biernego stawiania hipotez w celu wyjaśnienia dostępnych danych treningowych, jak w standardowym uczeniu nadzorowanym, aktywne uczenie się rozwija i testuje nowe hipotezy w sposób ciągły i interaktywny.

Aktywne uczenie jest najbardziej odpowiednie, gdy 1) nieoznakowane próbki danych są liczne, 2) wiele oznakowanych danych jest potrzebnych do wytrenowania dokładnego nadzorowanego systemu uczenia oraz 3) próbki danych można łatwo zebrać lub zsyntetyzować. Grasp learning spełnia każdy z tych warunków: 1) istnieje nieskończenie wiele możliwych chwytów, 2) duża liczba oznaczonych próbek treningowych jest potrzebna, aby pokryć przestrzeń, oraz 3) robot jest własną wyrocznią — może spróbować chwytów i automatycznie wykrywanie sukcesu lub porażki bez etykietowania przez człowieka.

Tesla ma już autoetykietowanie obiektów w świecie fizycznym.

Brian Wang jest liderem myśli futurystycznej i popularnym blogerem naukowym z milionem czytelników miesięcznie. Jego blog Nextbigfuture.com zajmuje pierwsze miejsce w rankingu Science News Blog. Obejmuje wiele przełomowych technologii i trendów, w tym przestrzeń kosmiczną, robotykę, sztuczną inteligencję, medycynę, biotechnologię przeciwstarzeniową i nanotechnologię.

Znany z identyfikowania najnowocześniejszych technologii, obecnie jest współzałożycielem startupu i fundraiserem dla firm o wysokim potencjale we wczesnej fazie rozwoju. Pełni funkcję Szefa Działu Badań Alokacji dla inwestycji w głębokie technologie oraz Anioła Inwestora w Space Angels.

Częsty mówca w korporacjach, mówca TEDx, mówca Singularity University i gościnnie w licznych wywiadach dla radia i podcastów. Jest otwarty na wystąpienia publiczne i doradzanie.

Znak czasu: 6 września 2022 r.7 września 2022 r.