Actief leren met meerdere vingers

Heruitgegeven door Plato

volgers: 0

Dit is een recensie van een academisch artikel uit 2020 over het gebruik van leersystemen om robotarmen en -handen te trainen om objecten vast te pakken.

Op leren gebaseerde benaderingen om planning te begrijpen hebben de voorkeur boven analytische methoden vanwege hun vermogen om beter te generaliseren naar nieuwe, gedeeltelijk waargenomen objecten. Het verzamelen van gegevens blijft echter een van de grootste knelpunten voor grijpleermethoden, met name voor handen met meerdere vingers. De relatief hoge dimensionale configuratieruimte van de handen in combinatie met de diversiteit van objecten die in het dagelijks leven veel voorkomen, vereist een aanzienlijk aantal monsters om robuuste en zelfverzekerde classificaties van grijpsucces te produceren. In dit artikel presenteren onderzoekers de eerste actieve deep learning-benadering van begrijpen die op een uniforme manier de grijpconfiguratieruimte en het vertrouwen van de classificatie doorzoekt. Onderzoekers baseren hun benadering op recent succes bij het plannen van multi-fingered grepen als probabilistische gevolgtrekking met een aangeleerde waarschijnlijkheidsfunctie van een neuraal netwerk. Ze verankeren dit in een meerarmige bandietenformulering van monsterselectie. Ze laten zien dat hun benadering van actief begrijpend leren minder trainingsvoorbeelden gebruikt om grijpsuccespercentages te produceren die vergelijkbaar zijn met de passieve leermethode onder toezicht die is getraind met grijpgegevens die zijn gegenereerd door een analytische planner. In 2020 laten onderzoekers bovendien zien dat grepen die door de actieve leerling worden gegenereerd, een grotere kwalitatieve en kwantitatieve diversiteit van vorm hebben.

Arxiv - Actief leren met meerdere vingers

Op leren gebaseerde grijpplanning is het afgelopen decennium populair geworden vanwege het vermogen om goed te generaliseren naar nieuwe objecten met slechts gedeeltelijke objectinformatie. Deze benaderingen vereisen grote hoeveelheden gegevens voor training, met name die waarbij diepe neurale netwerken worden gebruikt. Grootschalige gegevensverzameling blijft echter een uitdaging voor grijpen met meerdere vingers, omdat (1)
objecten die in het dagelijks leven veel voorkomen, vertonen een grote variatie in geometrie, textuur, traagheidseigenschappen en uiterlijk; en
(2) de relatief hoge dimensie van meervingerige grijpconfiguraties (bijv. 22 dimensies voor de configuratie van
hand- en polshouding in dit artikel).

Nieuwere actieve leerbenaderingen leren interactief een grijpmodel dat de grijpconfiguratieruimte over verschillende objecten beter dekt met minder monsters in vergelijking met een passieve, begeleide grijpleerling. In plaats van passief een hypothese te induceren om de beschikbare trainingsgegevens te verklaren, zoals bij standaard gesuperviseerd leren, ontwikkelt en test actief leren continu en interactief nieuwe hypothesen.

Actief leren is het meest geschikt wanneer 1) niet-gelabelde gegevensmonsters talrijk zijn, 2) veel gelabelde gegevens nodig zijn om een nauwkeurig begeleid leersysteem te trainen en 3) gegevensmonsters gemakkelijk kunnen worden verzameld of gesynthetiseerd. Grijpleren voldoet aan elk van deze voorwaarden: 1) er zijn oneindig veel mogelijke grepen, 2) een groot aantal gelabelde trainingsvoorbeelden zijn nodig om de ruimte te dekken, en 3) de robot is zijn eigen orakel - hij kan grepen proberen en automatisch het detecteren van succes of falen zonder menselijke etikettering.

Tesla heeft al autolabelling van objecten in de fysieke wereld.

Brian Wang is een Futurist Thought Leader en een populaire wetenschapsblogger met 1 miljoen lezers per maand. Zijn blog Nextbigfuture.com is gerangschikt #1 Science News Blog. Het behandelt veel disruptieve technologie en trends, waaronder ruimtevaart, robotica, kunstmatige intelligentie, medicijnen, anti-verouderingsbiotechnologie en nanotechnologie.

Hij staat bekend om het identificeren van geavanceerde technologieën en is momenteel mede-oprichter van een startup en fondsenwerver voor bedrijven met een hoog potentieel in een vroeg stadium. Hij is het hoofd van Research for Allocations voor diepe technologie-investeringen en een Angel Investor bij Space Angels.

Hij is een veelgevraagd spreker bij bedrijven, hij is een TEDx-spreker, een Singularity University-spreker en gast bij talloze interviews voor radio en podcasts. Hij staat open voor spreek- en adviesopdrachten.

Tijdstempel: 6 september 20227 september 2022