Aktiv grepslæring med flere fingre

bilde

Dette er en gjennomgang av en akademisk artikkel fra 2020 om bruk av læringssystemer for å trene robotikkarmer og hender til å gripe gjenstander.

Læringsbaserte tilnærminger til gripeplanlegging foretrekkes fremfor analytiske metoder på grunn av deres evne til bedre å generalisere til nye, delvis observerte objekter. Datainnsamling er imidlertid fortsatt en av de største flaskehalsene for å forstå læringsmetoder, spesielt for hender med flere fingre. Det relativt høye dimensjonale konfigurasjonsrommet til hendene kombinert med mangfoldet av gjenstander som er vanlige i dagliglivet, krever et betydelig antall prøver for å produsere robuste og trygge suksessklassifiserere. I denne artikkelen presenterer forskerne den første aktive dyplæringstilnærmingen til griping som søker over gripekonfigurasjonsrommet og klassifiseringssikkerheten på en enhetlig måte. Forskere baserer sin tilnærming på nylig suksess med å planlegge flerfingrede grep som sannsynlighetsslutning med en innlært nevrale nettverks sannsynlighetsfunksjon. De legger dette inn i en flerarmet bandittformulering av prøveutvalg. De viser at deres aktive grepslæringstilnærming bruker færre treningsprøver for å produsere grepsuksessrater som kan sammenlignes med den passive overvåkede læringsmetoden trent med gripedata generert av en analytisk planlegger. I 2020 viser forskere i tillegg at grep generert av den aktive eleven har større kvalitativt og kvantitativt mangfold i form.

Arxiv – Multi-Fingered Active Grasp Learning

Læringsbasert grepsplanlegging har blitt populært det siste tiåret, på grunn av dens evne til å generalisere godt til nye objekter med kun delvis visning objektinformasjon. Disse tilnærmingene krever store mengder data for trening, spesielt de som bruker dype nevrale nettverk. Imidlertid er datainnsamling i stor skala fortsatt en utfordring for griping med flere fingre, fordi (1)
gjenstander som er vanlige i dagliglivet, viser stor variasjon når det gjelder geometri, tekstur, treghetsegenskaper og utseende; og
(2) den relativt høye dimensjonen til flerfingrede grepkonfigurasjoner, (f.eks. 22 dimensjoner for konfigurasjonen av
hånd- og håndleddpositur i denne artikkelen).

Nyere tilnærminger til aktiv læring lærer interaktivt en gripemodell som bedre dekker gripekonfigurasjonsrommet på tvers av forskjellige objekter ved å bruke færre prøver sammenlignet med en passiv, overvåket gripelever. I stedet for passivt å indusere en hypotese for å forklare de tilgjengelige treningsdataene som i standard veiledet læring, utvikler og tester aktiv læring nye hypoteser kontinuerlig og interaktivt.

Aktiv læring er mest hensiktsmessig når 1) umerkede dataprøver er mange, 2) mye merkede data er nødvendig for å trene opp et nøyaktig overvåket læringssystem, og 3) dataprøver enkelt kan samles inn eller syntetiseres. Griplæring tilfredsstiller hver av disse betingelsene: 1) det er uendelig mange mulige grep, 2) et stort antall merkede treningsprøver er nødvendige for å dekke plassen, og 3) roboten er sitt eget orakel – den kan prøve grep og automatisk oppdage suksess eller fiasko uten menneskelig merking.

Tesla har allerede automerking av objekter i den fysiske verden.

Brian Wang er en futuristisk tankeleder og en populær vitenskapsblogger med 1 million lesere per måned. Bloggen hans Nextbigfuture.com er rangert som #1 Science News Blog. Den dekker mange forstyrrende teknologi og trender, inkludert rom, robotikk, kunstig intelligens, medisin, anti-aging bioteknologi og nanoteknologi.

Han er kjent for å identifisere banebrytende teknologier, og er for tiden en av grunnleggerne av en oppstart og innsamling for høy potensielle selskaper i et tidlig stadium. Han er forskningssjef for allokasjoner for dype teknologiinvesteringer og en engelinvestor hos Space Angels.

Han er en hyppig foredragsholder i selskaper, og har vært TEDx -foredragsholder, høyttaler på Singularity University og gjest på mange intervjuer for radio og podcaster. Han er åpen for offentlige foredrag og rådgivning.

Tidstempel:

Mer fra Neste Big Futures