Robothender kan matche menneskers behendighet med nye AI Smarts, hevder Nvidia - Dekrypter

Robothender kan matche menneskers behendighet med nye AI Smarts, hevder Nvidia – Dekrypter

Robothender kan matche menneskers behendighet med nye AI Smarts, hevder Nvidia - Dekrypter PlatoBlockchain Data Intelligence. Vertikalt søk. Ai.

Nvidia-forskere har oppnådd et stort sprang i robotbehendighet takket være Eureka, en AI-agent som angivelig kan lære roboter komplekse ferdigheter som pennespinnende triks like dyktig som mennesker.

Den nye teknikken, skissert i en artikkel publisert torsdag, bygger på nyere fremskritt innen store språkmodeller som f.eks OpenAIs GPT-4. Eureka utnytter generativ AI for autonomt å skrive sofistikerte belønningsalgoritmer som gjør det mulig for roboter å lære via forsterkende læring prøv og feil. Denne tilnærmingen har vist seg over 50 % mer effektiv enn programmer som er skrevet av mennesker, skisserer papiret.

"Eureka har også lært firbeinte, behendige hender, cobot-armer og andre roboter å åpne skuffer, bruke saks, fange baller og nesten 30 forskjellige oppgaver," heter det i et offisielt blogginnlegg av Nvidia. 

Eureka er den siste demonstrasjonen av Nvidias banebrytende arbeid med å styre AI med språkmodeller. Nylig har selskapet åpen kildekode SteerLM—en metode som justerer AI-assistenter for å være mer nyttige ved å trene dem på menneskelig tilbakemelding.

I likhet med Eureka, bruker SteerLM også fremskritt innen språkmodeller, men fokuserer dem på en annen utfordring – å forbedre AI-assistentinnrettingen. SteerLM trener assistenter ved å la dem øve på samtaler, som en robot som lærer ved å gjøre. Systemet gir tilbakemelding på assistentens svar gjennom attributter som hjelpsomhet, humor og kvalitet.

For eksempel er det som en robot som lærer å danse fra videoer merket som bra eller dårlige, i stedet for å ha en menneskelig vurdering av tusenvis av tilfeldige danser og velge hvilke som er gode eller ikke (som er den typiske måten AI chatbots er trent). Ved å øve gjentatte ganger og få tilbakemelding, lærer assistentene å gi svar tilpasset brukerens behov. Dette bidrar til å gjøre AI mer fordelaktig for virkelige applikasjoner.

Den røde tråden er bruken av avanserte nevrale nettverk på kreative nye måter, enten det er undervisningsroboter eller chatbots. Nvidia flytter grensene både på maskinvare- og programvarefronter.

For Eureka var nøkkelen å kombinere simuleringsteknologier som de fra Isaac Gym med mønstergjenkjenningsevnen til språkmodeller. Eureka «lærer å lære» effektivt, og optimaliserer sine egne belønningsalgoritmer over flere treningsløp. Den aksepterer til og med menneskelige innspill for å avgrense belønningene.

Denne selvforbedrende tilnærmingen har vist seg å være svært generaliserbar så langt, og trener roboter av alle slag—beint, hjul, flygende og fingernem hender.

Nvidias Eureka og SteerLM bryter ikke bare barrierer, de lærer roboter og AI kunsten å finesse og innsiktsfull interaksjon. Med hvert pennespinn og vittig prat, skisserer de en fremtid der AI ikke bare etterligner, men innoverer sammen med oss.

Hold deg oppdatert på kryptonyheter, få daglige oppdateringer i innboksen din.

Tidstempel:

Mer fra dekryptere