Google leert robots om mensen te dienen - met grote taalmodellen de belangrijkste PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Google leert robots om mensen te dienen - met grote taalmodellen de sleutel

Video Het grootste AI-taalmodel van Google helpt robots om flexibeler te zijn in het begrijpen en interpreteren van menselijke commando's, volgens het laatste onderzoek van de webgigant.

Machines reageren doorgaans het beste op zeer specifieke eisen - verzoeken met een open einde kunnen ze soms afwijzen en leiden tot resultaten die gebruikers niet in gedachten hadden. Mensen leren op een rigide manier met robots om te gaan, bijvoorbeeld door op een bepaalde manier vragen te stellen om het gewenste antwoord te krijgen.

Het nieuwste systeem van Google, PaLM-SayCan genaamd, belooft echter slimmer te worden. Het fysieke apparaat van Everyday Robots - een startup die voortkomt uit Google X - heeft camera's voor ogen in zijn hoofd en een arm met een tang verscholen achter zijn lange rechte lichaam, dat bovenop een set wielen zit.  

Je kunt de robot in actie zien in de onderstaande video:

Youtube Video

De robot vragen, zoiets als "Ik heb net getraind, kun je een gezonde snack voor me halen?" zal het aansporen om een ​​appel te halen. "PaLM-SayCan [is] een interpreteerbare en algemene benadering om kennis uit taalmodellen te benutten waarmee een robot tekstuele instructies op hoog niveau kan volgen om fysiek gegronde taken uit te voeren", onderzoekers van het Brain-team van Google uitgelegd.

Google introduceerde zijn grootste taalmodel Palm in april dit jaar. PaLM werd getraind op gegevens die van internet waren geschraapt, maar in plaats van open tekstreacties te spuwen, werd het systeem aangepast om een ​​lijst met instructies te genereren die de robot moest volgen.

Door te zeggen: "Ik heb mijn cola op tafel gemorst, hoe zou je het weggooien en me iets brengen om te helpen schoonmaken?", vraagt ​​PaLM om de vraag te begrijpen en een lijst met stappen te genereren die de robot kan volgen om de taak te voltooien, zoals om het blikje op te rapen, het in een prullenbak te gooien en een spons te pakken.

Grote taalmodellen (LLM's) zoals PaLM begrijpen echter niet de betekenis van wat ze zeggen. Om deze reden hebben de onderzoekers een apart model getraind met behulp van versterkingsleren om abstracte taal te aarden in visuele representaties en acties. Zo leert de robot het woord cola te associëren met een afbeelding van een blikje frisdrank.

PaLM-SayCan leert ook zogenaamde "affordance-functies" - een methode die de mogelijkheid beoordeelt om een ​​specifieke actie te voltooien, gegeven objecten in zijn omgeving. De robot zal eerder een spons oppakken dan een stofzuiger, bijvoorbeeld als hij een spons detecteert maar er geen stofzuiger in de buurt is. 

"Onze methode, SayCan, extraheert en benut de kennis binnen LLM's in fysiek gegronde taken", legde het team uit in een research paper. “De LLM (Say) biedt een taakbasis om bruikbare acties voor een doel op hoog niveau te bepalen en de aangeleerde functies (Can) bieden een wereldbasis om te bepalen wat mogelijk is om het plan uit te voeren. We gebruiken bekrachtigingsleren (RL) als een manier om taalgeconditioneerde waardefuncties te leren die de mogelijkheden bieden van wat er in de wereld mogelijk is.”

Om te voorkomen dat de robot van zijn taak afwijkt, is hij getraind om acties uit slechts 101 verschillende instructies te selecteren. Google heeft het getraind om zich aan te passen aan een keuken - PaLM-SayCan kan snacks en drankjes krijgen en eenvoudige schoonmaaktaken uitvoeren. De onderzoekers zijn van mening dat LLM's de eerste stap zijn om robots complexere taken veilig te laten uitvoeren, gegeven abstracte instructies.

"Onze experimenten met een aantal echte robottaken tonen het vermogen aan om lange-horizon, abstracte, natuurlijke taalinstructies te plannen en te voltooien met een hoog slagingspercentage. We zijn van mening dat de interpreteerbaarheid van PaLM-SayCan een veilige, echte gebruikersinteractie met robots mogelijk maakt”, concludeerden ze. ®

Tijdstempel:

Meer van Het register