Robothanden kunnen de behendigheid van mensen evenaren met nieuwe AI Smarts, beweert Nvidia - Decrypt

Robothanden kunnen de behendigheid van mensen evenaren met nieuwe AI Smarts, beweert Nvidia – Decrypt

Robothanden kunnen de behendigheid van mensen evenaren met nieuwe AI Smarts, beweert Nvidia - Decrypt PlatoBlockchain Data Intelligence. Verticaal zoeken. Ai.

Nvidia-onderzoekers hebben dankzij Nvidia een grote sprong voorwaarts gemaakt op het gebied van robotbehendigheid Eureka, een AI-agent die naar verluidt bots complexe vaardigheden zoals pen-spintrucs kan leren, net zo handig als mensen.

De nieuwe techniek, beschreven in een donderdag gepubliceerd artikel, bouwt voort op recente ontwikkelingen in grote taalmodellen zoals OpenAI's GPT-4. Eureka maakt gebruik van generatieve AI om autonoom geavanceerde beloningsalgoritmen te schrijven waarmee robots kunnen leren via proefondervindelijk versterkend leren. Deze aanpak is meer dan 50% effectiever gebleken dan door mensen geschreven programma's, zo schetst het artikel.

“Eureka heeft ook viervoeters, behendige handen, cobotarmen en andere robots geleerd lades te openen, een schaar te gebruiken, ballen te vangen en bijna 30 verschillende taken uit te voeren”, zegt een officiële blogpost van Nvidia. 

Eureka is de nieuwste demonstratie van Nvidia's baanbrekende werk bij het aansturen van AI met taalmodellen. Onlangs heeft het bedrijf open source gemaakt StuurLM– een methode die AI-assistenten op één lijn brengt om behulpzamer te zijn door ze te trainen in menselijke feedback.

Net als Eureka maakt SteerLM ook gebruik van de vooruitgang in taalmodellen, maar richt deze zich op een andere uitdaging: het verbeteren van de afstemming van AI-assistenten. SteerLM traint assistenten door ze gesprekken te laten oefenen, zoals een robot leert door te doen. Het systeem geeft feedback op de reacties van de assistent via eigenschappen als behulpzaamheid, humor en kwaliteit.

Het is bijvoorbeeld als een robot die leert dansen op basis van video's die als goed of slecht zijn bestempeld, in plaats van een mens duizenden willekeurige dansen te laten beoordelen en te selecteren welke goed of niet goed zijn (wat de manier is waarop je normaal gesproken AI-chatbots zijn getrained). Door herhaaldelijk te oefenen en feedback te krijgen, leren de assistenten antwoorden te geven die zijn afgestemd op de behoeften van de gebruiker. Dit helpt AI voordeliger te maken voor toepassingen in de echte wereld.

De rode draad is het gebruik van geavanceerde neurale netwerken op creatieve nieuwe manieren, of het nu gaat om het onderwijzen van robots of chatbots. Nvidia verlegt de grenzen op zowel hardware- als softwarefront.

Voor Eureka was de sleutel het combineren van simulatietechnologieën zoals die van Isaak sportschool met de patroonherkenningskracht van taalmodellen. Eureka ‘leert effectief leren’ en optimaliseert zijn eigen beloningsalgoritmen gedurende meerdere trainingsruns. Het accepteert zelfs menselijke inbreng om zijn beloningen te verfijnen.

Deze zelfverbeteringsaanpak is tot nu toe zeer generaliseerbaar gebleken, waarbij allerlei soorten robots worden getraind: poten, wielen, vliegende en behendige handen.

Nvidia's Eureka en SteerLM doorbreken niet alleen barrières, ze leren robots en AI de kunst van finesse en inzichtelijke interactie. Met elke draai van een pen en grappige praatjes schetsen ze een toekomst waarin AI niet alleen nabootst, maar samen met ons innoveert.

Blijf op de hoogte van cryptonieuws, ontvang dagelijkse updates in je inbox.

Tijdstempel:

Meer van decoderen