Az Nvidia kutatói nagy ugrást értek el a robotok ügyességében, köszönhetően Eureka, egy mesterséges intelligencia-ügynök, amely állítólag olyan ügyesen képes megtanítani a robotokat olyan összetett készségekre, mint például a tollforgató trükkök, mint az emberek.
Az új technika, amelyet egy csütörtökön megjelent cikkben vázoltak fel, olyan nagy nyelvi modellek közelmúltbeli fejlődésére épít, mint pl OpenAI GPT-4. Az Eureka a generatív mesterséges intelligencia segítségével önállóan ír kifinomult jutalmazási algoritmusokat, amelyek lehetővé teszik a robotok számára, hogy a próba és hiba megerősítő tanuláson keresztül tanuljanak. Ez a megközelítés több mint 50%-kal hatékonyabbnak bizonyult, mint az ember által írt programok – vázolja a papír.
„Az Eureka négylábú, ügyes kezeket, kobotkarokat és más robotokat is megtanított fiókok kinyitására, olló használatára, labdafogásra és közel 30 különböző feladatra” – áll az Nvidia hivatalos blogbejegyzésében.
Az Eureka az Nvidia úttörő munkájának legújabb bemutatója a mesterséges intelligencia nyelvi modellekkel történő irányításában. A közelmúltban a vállalat nyílt forráskódú SteerLM– egy olyan módszer, amely az AI-asszisztenseket segítőkészebbé teszi azáltal, hogy az emberi visszajelzésekre tanítja őket.
Az Eurekához hasonlóan a SteerLM is hasznosítja a nyelvi modellek fejlesztéseit, de egy másik kihívásra összpontosítja őket: az AI-asszisztensek összehangolásának javítására. A SteerLM úgy képezi ki az asszisztenseket, hogy gyakorolják a beszélgetést, mint egy robot, amely cselekvéssel tanul. A rendszer visszajelzést ad az asszisztens válaszairól olyan tulajdonságokon keresztül, mint a segítőkészség, a humor és a minőség.
Például ez olyan, mint egy robot, aki a jónak vagy rossznak címkézett videókból tanul táncolni, ahelyett, hogy az ember átnézne több ezer véletlenszerű táncot, és kiválasztaná, melyik jó vagy nem (ez a tipikus módja AI csevegőrobotok képzettek). Az asszisztensek többszöri gyakorlással és visszajelzések megszerzésével megtanulják, hogy a felhasználó igényeire szabott válaszokat adjanak. Ez segít abban, hogy az AI még előnyösebb legyen a valós alkalmazások számára.
A közös szál a fejlett neurális hálózatok kreatív, új módokon való felhasználása, legyen szó robotok vagy chatbotok tanításáról. Az Nvidia hardveres és szoftveres fronton is feszegeti a határokat.
Az Eureka számára a kulcs az olyan szimulációs technológiák kombinálása volt, mint a Isaac Gym a nyelvi modellek mintafelismerő képességével. Az Eureka hatékonyan „tanul tanulni”, optimalizálva saját jutalmazási algoritmusait több edzés során. Még emberi hozzájárulást is elfogad a jutalmak finomításához.
Ez az önfejlesztő megközelítés eddig nagyon általánosíthatónak bizonyult, mindenféle robotot kiképez – lábbal, kerekekkel, repülővel és ügyes kezekkel.
Az Nvidia Eureka és SteerLM nemcsak a korlátok áttörését szolgálja, hanem megtanítja a robotokat és a mesterséges intelligenciát a finomság és az éleslátás művészetére. Minden tollpörgetéssel és szellemes csevegéssel olyan jövőt vázolnak fel, ahol a mesterséges intelligencia nem csak utánoz, hanem mellettünk újít is.
Maradjon naprakész a kriptográfiai hírekkel, és napi frissítéseket kaphat a postaládájában.
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- PlatoHealth. Biotechnológiai és klinikai vizsgálatok intelligencia. Hozzáférés itt.
- Forrás: https://decrypt.co/202659/nvidia-eureka-ai-agent-allegedly-makes-robot-hands-dextrous-human-ones