Amióta a ChatGPT tavaly novemberben berobbant a technológiai szcénába, segít az embereknek mindenféle anyag megírásában, kód generálásában és információkeresésben. Ez és más nagy nyelvi modellek (LLM) megkönnyítették a feladatokat az ügyfélszolgálati hívásoktól a gyorséttermi rendelések felvételéig. Tekintettel arra, hogy az LLM-ek mennyire hasznosak voltak az emberek számára a létezésük rövid ideje alatt, hogyan befolyásolhatja a ChatGPT robotoknak a tanulási és új dolgok megtételére való képességüket? A Google DeepMind kutatói úgy döntöttek, hogy kiderítik, és eredményeiket a blogbejegyzés és a múlt héten megjelent papír.
Rendszerüket RT-2-nek hívják. A robotics Transformer 2 rövidítése, és ez az utódja robot transzformátor 1, amelyet a cég tavaly év végén adott ki. Az RT-1 egy kis nyelvi és látási programon alapult, és kifejezetten sok feladat elvégzésére lett kiképezve. A szoftvert az Alphabet X-ben használták Mindennapi robotoktöbb mint 700 különböző feladat elvégzését teszi lehetővé 97 százalékos sikeraránnyal. Amikor azonban olyan új feladatok elvégzésére kérték őket, amelyekre nem képezték ki őket, az RT-1-et használó robotok csak az esetek 32 százalékában voltak sikeresek.
Az RT-2 csaknem megduplázza ezt az arányt, és a kért idő 62 százalékában sikeresen hajt végre új feladatokat. A kutatók az RT-2-t vision-language-action (VLA) modellnek nevezik. Az interneten látott szövegeket és képeket használ új készségek elsajátításához. Ez nem olyan egyszerű, mint amilyennek hangzik; megköveteli, hogy a szoftver először „megértsen” egy fogalmat, majd alkalmazza azt egy parancsra vagy utasításkészletre, majd hajtson végre olyan műveleteket, amelyek megfelelnek az utasításoknak.
A cikk szerzői példaként említik a szemétszállítást. A korábbi modellekben a robot szoftverét először meg kellett tanítani a szemét azonosítására. Például, ha van egy hámozott banán az asztalon, és a héja mellette van, akkor a robot azt mutatja, hogy a héja szemetes, míg a banán nem. Ezután megtanítják neki, hogyan vegye fel a héjat, vigye egy szemetesbe, és helyezze el ott.
Az RT-2 azonban kicsit másképp működik. Mivel a modell rengeteg információra és adatra oktat az internetről, általánosan érti, hogy mi a szemét, és bár nincs megtanítva arra, hogy kidobja a szemetet, össze tudja állítani a lépéseket a feladat végrehajtásához.
A kutatók az RT-2 képzéséhez használt LLM-eket PaLI-X (55 milliárd paraméterű látás- és nyelvi modell), ill PaLM-E (amit a Google testesített multimodális nyelvi modellnek nevez, kifejezetten robotok számára fejlesztették ki, 12 milliárd paraméterrel). A „paraméter” egy olyan attribútumra utal, amelyet a gépi tanulási modell a betanítási adatai alapján határoz meg. Az LLM-ek esetében modellezik a mondatban lévő szavak közötti kapcsolatokat, és mérlegelik, hogy mekkora valószínűséggel kerül egy adott szó elé vagy után egy másik szó.
Azáltal, hogy egy óriási adathalmazban megtalálják a szavak közötti kapcsolatokat és mintákat, a modellek tanulnak saját következtetéseikből. Végül rájönnek, hogy a különböző fogalmak hogyan kapcsolódnak egymáshoz, és meg tudják különböztetni a kontextust. Az RT-2 esetében ezt a tudást általánosított utasításokká alakítja át robotműveletek számára.
Ezeket a műveleteket a robot tokenekként ábrázolja, amelyeket általában a természetes nyelvű szöveg szótöredékek formájában történő megjelenítésére használnak. Ebben az esetben a tokenek egy művelet részei, és a szoftver több tokent összefűzi egy művelet végrehajtásához. Ez a struktúra azt is lehetővé teszi a szoftver számára, hogy gondolatláncon alapuló érvelést hajtson végre, ami azt jelenti, hogy válaszolhat olyan kérdésekre vagy felszólításokra, amelyek bizonyos fokú érvelést igényelnek.
A csapat példái közé tartozik egy tárgy kiválasztása kalapácsnak, amikor nincs kalapács (a robot választ egy sziklát), és a legjobb ital kiválasztása egy fáradt ember számára (a robot választ egy energiaitalt).
"Az RT-2 javított általánosítási képességeket, valamint szemantikai és vizuális megértést mutat a robotadatokon túl, amelyeknek ki volt téve" - írták a kutatók a Google-ban. blogbejegyzés. "Ebbe beletartozik az új parancsok értelmezése és a felhasználói parancsokra való válaszadás kezdetleges érvelés végrehajtásával, például az objektumkategóriák vagy a magas szintű leírások érvelése."
Az álom általános célú robotok ami segíthet az embereknek bármiben, ami felmerül – akár otthon, akár kereskedelmi környezetben, akár ipari környezetben – addig nem lesz elérhető, amíg a robotok nem tudnak tanulni útközben. Ami számunkra a legalapvetőbb ösztönnek tűnik, az a robotok számára a kontextus megértésének, az azon keresztüli érvelésnek, valamint a nem várt problémák megoldására irányuló cselekvések összetett kombinációja. Lehetetlen programozni őket arra, hogy megfelelően reagáljanak különféle nem tervezett forgatókönyvekre, ezért képesnek kell lenniük általánosítani és tanulni a tapasztalatokból, akárcsak az emberek.
Az RT-2 egy lépés ebbe az irányba. A kutatók azonban elismerik, hogy bár az RT-2 képes általánosítani a szemantikai és vizuális fogalmakat, még nem képes önállóan új cselekvéseket megtanulni. Inkább a már ismert műveleteket alkalmazza új forgatókönyvekre. Talán az RT-3 vagy 4 képes lesz ezeket a képességeket a következő szintre emelni. Addig is, ahogy a csapat arra a következtetésre jut blogbejegyzés, "Bár még mindig rengeteg munka vár a segítőkész robotok emberközpontú környezetbe való bejuttatására, az RT-2 a robotika izgalmas jövőjét mutatja meg nekünk."
Kép: Google DeepMind
- SEO által támogatott tartalom és PR terjesztés. Erősödjön még ma.
- PlatoData.Network Vertical Generative Ai. Erősítse meg magát. Hozzáférés itt.
- PlatoAiStream. Web3 Intelligence. Felerősített tudás. Hozzáférés itt.
- PlatoESG. Autóipar / elektromos járművek, Carbon, CleanTech, Energia, Környezet, Nap, Hulladékgazdálkodás. Hozzáférés itt.
- BlockOffsets. A környezetvédelmi ellentételezési tulajdon korszerűsítése. Hozzáférés itt.
- Forrás: https://singularityhub.com/2023/08/02/deepminds-chatgpt-like-brain-for-robots-lets-them-learn-from-the-internet/
- :van
- :is
- :nem
- $ UP
- 12
- 32
- 700
- a
- képesség
- Képes
- Rólunk
- elismerni
- Akció
- cselekvések
- Minden termék
- Ábécé
- már
- Is
- összeg
- an
- és a
- Másik
- várható
- alkalmaz
- megfelelő
- VANNAK
- körül
- AS
- At
- szerzők
- elérhető
- el
- Banán
- alapján
- alapvető
- BE
- óta
- hogy
- BEST
- között
- Túl
- Billió
- Bot
- Agy
- de
- by
- hívás
- kéri
- TUD
- képességek
- visz
- eset
- kategóriák
- ChatGPT
- választja
- kód
- kombináció
- hogyan
- kereskedelmi
- vállalat
- teljes
- bonyolult
- koncepció
- fogalmak
- kontextus
- hitel
- vevő
- Vevőszolgálat
- dátum
- határozott
- DeepMind
- Annak meghatározása,
- Fok
- letét
- fejlett
- különböző
- irány
- do
- csinált
- Páros
- álom
- Ital
- minden
- lehetővé
- lehetővé teszi
- lehetővé téve
- végén
- energia
- környezetek
- végül is
- példa
- izgalmas
- tapasztalat
- kitett
- megkönnyítette
- GYORS
- Ábra
- Találjon
- megtalálása
- megállapítások
- vezetéknév
- követ
- élelmiszer
- A
- forma
- ból ből
- jövő
- általános
- generál
- óriás
- Ad
- adott
- ad
- Go
- fogás
- kalapács
- Legyen
- segít
- hasznos
- segít
- magas szinten
- Kezdőlap
- Hogyan
- How To
- HTML
- HTTPS
- Az emberek
- azonosítani
- if
- képek
- Hatás
- lehetetlen
- javított
- in
- tartalmaz
- magában foglalja a
- ipari
- információ
- utasítás
- Internet
- bele
- IT
- ITS
- jpg
- éppen
- tudás
- nyelv
- nagy
- keresztnév
- Tavaly
- TANUL
- tanulás
- Lets
- szint
- mint
- Valószínű
- kis
- terhelések
- gép
- gépi tanulás
- sok
- anyag
- max-width
- Lehet..
- jelenti
- Addig
- esetleg
- modell
- modellek
- a legtöbb
- mozog
- többszörös
- Természetes
- Szükség
- Új
- következő
- nem
- november
- tárgy
- of
- on
- online
- csak
- -ra
- or
- rendelés
- Más
- ki
- felett
- saját
- Papír
- paraméterek
- alkatrészek
- minták
- Emberek (People)
- százalék
- Teljesít
- előadó
- talán
- person
- vedd
- darab
- Plató
- Platón adatintelligencia
- PlatoData
- pop
- előző
- problémák
- Program
- Programozás
- közzétett
- Kérdések
- Arány
- Inkább
- Reagál
- ok
- kifejezés
- Kapcsolatok
- felszabaduló
- képvisel
- képviselők
- szükség
- megköveteli,
- kutatók
- Reagálni
- válaszol
- robot
- robotika
- robotok
- Szikla
- s
- forgatókönyvek
- színhely
- Úgy tűnik,
- lát
- mondat
- szolgáltatás
- készlet
- beállítás
- rövid
- mutatott
- Műsorok
- Egyszerű
- óta
- készségek
- kicsi
- So
- szoftver
- SOLVE
- néhány
- kifejezetten
- Lépés
- Lépései
- Még mindig
- struktúra
- siker
- sikeres
- sikeresen
- ilyen
- rendszer
- táblázat
- Vesz
- bevétel
- Feladat
- feladatok
- tanított
- csapat
- tech
- hogy
- A
- azok
- Őket
- akkor
- Ott.
- Ezek
- ők
- dolgok
- ezt
- azok
- bár?
- Keresztül
- idő
- fáradt
- nak nek
- együtt
- tokenek
- Vonat
- kiképzett
- Képzések
- transzformátor
- borzasztó
- megértés
- -ig
- us
- használ
- használt
- használó
- használ
- segítségével
- rendszerint
- fajta
- látomás
- volt
- hét
- mérjünk
- voltak
- Mit
- bármi
- amikor
- ami
- míg
- lesz
- val vel
- belül
- szó
- szavak
- Munka
- művek
- lenne
- ír
- írt
- X-ek
- év
- még
- zephyrnet