Google opettaa robotteja palvelemaan ihmisiä – suurilla kielimalleilla avain

Julkaissut Platon

seuraajia: 0

Video Googlen suurin tekoälyn kielimalli auttaa robotteja ymmärtämään ja tulkitsemaan ihmisen käskyjä joustavammin, kertoo verkkojättiläinen uusin tutkimus.

Koneet vastaavat yleensä parhaiten hyvin erityisiin vaatimuksiin – avoimet pyynnöt voivat joskus heittää ne pois ja johtaa tuloksiin, joita käyttäjät eivät tienneet. Ihmiset oppivat olemaan vuorovaikutuksessa robottien kanssa jäykästi, kuten esittämällä kysymyksiä tietyllä tavalla saadakseen halutun vastauksen.

Googlen uusin järjestelmä, nimeltään PaLM-SayCan, lupaa kuitenkin olla älykkäämpi. Everyday Robotsin fyysisen laitteen – Google X:stä kehitetyn startupin – päässä on kamerat silmiä varten ja sen pitkän suoran rungon takana oleva käsivarsi, joka on pyörän päällä.

Voit katsoa robotin toiminnassa alla olevalta videolta:

Youtube Video

Kysymällä robotilta jotain "Treenin juuri, voitko saada minulle terveellisen välipalan?" tönäisee sen hakemaan omenaa. "PaLM-SayCan [on] tulkittava ja yleinen lähestymistapa tiedon hyödyntämiseen kielimalleista, jonka avulla robotti voi noudattaa korkeatasoisia tekstiohjeita suorittaakseen fyysisesti maadoitettuja tehtäviä", Googlen Brain-tiimin tutkijat. selitti.

Google esitteli suurimman kielimallinsa paLM tämän vuoden huhtikuussa. PaLM koulutettiin Internetistä kaavittuihin tietoihin, mutta avoimien tekstivastausten sijaan järjestelmä mukautettiin luomaan luettelo ohjeista, joita robotti noudattaa.

Sanomalla "Kadotin koksini pöydälle, kuinka heittäisit sen pois ja tuoisit minulle jotain siivoamista varten?" kehottaa Palmia ymmärtämään kysymyksen ja luomaan luettelon vaiheista, joita robotti voi suorittaa suorittaakseen tehtävän, kuten ylittämisen. nostaa tölkin, heittää sen roskakoriin ja hankkia sienen.

Suuret kielimallit (LLM), kuten PaLM, eivät kuitenkaan ymmärrä minkään sanomansa merkitystä. Tästä syystä tutkijat kouluttivat erillisen mallin vahvistusoppimisen avulla abstraktin kielen jakavaksi visuaalisiksi esityksiksi ja toimiksi. Näin robotti oppii yhdistämään sanan "Coke" poreilevan juomatölkin kuvaan.

PaLM-SayCan oppii myös niin sanottuja "affordance-funktioita" - menetelmää, joka luokittelee mahdollisuuden suorittaa tietty toiminta tietyillä kohteilla sen ympäristössä. Robotti poimii todennäköisemmin sienen kuin pölynimurin, jos se havaitsee sienen, mutta ei imuria sen lähellä.

"Menetelmämme, SayCan, poimii ja hyödyntää LLM:ien tietämystä fyysisesti maadoitetuissa tehtävissä", tiimi selitti. tutkimus paperi. "LLM (Say) tarjoaa tehtäväperustan määrittämään hyödyllisiä toimia korkean tason tavoitteen saavuttamiseksi ja opitut affordance-funktiot (Can) tarjoavat maailmanlaajuisen pohjan määrittääkseen, mitä suunnitelman perusteella voidaan toteuttaa. Käytämme vahvistusoppimista (RL) tapana oppia kielen ehdollisia arvofunktioita, jotka tarjoavat mahdollisuuksia siihen, mikä maailmassa on mahdollista."

Jotta robotti ei poikkea tehtävästään, se on koulutettu valitsemaan toimintoja vain 101 eri ohjeesta. Google koulutti sen sopeutumaan keittiöön – PaLM-SayCan voi hankkia välipaloja, juomia ja suorittaa yksinkertaisia puhdistustehtäviä. Tutkijat uskovat, että LLM:t ovat ensimmäinen askel saada robotit suorittamaan monimutkaisempia tehtäviä turvallisesti abstraktien ohjeiden perusteella.

”Kokeilumme useissa todellisissa robottitehtävissä osoittavat kyvyn suunnitella ja suorittaa pitkän horisontin, abstrakteja, luonnollisen kielen ohjeita suurella onnistumisprosentilla. Uskomme, että PaLM-SayCanin tulkittavuus mahdollistaa turvallisen reaalimaailman käyttäjien vuorovaikutuksen robottien kanssa”, he päättivät. ®

Aikaleima: Elokuu 18, 2022Elokuu 18, 2022

Aikaleima: Elokuu 31, 2023

Google opettaa robotteja palvelemaan ihmisiä – suuret kielimallit ovat avainasemassa

Julkaissut Platon

Lisää aiheesta Rekisteri

Aivojen inspiroimat sirut lupaavat erittäin tehokkaan tekoälyn, joten miksi niitä ei ole kaikkialla?

Kongressi sanoi, että tekoälyyritysten pitäisi maksaa tekijänoikeudella suojatusta sisällöstä

Intia etsii keinotekoista viisautta, suunnittelee kaupunkikokoista digitaalista kaksoisparia

Hymy! Ison-Britannian poliisit uskovat, että he ovat tasoittaneet gremlinit reaaliaikaisella kasvojentunnistuksella

Adobe heiluttaa tekoälysauvaa ja nostaa hintoja maagisesti

Waymo muuttaa kuljettamattomat autonsa kiertäviksi sääasemiksi

Generatiivinen tekoäly ei ole hallinnassa: Ei mitään, Forever on Seinfeldin huijaus mistään… ikuisesti

Aivoriihi varoittaa Pohjois-Korean käyttävän pilviä taistelussa tekoälyä

Doomin kehittäjä John Carmack uskoo, että AGI debytoi vuonna 2030

Tekoäly voittaa ihmiset ensimmäisen persoonan drone-kilpailuissa

Tietoa Meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili