Google opettaa robotteja palvelemaan ihmisiä – suurilla kielimalleilla PlatoBlockchain Data Intelligence. Pystysuuntainen haku. Ai.

Google opettaa robotteja palvelemaan ihmisiä – suuret kielimallit ovat avainasemassa

Video Googlen suurin tekoälyn kielimalli auttaa robotteja ymmärtämään ja tulkitsemaan ihmisen käskyjä joustavammin, kertoo verkkojättiläinen uusin tutkimus.

Koneet vastaavat yleensä parhaiten hyvin erityisiin vaatimuksiin – avoimet pyynnöt voivat joskus heittää ne pois ja johtaa tuloksiin, joita käyttäjät eivät tienneet. Ihmiset oppivat olemaan vuorovaikutuksessa robottien kanssa jäykästi, kuten esittämällä kysymyksiä tietyllä tavalla saadakseen halutun vastauksen.

Googlen uusin järjestelmä, nimeltään PaLM-SayCan, lupaa kuitenkin olla älykkäämpi. Everyday Robotsin fyysisen laitteen – Google X:stä kehitetyn startupin – päässä on kamerat silmiä varten ja sen pitkän suoran rungon takana oleva käsivarsi, joka on pyörän päällä.  

Voit katsoa robotin toiminnassa alla olevalta videolta:

Youtube Video

Kysymällä robotilta jotain "Treenin juuri, voitko saada minulle terveellisen välipalan?" tönäisee sen hakemaan omenaa. "PaLM-SayCan [on] tulkittava ja yleinen lähestymistapa tiedon hyödyntämiseen kielimalleista, jonka avulla robotti voi noudattaa korkeatasoisia tekstiohjeita suorittaakseen fyysisesti maadoitettuja tehtäviä", Googlen Brain-tiimin tutkijat. selitti.

Google esitteli suurimman kielimallinsa paLM tämän vuoden huhtikuussa. PaLM koulutettiin Internetistä kaavittuihin tietoihin, mutta avoimien tekstivastausten sijaan järjestelmä mukautettiin luomaan luettelo ohjeista, joita robotti noudattaa.

Sanomalla "Kadotin koksini pöydälle, kuinka heittäisit sen pois ja tuoisit minulle jotain siivoamista varten?" kehottaa Palmia ymmärtämään kysymyksen ja luomaan luettelon vaiheista, joita robotti voi suorittaa suorittaakseen tehtävän, kuten ylittämisen. nostaa tölkin, heittää sen roskakoriin ja hankkia sienen.

Suuret kielimallit (LLM), kuten PaLM, eivät kuitenkaan ymmärrä minkään sanomansa merkitystä. Tästä syystä tutkijat kouluttivat erillisen mallin vahvistusoppimisen avulla abstraktin kielen jakavaksi visuaalisiksi esityksiksi ja toimiksi. Näin robotti oppii yhdistämään sanan "Coke" poreilevan juomatölkin kuvaan.

PaLM-SayCan oppii myös niin sanottuja "affordance-funktioita" - menetelmää, joka luokittelee mahdollisuuden suorittaa tietty toiminta tietyillä kohteilla sen ympäristössä. Robotti poimii todennäköisemmin sienen kuin pölynimurin, jos se havaitsee sienen, mutta ei imuria sen lähellä. 

"Menetelmämme, SayCan, poimii ja hyödyntää LLM:ien tietämystä fyysisesti maadoitetuissa tehtävissä", tiimi selitti. tutkimus paperi. "LLM (Say) tarjoaa tehtäväperustan määrittämään hyödyllisiä toimia korkean tason tavoitteen saavuttamiseksi ja opitut affordance-funktiot (Can) tarjoavat maailmanlaajuisen pohjan määrittääkseen, mitä suunnitelman perusteella voidaan toteuttaa. Käytämme vahvistusoppimista (RL) tapana oppia kielen ehdollisia arvofunktioita, jotka tarjoavat mahdollisuuksia siihen, mikä maailmassa on mahdollista."

Jotta robotti ei poikkea tehtävästään, se on koulutettu valitsemaan toimintoja vain 101 eri ohjeesta. Google koulutti sen sopeutumaan keittiöön – PaLM-SayCan voi hankkia välipaloja, juomia ja suorittaa yksinkertaisia ​​puhdistustehtäviä. Tutkijat uskovat, että LLM:t ovat ensimmäinen askel saada robotit suorittamaan monimutkaisempia tehtäviä turvallisesti abstraktien ohjeiden perusteella.

”Kokeilumme useissa todellisissa robottitehtävissä osoittavat kyvyn suunnitella ja suorittaa pitkän horisontin, abstrakteja, luonnollisen kielen ohjeita suurella onnistumisprosentilla. Uskomme, että PaLM-SayCanin tulkittavuus mahdollistaa turvallisen reaalimaailman käyttäjien vuorovaikutuksen robottien kanssa”, he päättivät. ®

Aikaleima:

Lisää aiheesta Rekisteri