Tämä DeepMind AI oppii nopeasti uusia taitoja pelkästään katsomalla ihmisiä

Tämä DeepMind AI oppii nopeasti uusia taitoja pelkästään katsomalla ihmisiä

Tämä DeepMind AI oppii nopeasti uusia taitoja vain katsomalla ihmisten PlatoBlockchain-tietoälyä. Pystysuuntainen haku. Ai.

Ihmisiä jäljittelevien algoritmien opettaminen vaatii tyypillisesti satoja tai tuhansia esimerkkejä. Mutta Google DeepMindin uusi tekoäly voi poimia uusia taitoja ihmismielenosoittajilta lennossa.

Yksi ihmiskunnan suurimmista temppuista on kykymme hankkia tietoa nopeasti ja tehokkaasti toisiltaan. Tällainen sosiaalinen oppiminen, jota usein kutsutaan kulttuurin välitykseksi, antaa meille mahdollisuuden näyttää kollegalle, kuinka käyttää uutta työkalua tai opettaa lapsille päivälauluja.

Ei ole yllätys, että tutkijat ovat yrittäneet toistaa prosessia koneissa. Jäljitelmäoppiminen, jossa tekoäly tarkkailee ihmisen suorittavan tehtävän ja yrittää sitten jäljitellä hänen käyttäytymistään, on ollut pitkään suosittu lähestymistapa robottien kouluttamisessa. Mutta jopa nykypäivän edistyneimmät syväoppimisalgoritmit tarvitsevat yleensä monia esimerkkejä, ennen kuin ne voivat kopioida kouluttajiaan.

Kun ihmiset oppivat jäljittelemällä, he voivat usein poimia uusia tehtäviä vain kourallisen esittelyn jälkeen. Nyt Google DeepMind -tutkijat ovat ottaneet askeleen kohti nopeaa sosiaalista oppimista tekoälyssä agenttien avulla, jotka oppivat navigoimaan virtuaalimaailmassa ihmisiltä reaaliajassa.

"Agenttimme onnistuvat jäljittelemään ihmistä reaaliajassa uusissa yhteyksissä käyttämättä mitään ennalta kerättyä ihmisdataa", tutkijat kirjoittavat. paperi sisään Luonto Viestintä. "Tunnistamme yllättävän yksinkertaisen joukon ainesosia, jotka riittävät tuottamaan kulttuurin välittämistä."

Tutkijat kouluttivat agenttejaan erityisesti suunnitellussa GoalCycle3D-simulaattorissa. Simulaattori generoi algoritmin avulla lähes loputtoman määrän erilaisia ​​ympäristöjä sääntöihin perustuen siitä, miten simulaation tulee toimia ja mitkä seikat vaihtelevat.

Jokaisessa ympäristössä pieni möykky AI-agentit täytyy navigoida epätasaisessa maastossa ja erilaisissa esteissä kulkeakseen sarjan värillisiä palloja tietyssä järjestyksessä. Maaston kuoppaisuus, esteiden tiheys ja pallojen konfiguraatio vaihtelee ympäristöjen välillä.

Agentit on koulutettu navigoimaan käyttäen vahvistaminen oppiminen. He ansaitsevat palkinnon siitä, että he kulkevat pallojen läpi oikeassa järjestyksessä ja käyttävät tätä signaalia parantaakseen suorituskykyään monissa kokeissa. Mutta lisäksi ympäristöissä on myös asiantunteva agentti – joka on joko koodattu tai ihmisen ohjaama – joka tietää jo oikean reitin kurssin läpi.

Tekoälyagentit oppivat monien harjoitusajojen aikana paitsi ympäristön toiminnan perusteet, myös sen, että nopein tapa ratkaista jokainen ongelma on matkia asiantuntijaa. Varmistaakseen, että agentit oppivat matkimaan kurssien ulkoamisen sijaan, tiimi koulutti heidät yhdessä ympäristössä ja testasi niitä sitten toisessa. Ratkaisevaa on, että koulutuksen jälkeen tiimi osoitti, että heidän agenttinsa pystyivät jäljittelemään asiantuntijaa ja jatkamaan reittiä myös ilman asiantuntijaa.

Tämä vaati muutamia muutoksia tavallisiin vahvistusoppimismenetelmiin.

Tutkijat saivat algoritmin keskittymään asiantuntijaan antamalla sen ennustaa toisen agentin sijainnin. He antoivat sille myös muistimoduulin. Koulutuksen aikana asiantuntija putoaa ympäristöihin ja poistui niistä, pakottaen agentin muistamaan toimintansa, kun se ei enää ollut läsnä. Tekoäly harjoitteli myös monenlaisia ​​ympäristöjä, mikä varmisti, että se näki laajan valikoiman mahdollisia tehtäviä.

Saattaa kuitenkin olla vaikeaa kääntää lähestymistapaa käytännön aloille. Keskeinen rajoitus on se, että kun tutkijat testasivat, voisiko tekoäly oppia ihmisten esittelyistä, asiantuntijaagenttia ohjasi yksi henkilö kaikkien harjoitusajojen aikana. Tämän vuoksi on vaikea tietää, voisivatko agentit oppia monilta ihmisiltä.

Vielä tärkeämpää on, että kykyä satunnaisesti muuttaa harjoitusympäristöä olisi vaikea luoda uudelleen todellisessa maailmassa. Ja taustalla oleva tehtävä oli yksinkertainen, ei vaatinut hienomoottorista ohjausta ja tapahtui erittäin kontrolloiduissa virtuaaliympäristöissä.

Silti sosiaalisen oppimisen edistyminen tekoälyssä on tervetullutta. Jos aiomme elää maailmassa, jossa on älykkäitä koneita, tehokkaiden ja intuitiivisten tapojen jakaminen kokemuksemme ja asiantuntemuksemme on ratkaisevan tärkeää.

Kuva pistetilanne: Juliana ja Mariana Amorim / Unsplash

Aikaleima:

Lisää aiheesta Singulaarisuus Hub