See DeepMind AI õpib kiiresti uusi oskusi lihtsalt inimesi jälgides

See DeepMind AI õpib kiiresti uusi oskusi lihtsalt inimesi jälgides

See DeepMind AI õpib kiiresti uusi oskusi lihtsalt jälgides inimeste PlatoBlockchaini andmeluure. Vertikaalne otsing. Ai.

Algoritmide õpetamine inimeste jäljendamiseks nõuab tavaliselt sadu või tuhandeid näiteid. Kuid Google DeepMindi uus tehisintellekt võib koguda uusi oskusi inimeste meeleavaldajatelt.

Üks inimkonna suurimaid nippe on meie võime üksteiselt kiiresti ja tõhusalt teadmisi omandada. Selline sotsiaalne õppimine, mida sageli nimetatakse kultuuriülekandeks, on see, mis võimaldab meil kolleegile näidata, kuidas uut tööriista kasutada või lastele lasteaiasalme õpetada.

Pole üllatav, et teadlased on püüdnud seda protsessi masinates korrata. Imitatsioonõpe, mille käigus tehisintellekt jälgib, kuidas inimene ülesande täitma hakkab ja seejärel tema käitumist jäljendada, on olnud robotite treenimisel juba pikka aega populaarne. Kuid isegi tänapäeva kõige arenenumad süvaõppe algoritmid peavad tavaliselt nägema palju näiteid, enne kui nad saavad oma treenereid edukalt kopeerida.

Kui inimesed õpivad jäljendamise kaudu, saavad nad sageli uusi ülesandeid peale mõne demonstratsiooni. Nüüd on Google DeepMindi teadlased astunud sammu kiire sotsiaalse õppimise suunas tehisintellektis agentidega, kes õpivad inimeste käest virtuaalses maailmas reaalajas navigeerima.

"Meie agentidel õnnestub uudsetes kontekstides inimest reaalajas jäljendada, kasutamata eelnevalt kogutud inimandmeid," kirjutavad teadlased ajakirjas. paber sisse Nature Communications. "Me tuvastame üllatavalt lihtsa koostisosade komplekti, mis on piisav kultuuriülekande loomiseks.

Teadlased koolitasid oma agente spetsiaalselt loodud simulaatoris nimega GoalCycle3D. Simulaator kasutab algoritmi, et luua peaaegu lõputu arv erinevaid keskkondi, mis põhinevad reeglitel selle kohta, kuidas simulatsioon peaks toimima ja millised selle aspektid peaksid muutuma.

Igas keskkonnas väike plekk AI esindajad peab liikuma ebatasasel maastikul ja erinevatel takistustel, et läbida kindlas järjekorras värviliste sfääride seeria. Maastiku konarlikkus, takistuste tihedus ja sfääride konfiguratsioon on keskkonnati erinev.

Agendid on koolitatud kasutades navigeerima tugevdamise õppimine. Nad teenivad sfääride õiges järjekorras läbimise eest tasu ja kasutavad seda signaali oma jõudluse parandamiseks paljude katsete jooksul. Kuid lisaks on keskkondades ka asjatundlik agent – ​​mis on kas kõvasti kodeeritud või mida juhib inimene –, kes juba teab õiget marsruuti kursusel.

Paljude koolituste käigus õpivad tehisintellekti agendid mitte ainult keskkondade toimimise põhitõdesid, vaid ka seda, et kiireim viis iga probleemi lahendamiseks on eksperdi jäljendamine. Tagamaks, et agendid õpivad pigem jäljendama kui lihtsalt kursusi pähe õppima, õpetas meeskond neid ühes keskkonnas ja katsetas seejärel teises. Oluline on see, et pärast koolitust näitas meeskond, et nende agendid suudavad asjatundjat jäljendada ja jätkata marsruudi jälgimist ka ilma eksperdita.

See nõudis standardsete tugevdamisõppe lähenemisviiside mõningaid näpunäiteid.

Teadlased panid algoritmi keskenduma eksperdile, lastes sellel ennustada teise agendi asukohta. Nad andsid sellele ka mälumooduli. Koolituse ajal langes ekspert keskkonda sisse ja sealt välja, sundides agenti oma tegevused meelde jätma, kui teda enam ei olnud. AI treenis ka paljudes keskkondades, mis tagas, et ta nägi palju võimalikke ülesandeid.

Siiski võib olla raske seda lähenemisviisi praktilisematesse valdkondadesse tõlkida. Peamine piirang on see, et kui teadlased katsetasid, kas tehisintellekt suudab inimeste demonstratsioonidest õppida, kontrollis ekspertagenti kõigi treeningute ajal üks inimene. Seetõttu on raske teada, kas agendid võiksid õppida erinevatelt inimestelt.

Veelgi tungivam on see, et võimalust treeningkeskkonda juhuslikult muuta oleks reaalses maailmas raske uuesti luua. Ja põhiülesanne oli lihtne, ei vajanud peenmotoorikat ja toimus kõrgelt kontrollitud virtuaalses keskkonnas.

Siiski on AI sotsiaalse õppimise edusammud teretulnud. Kui tahame elada intelligentsete masinatega maailmas, on ülioluline leida tõhusaid ja intuitiivseid viise oma kogemuste ja teadmiste jagamiseks nendega.

Image Credit: Juliana ja Mariana Amorim / Unsplash

Ajatempel:

Veel alates Singulaarsuse keskus