Nvidia väittää, että robottikädet sopivat ihmisten näppäryyteen uusilla tekoälyälyillä

Robottikädet voivat sovittaa ihmisten näppäryyden uusiin tekoälyälyihin, väittää Nvidia – Pura salaus

Robottikädet voivat sovittaa ihmisten näppäryyden uusiin tekoälyälyihin, väittää Nvidia - Pura PlatoBlockchain-tietoälyn salaus. Pystysuuntainen haku. Ai.

Nvidian tutkijat ovat saavuttaneet suuren harppauksen robottien kätevuudessa Eureka, tekoälyagentti, jonka väitetään voivan opettaa boteille monimutkaisia ​​taitoja, kuten kynänpyöritystemppuja, yhtä taitavasti kuin ihmiset.

Uusi tekniikka, joka on kuvattu torstaina julkaistussa paperissa, perustuu viimeaikaisiin edistysaskeliin suurissa kielimalleissa, kuten OpenAI: n GPT-4. Eureka hyödyntää generatiivista tekoälyä kirjoittaakseen itsenäisesti kehittyneitä palkitsemisalgoritmeja, joiden avulla robotit voivat oppia kokeilu- ja virhe -vahvistusoppimisen avulla. Tämä lähestymistapa on osoittautunut yli 50 % tehokkaammaksi kuin ihmisen laatimat ohjelmat, paperissa pääpiirteittäin.

"Eureka on myös opettanut nelijalkaisia, taitavia käsiä, kobottikäsivarsia ja muita robotteja avaamaan laatikoita, käyttämään saksia, nappaamaan palloja ja tekemään lähes 30 erilaista tehtävää", Nvidian virallinen blogikirjoitus kertoo. 

Eureka on uusin osoitus Nvidian uraauurtavasta työstä tekoälyn ohjaamisessa kielimalleilla. Viime aikoina yritys on avoimen lähdekoodin SteerLM– menetelmä, joka kohdistaa tekoälyavustajat olemaan hyödyllisempiä kouluttamalla heitä inhimillisen palautteen perusteella.

Eurekan tapaan SteerLM hyödyntää myös kielimallien edistysaskeleita, mutta keskittää ne eri haasteeseen – tekoälyavustajan kohdistuksen parantamiseen. SteerLM kouluttaa avustajia harjoittelemalla keskusteluja, kuten robotti oppii tekemällä. Järjestelmä antaa palautetta avustajan vastauksista ominaisuuksien, kuten avuliaisuuden, huumorin ja laadun avulla.

Se on esimerkiksi kuin robotti, joka oppii tanssimaan hyviksi tai huonoiksi merkityistä videoista sen sijaan, että ihminen katselisi tuhansia satunnaisia ​​tansseja ja valitsee, mitkä ovat hyviä tai huonoja (tämä on tyypillinen tapasi AI chatbotit ovat koulutettuja). Toistuvasti harjoittelemalla ja saamalla palautetta assistentit oppivat antamaan käyttäjän tarpeisiin räätälöityjä vastauksia. Tämä auttaa tekemään tekoälystä hyödyllisemmän reaalimaailman sovelluksissa.

Yhteinen lanka on kehittyneiden hermoverkkojen käyttö luovilla uusilla tavoilla, olipa kyseessä robottien tai chatbottien opettaminen. Nvidia työntää rajoja sekä laitteisto- että ohjelmistorintamalla.

Eurekan kannalta avain oli simulointiteknologioiden yhdistäminen Isaac Gym kielimallien hahmontunnistuskyvyn kanssa. Eureka "oppii oppimaan" tehokkaasti optimoimalla omat palkitsemisalgoritminsa useiden harjoitusajojen aikana. Se hyväksyy jopa ihmisten panoksen palkkioidensa jalostamiseksi.

Tämä itseään parantava lähestymistapa on tähän mennessä osoittautunut erittäin yleistettäväksi, sillä se on kouluttanut kaikenlaisia ​​robotteja – jalkoja, pyörillä varustettuja, lentäviä ja taitavia käsiä.

Nvidian Eureka ja SteerLM eivät vain murta esteitä, vaan ne opettavat roboteille ja tekoälylle hienouden ja oivaltavan vuorovaikutuksen taitoa. Jokaisella kynän pyöräytyksellä ja nokkelalla keskustelulla he hahmottelevat tulevaisuutta, jossa tekoäly ei vain matkii, vaan innovoi rinnallamme.

Pysy ajan tasalla kryptouutisista, saat päivittäiset päivitykset postilaatikkoosi.

Aikaleima:

Lisää aiheesta Pura