Arvutustehnika pioneer aitab tehisintellekti näha | Ajakiri Quanta

Arvutustehnika pioneer aitab tehisintellekti näha | Ajakiri Quanta

Arvutustehnika pioneer aitab tehisintellekti näha | Quanta Magazine PlatoBlockchain Data Intelligence. Vertikaalne otsing. Ai.

Sissejuhatus

Kui Aleksei Efros kolis 1980ndatel teismelisena perega Venemaalt Californiasse, tõi ta kaasa oma nõukogude ajal ehitatud personaalarvuti Elektronika BK-0010. Masinal polnud välist salvestusruumi ja see kuumenes iga paari tunni järel üle, nii et videomängude mängimiseks pidi ta enne masina väljalülitamist koodi kirjutama, tõrkeotsingut ja kiiresti mängima. See tsükkel, mida korrati enamikul päevadel, kiirendas tema õppimist.

"Mul vedas väga, et see nõukogude arvuti ei olnud väga hea!" ütles Efros, kes naerab kergelt ja räägib leebe vene aktsendiga. Ta ei mängi tänapäeval nii palju mänge, kuid valmisolek uurida ja oma tööriistu maksimaalselt ära kasutada jääb.

California Berkeley ülikooli kraadiõppes alustas Efros matkamist ja Bay Area loodusliku ilu avastamist. Ei läinud kaua aega, kui ta hakkas ühendama oma kirge arvutite vastu nende vaatamisväärsuste nautimisega. Ta töötas välja viisi, kuidas fotodel auke sujuvalt lappida – näiteks asendades sekvoias oleva metsa fotol eksinud prügikasti loomuliku välimusega puudega. Adobe Photoshop võttis hiljem kasutusele selle tehnika versiooni oma sisuteadliku täitmise tööriista jaoks.

Nüüd on Berkeley tehisintellekti uurimislabori arvutiteadlane Efros kombineerinud tohutuid võrguandmekogumeid masinõppe algoritmidega, et mõista, modelleerida ja uuesti luua visuaalmaailma. 2016. aastal andis Arvutusmasinate Liit talle selle Auhind andmetöötluses tema töö eest, luues realistlikke sünteetilisi pilte, nimetades teda "pildi alkeemik. "

Sissejuhatus

Efros ütleb, et vaatamata teadlaste pingutustele näevad masinad ikkagi põhimõtteliselt teistmoodi kui meie. "Värvi- ja heleduslaigud nõuavad, et me ühendaksime selle, mida me praegu näeme, meie mäluga, kus oleme neid asju varem näinud," ütles Efros. "See seos annab meile nähtule tähenduse." Liiga sageli näevad masinad seda, mis hetkel on, ühendamata seda varem nähtuga.

Kuid erinevusel võib olla eeliseid. Arvutinägemises hindab Efros vahetut teadmist, kas objektide ja stseenide äratundmiseks loodud algoritm töötab pildil. Mõned tema arvutinägemise küsimused - näiteks "Mille poolest Pariis Pariis välja näeb?” — on filosoofilise kallakuga. Teised, näiteks kuidas tegeleda püsivaga andmekogumite eelarvamus, on praktilised ja mõjuvad.

"Praegu tegelevad keelega tehisintellektiga paljud inimesed," ütles Efros. "Ma tahan vaadata täielikult visuaalseid mustreid, mis on maha jäänud." Arvutinägemist parandades loodab ta mitte ainult parematele praktilistele rakendustele, nagu isejuhtivad autod; ta soovib ka neid teadmisi kaevandada, et paremini mõista, mida ta nimetab "inimese visuaalseks intelligentsuseks" – kuidas inimesed mõistavad seda, mida nad näevad.

Quanta Magazine kohtus Efrosega tema Berkeley kontoris, et rääkida teaduslikest superjõududest, visuaalide kirjeldamise raskusest ja sellest, kui ohtlik tehisintellekt tegelikult on. Intervjuu on koondatud ja selguse huvides toimetatud.

Sissejuhatus

Kuidas on arvutinägemine pärast teie tudengipõlve paranenud?

Kui ma doktorikraadiga alustasin, polnud peaaegu midagi kasulikku. Mõned robotid keerasid arvutinägemise abil kruvisid, kuid see piirdus sellise väga kontrollitud tööstusliku seadistusega. Siis äkki tuvastas mu kaamera näod ja muutis need teravamaks.

Nüüd on arvutinägemine saadaval paljudes rakendustes, näiteks isejuhtivates autodes. See võtab kauem aega, kui mõned inimesed alguses arvasid, kuid siiski on edusamme. Kellelegi, kes ei sõida, on see väga põnev.

Oota, sa ei sõida?

Ei, ma ei näe piisavalt hästi, et sõita! [Naerab.] Minu jaoks oleks see selline mängumuutus – omada autot, mis mind kohtadesse sõidutaks.

Ma ei saanud aru, et su nägemine takistas sul sõitmist. Kas näete arvutimonitoril pilte, millega töötate?

Kui ma need piisavalt suured teen. Näete, et mu fondid on üsna suured. Ma sündisin halvasti nägemata. Ma arvan, et kõik teised on hullult hea nägemise pärast imelikud.

Kas teie mitteveidriku staatus mõjutas teie uurimissuunda?

Kes teab? Kindlasti ei tekkinud tunnet "Oh, ma ei näe hästi, nii et ma kavatsen teha arvutid, mis näevad paremini." Ei, mul pole see kunagi olnud motivatsiooniks.

Et olla hea teadlane, on sul vaja salajast supervõimet. Peate tegema midagi paremini kui kõik teised. Teaduse suurepärane asi on see, et meil kõigil ei ole sama supervõime. Võib-olla on minu supervõime olnud see, kuna ma ei näe väga hästi, võib-olla saan nägemisprobleemist rohkem aru.

Sissejuhatus

Sain varakult aru eelnevate andmete tähtsusest maailma vaadates. Ma ise küll väga hästi ei näinud, aga mu mälestus varasematest kogemustest täitis piisavalt auke, et saaksin põhimõtteliselt normaalse inimesena toimida. Enamik inimesi ei tea, et ma ei näe hästi. See andis mulle - ma arvan - ainulaadse intuitsiooni, et see võib olla vähem pikslite ja rohkem mälu kohta.

Arvutid näevad ainult seda, mis seal praegu on, samas kui me näeme hetke, mis on seotud kõige varem nähtud seinavaibaga.

Kas on üldse võimalik sõnadega väljendada peeneid visuaalseid mustreid, mis panevad näiteks Pariisi Pariisi sarnaseks?

Kui olete konkreetses linnas, teate mõnikord, mis linnas te viibite – see on siin je ne sais quoi, kuigi te pole kunagi sellel konkreetsel tänavanurgal käinud. Seda on väga raske sõnadega kirjeldada, kuid see on täpselt pikslites.

[Pariisi puhul] võiks rääkida sellest, et tavaliselt on need kuuekorruselised hooned ja tavaliselt on neljandal korrusel rõdud. Osa sellest võiks sõnadesse panna, kuid suur osa pole keeleline. Minu jaoks on see põnev.

Teie hiljutine töö on seotud arvutite õpetamisega visuaalsete andmete allaneelamine viisil, mis jäljendab inimese nägemist. Kuidas see toimib?

Praegu on arvutitel tohutu andmekogum: miljardeid juhuslikke pilte on Internetist välja kraabitud. Nad teevad juhuslikke pilte, töötlevad ühte pilti, seejärel võtavad teise juhusliku pildi, töötlevad seda jne. Te treenite oma [arvuti visuaalset] süsteemi, käies seda andmekogumit ikka ja jälle üle.

See, kuidas me – bioloogilised ained – andmeid neelame, on väga erinev. Kui seisame silmitsi uudse olukorraga, on see ainus kord, kui need andmed on meie jaoks olemas. Me pole kunagi olnud täpselt sellises olukorras, selles ruumis, selle valgustusega, nii riides. Esiteks kasutame neid andmeid selleks, et teha seda, mida vajame, et maailma mõista. Seejärel kasutame neid andmeid nendest õppimiseks ja tuleviku ennustamiseks.

Sissejuhatus

Samuti ei ole meie nähtavad andmed juhuslikud. See, mida praegu näete, on väga korrelatsioonis sellega, mida nägite mõni sekund tagasi. Võite seda mõelda videona. Kõik video kaadrid on omavahel korrelatsioonis, mis erineb suuresti sellest, kuidas arvutid andmeid töötlevad.

Olen huvitatud sellest, et meie õppimisviis oleks selline, kus arvutid näevad andmeid nii, nagu need tulevad, töötlevad neid ja õpivad nendest edasi liikudes.

Ma kujutan ette, et see pole nii lihtne kui lasta arvutitel piltide asemel videoid vaadata.

Ei, kohanemiseks vajate endiselt [arvuteid]. Mind huvitavad õppimisviisid, mis näevad andmeid nii, nagu need saabuvad, ning seejärel töötlevad neid ja õpivad neist edasi. Üks meie lähenemisviis on tuntud kui katseaja koolitus. Idee seisneb selles, et kui vaatate pildijada, näiteks videot, võivad asjad muutuda. Nii et te ei soovi, et teie mudelit parandataks. Nii nagu bioloogiline mõjur kohandub alati oma ümbrusega, tahame, et arvuti pidevalt kohaneks.

Tavaparadigma on see, et treenite esmalt suure andmekogumi kallal ja seejärel juurutate. Dall·E ja ChatGPT koolitati Internetis umbes 2021. aastal ning seejärel [nende teadmised] hangusid. Siis ajab ta välja seda, mida ta juba teab. Loomulikum viis on [test-ajakoolitus], püüda see andmeid absorbeerida ja töökohal õppida, mitte teha eraldi koolitus- ja juurutamisetappe.

Arvutitega on kindlasti probleem, mida nimetatakse domeeninihkeks või andmekomplekti kallutatuseks – see idee, et kui teie treeninguandmed on väga erinevad süsteemi juurutamisel kasutatavatest andmetest, siis asjad ei tööta. väga hästi. Me teeme mõningaid edusamme, kuid me ei ole veel päris kohal.

Sissejuhatus

Kas probleem on sarnane sellega, kuidas pangad hoiatavad investoreid, et varasemad tootlused ei pruugi ennustada tulevast tulu?

Täpselt see probleem ongi. Reaalses maailmas asjad muutuvad. Näiteks kui põldhiir satub majja, läheb sellega hästi. Sellest hiirest ei saa te kunagi lahti! [Naerab.] See sündis põllul, pole kunagi varem ühes majas olnud, kuid siiski leiab ja sööb kõik su varud. Ta kohaneb väga kiiresti, õpib ja kohaneb uue keskkonnaga.

Seda võimalust praegustes [arvutinägemise] süsteemides ei ole. Isejuhtimisega, kui treenite autot Californias ja seejärel testite seda Minnesotas – buum! - lund on. See pole kunagi lund näinud. See läheb segaseks.

Nüüd tegelevad inimesed sellega, hankides nii palju andmeid, et [süsteem] on põhimõtteliselt kõike näinud. Siis pole vaja kohaneda. Kuid see jätab siiski vahele haruldased sündmused.

Tundub, et AI-süsteemid on tee edasi. Kuhu see inimene jätab?

OpenAI-st tulev töö nii teksti (ChatGPT) kui ka pildi rindel (Dall·E) on olnud uskumatult põnev ja üllatav. See kinnitab seda ideed, et kui teil on piisavalt andmeid, võivad mõistlikult lihtsad meetodid anda üllatavalt häid tulemusi.

Sissejuhatus

Kuid ChatGPT pani mind mõistma, et inimesed pole nii loomingulised ja erakordsed, kui meile meeldib end näha. Enamasti võivad mustrituvastajad meis võimust võtta. Me räägime lausetega, mis on tehtud fraasidest või lausetest, mida oleme varem kuulnud. Muidugi on meil fantaasia ja loovuse lende. Me suudame teha asju, mida arvutid ei suuda – vähemalt praegu. Kuid enamasti võiks meid asendada ChatGPT ja enamik inimesi ei paneks seda tähele.

See on alandav. Kuid see on ka motivaator neist mustritest välja murda, püüda saada rohkem fantaasialende, et mitte takerduda klišeedesse ja pastiššidesse.

Mõned teadlased on väljendanud muret ohtude pärast, mida tehisintellekt inimkonnale kujutab. Kas sa oled mures?

Paljud teadlased, kellest ma väga lugu pean, on tehisintellekti eest hoiatanud. Ma ei taha neid sõnu minimeerida. Paljud neist on kehtivad punktid. Aga asju tuleb perspektiivi panna.

Praegu ei ole suurim oht ​​tsivilisatsioonile mitte arvutitest, vaid inimestest. Tuuma-Armageddon ja kliimamuutused on palju pakilisemad mured. Vene Föderatsioon on rünnanud oma täiesti süütut naabrit. Olen sündinud Venemaal ja see on eriti kohutav, et mu endised kaasmaalased võisid seda teha. Teen kõik endast oleneva, et see jääks teemaks number üks.

Võime arvata, et tehisintellekti revolutsioon on meie elu kõige olulisem sündmus. Kuid tehisintellekti revolutsioonist pole midagi, kui me vaba maailma ei päästa.

Nii et te ei muretse AI pärast üldse?

Ei. Tead, mulle meeldib muretseda. Olen suur muremees! Aga kui maailma hävitav Putin on siin [tõstab käe pähe] ja kliimamuutused on käes [langetab käe õlgadele], siis tehisintellekt on siin all [langetab käe jalgadele]. See on protsendi murdosa minu murest võrreldes Putini ja kliimamuutustega.

Ajatempel:

Veel alates Kvantamagazin