Matematiki DeepMind AI One-Ups pri izračunu, ki je ključen za računalništvo podatkovne inteligence PlatoBlockchain. Navpično iskanje. Ai.

DeepMind AI Matematiki na prvem mestu pri izračunih, ki so ključni za računalništvo

DeepMind je to ponovil.

Po rešitvi temeljnega izziva v biologiji –napovedovanje strukture beljakovin—In razpletanje matematike teorije vozlov, je usmerjen v temeljni računalniški proces, vdelan v tisoče vsakodnevnih aplikacij. Od razčlenjevanja slik do modeliranje vremena ali celo preizkušanje notranjega delovanja umetnih nevronskih mrež bi lahko AI teoretično pospešil izračune na številnih področjih, povečal učinkovitost in hkrati zmanjšal porabo energije in stroške.

Toda bolj impresivno je kako uspelo jim je. Algoritem, ki podira rekorde, poimenovan AlphaTensor, je posledica alphazero, ki je slavno premagal človeške igralce v šahu in gou.

"Algoritme so uporabljali po vsej svetovni civilizaciji za izvajanje temeljnih operacij že tisočletja," Napisal soavtorji dr. Matej Balog in Alhussein Fawzi pri DeepMind. "Vendar je odkrivanje algoritmov zelo zahtevno."

AlphaTensor utira pot v nov svet, kjer umetna inteligenca oblikuje programe, ki prekašajo vse, kar ustvarijo ljudje, hkrati pa izboljšuje lastne »možgane« stroja.

"To delo sega na neznano ozemlje z uporabo umetne inteligence za optimizacijski problem, s katerim so ljudje delali desetletja ... rešitve, ki jih najde, je mogoče takoj razviti za izboljšanje časov izvajanja računalništva," je povedal dr. Federico Levi, višji urednik pri Narava, Ki je objavljeno študij.

Vnesite matrično množenje

Težava, s katero se sooča AlphaTensor, je množenje matrik. Če si nenadoma predstavljate vrstice in stolpce zelenih številk, ki se pomikajo po zaslonu navzdol, niste edini. Grobo rečeno, matrika je nekaj takega – mreža številk, ki digitalno predstavlja podatke po vaši izbiri. To so lahko piksli na sliki, frekvence zvočnega posnetka ali videz in dejanja likov v video igrah.

Matrično množenje vzame dve mreži števil in pomnoži eno z drugo. To je izračun, ki se ga pogosto učijo v srednji šoli, vendar je ključnega pomena tudi za računalniške sisteme. Tu se vrstice števil v eni matriki pomnožijo s stolpci v drugi. Rezultati ustvarijo rezultat - na primer ukaz za povečavo ali nagib pogleda na sceno video igre. Čeprav ti izračuni delujejo pod pokrovom, je vsakdo, ki uporablja telefon ali računalnik, vsak dan odvisen od njihovih rezultatov.

Vidite lahko, kako lahko postane težava izjemno težka, izjemno hitro. Množenje velikih matrik je neverjetno energetsko in časovno intenzivno. Vsak številski par je treba posebej pomnožiti, da sestavi nova matrika. Ko matrice rastejo, problem hitro postane nevzdržen - celo bolj kot napovedovanje najboljših šahovskih ali Go potez. Nekateri strokovnjaki ocenjujejo, da obstajajo več načinov za reševanje matričnega množenja kot števila atomov v vesolju.

Leta 1969 je Volker Strassen, nemški matematik, pokazal, da obstajajo načini za rezanje vogalov, in zmanjšal en krog matričnega množenja dva z dva iz skupaj osem do sedem. Morda se ne sliši impresivno, vendar je Strassenova metoda pokazala, da je mogoče premagati dolgotrajne standarde operacij – to je algoritmov – za množenje matrik. Njegov pristop, Strassenov algoritem, že več kot 50 let kraljuje kot najučinkovitejši pristop.

Kaj pa, če obstajajo še učinkovitejše metode? "Nihče ne pozna najboljšega algoritma za njegovo rešitev," dr. François Le Gall z univerze Nagoya na Japonskem, ki ni bil vključen v delo, Rekel Pregled tehnologije MIT. "To je eden največjih odprtih problemov v računalništvu."

Algoritmi lovljenja AI

Če človeška intuicija šepa, zakaj ne bi posegli po mehaničnem umu?

V novi študiji je ekipa DeepMind množenje matrik spremenila v igro. Podobno kot njegov predhodnik AlphaZero, AlphaTensor uporablja globoko okrepljeno učenje, metodo strojnega učenja, ki se zgleduje po načinu učenja bioloških možganov. Tukaj agent AI (pogosto umetna nevronska mreža) sodeluje s svojim okoljem, da reši večstopenjski problem. Če uspe, si prisluži »nagrado« – to pomeni, da se omrežni parametri AI posodobijo, tako da je večja verjetnost, da bo v prihodnosti znova uspel.

To je tako, kot da bi se naučil obrniti palačinko. Veliko bo sprva padlo na tla, a sčasoma se bodo vaše nevronske mreže naučile gibov rok in dlani za popoln flip.

Poligon za AlphaTensor je neke vrste 3D družabna igra. V bistvu je uganka za enega igralca, približno podobna sudokuju. Umetna inteligenca mora pomnožiti mreže števil v čim manj korakih, pri tem pa izbirati med nešteto dovoljenimi potezami – več kot trilijon jih.

Ti dovoljeni premiki so bili natančno oblikovani v AlphaTensor. Na tiskovni konferenci je soavtor dr. Hussain Fawzi pojasnil: "Formuliranje prostora algoritemskega odkrivanja je zelo zapleteno ... še težje je, kako lahko krmarimo v tem prostoru."

Z drugimi besedami, ko se soočimo z osupljivim naborom možnosti, kako jih lahko zožimo in tako izboljšamo svoje možnosti, da najdemo iglo v kupu sena? In kako lahko naredimo najboljšo strategijo, da pridemo do igle, ne da bi prekopali ves kozolec?

En trik, ki ga je ekipa vključila v AlphaTensor, je metoda, imenovana iskanje po drevesih. Namesto, metaforično rečeno, naključnega kopanja po kozolcu, tukaj umetna inteligenca preiskuje »ceste«, ki bi lahko vodile do boljšega rezultata. Vmesna učenja nato pomagajo AI načrtovati svojo naslednjo potezo, da poveča možnosti za uspeh. Ekipa je pokazala tudi vzorce algoritmov uspešnih iger, na primer učenje otrok začetnih potez šaha. Nazadnje, ko je umetna inteligenca odkrila dragocene poteze, ji je ekipa dovolila, da prerazporedi te operacije za bolj prilagojeno učenje v iskanju boljšega rezultata.

Prelomnica

AlphaTensor je igral dobro. V nizu testov je ekipa izzvala umetno inteligenco, da najde najučinkovitejše rešitve za matrike velikosti pet krat pet – to je s po petimi številkami v vrstici ali stolpcu.

Algoritem je hitro znova odkril Strassenov izvirni vdor, a je nato presegel vse rešitve, ki jih je prej izumil človeški um. S preizkušanjem umetne inteligence z različnimi velikostmi matrik je AlphaTensor našel učinkovitejše rešitve za več kot 70. »Dejansko AlphaTensor običajno odkrije na tisoče algoritmov za vsako velikost matrike,« je povedala ekipa. "To je osupljivo."

V enem primeru je umetna inteligenca z množenjem matrike pet krat pet z matriko štiri krat pet znižala prejšnji rekord 80 posameznih množenj na samo 76. Blestela je tudi pri večjih matrikah, saj je zmanjšala število izračunov, potrebnih za dva matrike enajst krat enajst od 919 do 896.

Z dokazom koncepta v roki se je ekipa preusmerila k praktični uporabi. Računalniški čipi so pogosto zasnovani za optimizacijo različnih izračunov - GPE za grafiko, na primer ali AI čipi za strojno učenje— in ujemanje algoritma z najprimernejšo strojno opremo poveča učinkovitost.

Tukaj je ekipa uporabila AlphaTensor za iskanje algoritmov za dva priljubljena čipa v strojnem učenju: NVIDIA V100 GPU in Google TPU. Skupaj so algoritmi, razviti z umetno inteligenco, povečali hitrost računanja za do 20 odstotkov.

Težko je reči, ali lahko AI pospeši tudi pametne telefone, prenosne računalnike ali druge vsakodnevne naprave. Vendar pa bi bil "ta razvoj zelo vznemirljiv, če bi ga lahko uporabili v praksi," je dejala dr. Virginia Williams z MIT-a. "Povečanje zmogljivosti bi izboljšalo veliko aplikacij."

Um AI

Kljub temu, da je AlphaTensor premagal najnovejši človeški rekord pri množenju matrik, ekipa DeepMind še ne zna pojasniti, zakaj.

"Z igranjem teh iger je pridobil to neverjetno intuicijo," je na tiskovni konferenci povedal znanstvenik in soavtor DeepMinda dr. Pushmeet Kohli.

Prav tako ni nujno, da so razvijajoči se algoritmi človek proti strojem.

Čeprav je AlphaTensor odskočna deska k hitrejšim algoritmom, bi lahko obstajali še hitrejši. "Ker mora svoje iskanje omejiti na algoritme določene oblike, bi lahko zgrešil druge vrste algoritmov, ki bi lahko bili učinkovitejši," sta zapisala Balog in Fawzi.

Morda bi še bolj zanimiva pot združevala človeško in strojno intuicijo. "Lepo bi bilo ugotoviti, ali ta nova metoda dejansko vključuje vse prejšnje, ali pa jih lahko združite in dobite nekaj še boljšega," je dejal Williams. Drugi strokovnjaki se strinjajo. Z bogastvom algoritmov, ki so jim na voljo, jih lahko znanstveniki začnejo secirati, da bi našli namige o tem, zakaj so rešitve AlphaTensor delovale in utirajo pot za naslednji preboj.

Avtorstvo slike: DeepMind

Časovni žig:

Več od Središče singularnosti