DeepMind AI One-Ups Matematicieni la un calcul crucial pentru calculul PlatoBlockchain Data Intelligence. Căutare verticală. Ai.

DeepMind AI One-Ups Matematicieni la un calcul crucial pentru calcul

DeepMind a făcut-o din nou.

După rezolvarea unei provocări fundamentale în biologie—prezice structura proteinelor-și descurcarea matematicii teoriei nodurilor, a avut ca scop un proces de calcul fundamental încorporat în mii de aplicații de zi cu zi. De la analizarea imaginilor la modelarea vremii sau chiar cercetând funcționarea interioară a rețelelor neuronale artificiale, IA ar putea teoretic accelera calculele într-o gamă largă de domenii, sporind eficiența, reducând în același timp consumul de energie și costurile.

Dar mai impresionant este cum au reusit. Algoritmul de doborâre de recorduri, numit AlphaTensor, este un spin-off al alphazero, care a învins jucătorii umani la șah și Go.

„Algoritmii au fost folosiți în civilizațiile lumii pentru a efectua operațiuni fundamentale de mii de ani.” scris coautorii Dr. Matej Balog și Alhussein Fawzi la DeepMind. „Cu toate acestea, descoperirea algoritmilor este foarte dificilă.”

AlphaTensor deschide o cale către o lume nouă în care AI proiectează programe care depășesc orice lucru pe care oamenii îl creează, în timp ce își îmbunătățește „creierul” mașinii.

„Această muncă împinge într-un teritoriu neexplorat prin utilizarea AI pentru o problemă de optimizare la care oamenii au lucrat de zeci de ani... soluțiile pe care le găsesc pot fi dezvoltate imediat pentru a îmbunătăți timpul de rulare de calcul”, a spus dr. Federico Levi, editor senior la Natură, Care publicat Studiul.

Introduceți înmulțirea matricei

Problema cu care se confruntă AlphaTensor este înmulțirea matricei. Dacă vă imaginați brusc rânduri și coloane de numere verzi care se derulează pe ecran, nu ești singur. În linii mari, o matrice este cam așa - o grilă de numere care reprezintă digital datele pe care le alegeți. Ar putea fi pixeli dintr-o imagine, frecvențele unui clip audio sau aspectul și acțiunile personajelor din jocurile video.

Înmulțirea cu matrice ia două grile de numere și se înmulțește una cu alta. Este un calcul adesea predat în liceu, dar este și esențial pentru sistemele de calcul. Aici, rândurile de numere dintr-o matrice sunt înmulțite cu coloanele din alta. Rezultatele generează un rezultat, de exemplu, o comandă pentru a mări sau a înclina vederea unei scene de joc video. Deși aceste calcule funcționează sub capotă, oricine folosește un telefon sau un computer depinde de rezultatele lor în fiecare zi.

Puteți vedea cum problema poate deveni extrem de dificilă, extrem de rapidă. Înmulțirea matricilor mari este incredibil de consumatoare de energie și timp. Fiecare pereche de numere trebuie înmulțită individual pentru a construi o nouă matrice. Pe măsură ce matricele cresc, problema devine rapid insuportabilă – chiar mai mult decât prezicerea celor mai bune mișcări de șah sau Go. Unii experți estimează că există mai multe moduri pentru a rezolva înmulțirea matricei decât numărul de atomi din univers.

În 1969, Volker Strassen, un matematician german, a arătat că există modalități de a tăia colțuri, tăind o rundă de înmulțire matrice două câte două din în total opt până la șapte. S-ar putea să nu sune impresionant, dar metoda lui Strassen a arătat că este posibil să depășim standardele de operațiuni de lungă durată - adică algoritmi - pentru multiplicarea matricei. Abordarea sa, algoritmul Strassen, a domnit ca cea mai eficientă abordare de peste 50 de ani.

Dar dacă există metode și mai eficiente? „Nimeni nu știe cel mai bun algoritm pentru rezolvarea acesteia”, dr. François Le Gall de la Universitatea Nagoya din Japonia, care nu a fost implicat în lucrare, a spus MIT Technology Review. „Este una dintre cele mai mari probleme deschise din informatică.”

Algoritmi de urmărire AI

Dacă intuiția umană se clătește, de ce să nu accesezi o minte mecanică?

În noul studiu, echipa DeepMind a transformat multiplicarea matricei într-un joc. Similar cu predecesorul său AlphaZero, AlphaTensor utilizează învățarea prin consolidare profundă, o metodă de învățare automată inspirată de modul în care creierul biologic învață. Aici, un agent AI (adesea o rețea neuronală artificială) interacționează cu mediul său pentru a rezolva o problemă în mai mulți pași. Dacă reușește, câștigă o „recompensă” – adică parametrii rețelei AI sunt actualizați, astfel încât este mai probabil să reușească din nou în viitor.

E ca și cum ai învăța să răsturnești o clătită. O mulțime vor cădea inițial pe podea, dar în cele din urmă rețelele tale neuronale vor învăța mișcările brațelor și mâinii pentru o răsturnare perfectă.

Terenul de antrenament pentru AlphaTensor este un fel de joc de societate 3D. Este, în esență, un puzzle pentru un jucător, aproximativ similar cu Sudoku. AI trebuie să înmulțească grile de numere în cei mai puțini pași posibili, alegând în același timp dintr-o multitudine de mișcări permise - peste un trilion dintre ele.

Aceste mișcări permise au fost proiectate meticulos în AlphaTensor. La o conferință de presă, coautorul Dr. Hussain Fawzi a explicat: „Formularea spațiului de descoperire algoritmică este foarte complicată... și mai greu este, cum putem naviga în acest spațiu.”

Cu alte cuvinte, când ne confruntăm cu o gamă uluitoare de opțiuni, cum le putem restrânge pentru a ne îmbunătăți șansele de a găsi acul în carul de fân? Și cum putem elabora cel mai bine o strategie pentru a ajunge la ac fără să săpăm prin întreg carul de fân?

Un truc pe care echipa a încorporat-o în AlphaTensor este o metodă numită căutare în arbore. Mai degrabă decât, metaforic vorbind, să sape la întâmplare prin carul de fân, aici AI-ul sondează „drumuri” care ar putea duce la un rezultat mai bun. Învățăturile intermediare ajută apoi AI să își planifice următoarea mișcare pentru a crește șansele de succes. Echipa a arătat, de asemenea, eșantioane de algoritm ale jocurilor de succes, cum ar fi învățarea unui copil mișcările de deschidere ale șahului. În cele din urmă, odată ce AI a descoperit mișcări valoroase, echipa i-a permis să reordoneze acele operațiuni pentru o învățare mai personalizată în căutarea unui rezultat mai bun.

Deschiderea unui teren nou

AlphaTensor a jucat bine. Într-o serie de teste, echipa a provocat AI să găsească cele mai eficiente soluții pentru matrice de până la cinci pe cinci, adică cu cinci numere fiecare pe rând sau coloană.

Algoritmul a redescoperit rapid hack-ul original al lui Strassen, dar apoi a depășit toate soluțiile concepute anterior de mintea umană. Testând AI cu diferite dimensiuni de matrice, AlphaTensor a găsit soluții mai eficiente pentru peste 70. „De fapt, AlphaTensor descoperă de obicei mii de algoritmi pentru fiecare dimensiune de matrice”, a spus echipa. „Este uluitor.”

Într-un caz, înmulțind o matrice de cinci cu cinci cu una de patru cu cinci, AI a redus recordul anterior de 80 de înmulțiri individuale la doar 76. De asemenea, a strălucit pe matrici mai mari, reducând numărul de calcule necesare pentru două. matrici unsprezece câte unsprezece de la 919 la 896.

Dovada de concept în mână, echipa sa îndreptat spre utilizarea practică. Cipurile de computer sunt adesea proiectate pentru a optimiza diferite calcule - GPU-uri pentru grafică, de exemplu, sau Cipuri AI pentru învățarea automată— și potrivirea unui algoritm cu cel mai potrivit hardware crește eficiența.

Aici, echipa a folosit AlphaTensor pentru a găsi algoritmi pentru două cipuri populare în învățarea automată: GPU-ul NVIDIA V100 și Google TPU. În total, algoritmii dezvoltați de AI au crescut viteza de calcul cu până la 20%.

Este greu de spus dacă AI poate accelera și smartphone-urile, laptopurile sau alte dispozitive de zi cu zi. Cu toate acestea, „această dezvoltare ar fi foarte interesantă dacă ar putea fi folosită în practică”, a spus dr. Virginia Williams de la MIT. „O creștere a performanței ar îmbunătăți o mulțime de aplicații.”

Mintea unui AI

În ciuda faptului că AlphaTensor a depășit cea mai recentă înregistrare umană pentru multiplicarea matricei, echipa DeepMind nu poate explica încă de ce.

„A dobândit această intuiție uimitoare jucând aceste jocuri”, a spus cercetătorul și coautorul DeepMind Dr. Pushmeet Kohli la o conferință de presă.

De asemenea, algoritmii în evoluție nu trebuie să fie om versus mașini.

În timp ce AlphaTensor este o piatră de temelie către algoritmi mai rapizi, ar putea exista și alții mai rapizi. „Deoarece trebuie să-și limiteze căutarea la algoritmi de o formă specifică, ar putea rata alte tipuri de algoritmi care ar putea fi mai eficienți”, au scris Balog și Fawzi.

Poate că o cale și mai intrigantă ar combina intuiția umană și cea mașină. „Ar fi frumos să ne dăm seama dacă această nouă metodă le înglobează de fapt pe toate cele anterioare sau dacă le puteți combina și obține ceva și mai bun.” a spus Williams. Alți experți sunt de acord. Având la dispoziție o mulțime de algoritmi, oamenii de știință pot începe să le disece pentru a găsi indicii despre ce a făcut ca soluțiile AlphaTensor să funcționeze, deschizând calea pentru următoarea descoperire.

Credit de imagine: DeepMind

Timestamp-ul:

Mai mult de la Singularity Hub