DeepMind AI One-Ups matematikusok a PlatoBlockchain adatintelligencia számítása szempontjából kulcsfontosságú számításnál. Függőleges keresés. Ai.

DeepMind AI One-Ups matematikusok a számítástechnika szempontjából kulcsfontosságú számításoknál

A DeepMind ismét megtette.

Egy alapvető biológia kihívás megoldása utána fehérje szerkezetének előrejelzése-és a csomóelmélet matematikájának kibogozása, célja egy alapvető számítási folyamat, amely több ezer mindennapi alkalmazásba van beágyazva. A képek elemzésétől a időjárás modellezése vagy akár a mesterséges neurális hálózatok belső működését vizsgálva, az AI elméletileg felgyorsíthatja a számításokat számos területen, növelve a hatékonyságot, miközben csökkenti az energiafelhasználást és a költségeket.

De lenyűgözőbb hogyan megcsinálták. Az AlphaTensor névre keresztelt rekordot döntő algoritmus egy spinoffja alfanulla, amely híresen legyőzte az emberi játékosokat a sakkban és a Go-ban.

"A világ civilizációiban már évezredek óta használják az algoritmusokat alapvető műveletek elvégzésére" írt társszerzők Drs. Matej Balog és Alhussein Fawzi a DeepMindnél. "Az algoritmusok felfedezése azonban nagy kihívást jelent."

Az AlphaTensor egy új világba vezet, ahol a mesterséges intelligencia olyan programokat tervez, amelyek felülmúlják az emberi mérnökök teljesítményét, miközben fejleszti saját gépi „agyát”.

"Ez a munka feltérképezetlen területekre sodorja az AI-t egy olyan optimalizálási probléma megoldására, amelyen az emberek évtizedek óta dolgoznak... a talált megoldások azonnal kifejleszthetők a számítási futási idők javítása érdekében" - mondta Dr. Federico Levi, a vállalat vezető szerkesztője. Természet, Amely közzétett a tanulmány.

Írja be a mátrixszorzást

Az AlphaTensor problémája a mátrixszorzás. Ha hirtelen azt képzeli, hogy zöld számok sorai és oszlopai gördülnek lefelé a képernyőn, nem vagy egyedül. Durván szólva a mátrix egyfajta ilyen – egy számrács, amely digitálisan reprezentálja az Ön által választott adatokat. Lehetnek képpontok a képen, egy hangklip frekvenciája, vagy a karakterek megjelenése és cselekvései a videojátékokban.

A mátrixszorzás két számrácsot vesz fel, és szorozza meg egymást. Ez egy olyan számítás, amelyet gyakran tanítanak a középiskolában, de kritikus a számítástechnikai rendszerek számára is. Itt az egyik mátrixban lévő számsorok megszorozódnak egy másik mátrixban lévő oszlopokkal. Az eredmények eredményt generálnak – például egy parancsot a videojáték-jelenet nézetének nagyítására vagy döntésére. Bár ezek a számítások a motorháztető alatt működnek, bárki, aki telefont vagy számítógépet használ, minden egyes nap az eredményeitől függ.

Láthatja, hogy a probléma rendkívül nehézzé, rendkívül gyorsan válhat. A nagy mátrixok szorzása hihetetlenül energia- és időigényes. Minden számpárt külön-külön meg kell szorozni egy új mátrix létrehozásához. Ahogy a mátrixok nőnek, a probléma gyorsan tarthatatlanná válik – még inkább, mint a legjobb sakk vagy a Go lépések előrejelzése. Egyes szakértők szerint vannak ilyenek több módon hogy megoldja a mátrixszorzást, mint az univerzum atomjainak száma.

Volker Strassen, egy német matematikus még 1969-ben megmutatta, hogy vannak módok a sarkok levágására, és egy kört levágott a kettő-kettő mátrixszorzásból. összesen nyolc-hét. Lehet, hogy nem hangzik lenyűgözően, de Strassen módszere megmutatta, hogy a mátrixszorzásnál meg lehet győzni a műveletek – azaz az algoritmusok – régóta fennálló szabványait. Az ő megközelítése, a Strassen-algoritmus a leghatékonyabb megközelítésként uralkodik több mint 50 éve.

De mi van, ha léteznek még hatékonyabb módszerek? „Senki sem ismeri a megoldás legjobb algoritmusát” – mondta Dr. François Le Gall a japán Nagoya Egyetemről, aki nem vett részt a munkában. mondta MIT Technology Review. "Ez az egyik legnagyobb nyitott probléma a számítástechnikában."

AI Chasing Algorithms

Ha az emberi intuíció tántorog, miért nem nyúl a mechanikus elméhez?

Az új tanulmányban a DeepMind csapata a mátrixszorzást játékká változtatta. Az AlphaZero elődjéhez hasonlóan az AlphaTensor is mély megerősítő tanulást alkalmaz, egy olyan gépi tanulási módszert, amelyet a biológiai agy tanulási módja ihletett. Itt egy AI-ügynök (gyakran mesterséges neurális hálózat) kölcsönhatásba lép a környezetével, hogy megoldjon egy többlépcsős problémát. Ha ez sikerül, akkor „jutalmat” kap – vagyis frissítik az AI hálózati paramétereit, így nagyobb valószínűséggel sikerül a jövőben is.

Mintha megtanulnánk palacsintát felfordítani. Kezdetben sok hullik a padlóra, de végül a neurális hálózatok megtanulják a kar- és kézmozdulatokat a tökéletes átfordítás érdekében.

Az AlphaTensor edzőtere egyfajta 3D-s társasjáték. Ez lényegében egy egyjátékos rejtvény, nagyjából hasonló a Sudokuhoz. Az AI-nak a lehető legkevesebb lépésben meg kell szoroznia a számrácsokat, miközben számtalan megengedett lépés közül kell választania – több mint billiójuk közül.

Ezeket a megengedett mozgásokat aprólékosan megtervezték az AlphaTensorban. Egy sajtótájékoztatón Dr. Hussain Fawzi társszerző kifejtette: „Az algoritmikus felfedezés terének megfogalmazása nagyon bonyolult… még nehezebb, hogyan tudunk eligazodni ezen a téren.”

Más szóval, amikor a lehetőségek elképesztő tárházával kell szembenéznünk, hogyan szűkíthetjük le azokat, hogy növeljük esélyeinket, hogy megtaláljuk a tűt a szénakazalban? És hogyan alakíthatjuk ki a legjobban a tűhöz való eljutást anélkül, hogy átásnánk az egész szénakazalt?

Az egyik trükk, amelyet a csapat beépített az AlphaTensorba, a fakeresésnek nevezett módszer. Ahelyett, hogy metaforikusan szólva véletlenszerűen átásnák a szénakazalt, itt az AI olyan „utakat” vizsgál, amelyek jobb eredményhez vezethetnek. A közbenső ismeretek aztán segítenek az MI-nek megtervezni a következő lépését, hogy növelje a siker esélyeit. A csapat bemutatta a sikeres játékok algoritmusmintáit is, például a sakk nyitólépéseinek megtanítását. Végül, miután a mesterséges intelligencia értékes mozdulatokat fedezett fel, a csapat lehetővé tette számára, hogy átrendezze ezeket a műveleteket, hogy jobban testre szabott tanulási eredményeket érjen el a jobb eredmény érdekében.

Új föld törése

Az AlphaTensor jól játszott. Egy sor teszt során a csapat kihívást jelentett az MI-nek, hogy találja meg a leghatékonyabb megoldásokat legfeljebb ötszer-öt mátrixokhoz – azaz öt számmal egy sorban vagy oszlopban.

Az algoritmus gyorsan újra felfedezte Strassen eredeti feltörését, de aztán felülmúlta az emberi elme által korábban kitalált összes megoldást. A mesterséges intelligencia különböző méretű mátrixaival történő tesztelése során az AlphaTensor hatékonyabb megoldásokat talált több mint 70 számára. „Valójában az AlphaTensor általában több ezer algoritmust fedez fel minden mátrixmérethez” – mondta a csapat. – Elképesztő.

Egy esetben az MI egy ötös mátrixot négyszer öttel szorozva csökkentette a 80 egyéni szorzás korábbi rekordját, mindössze 76-ra. Nagyobb mátrixokra is fénylett, csökkentve a kettőhöz szükséges számítások számát. tizenegyszer tizenegy mátrix 919-től 896-ig.

A koncepció bizonyításával a csapat a gyakorlati használat felé fordult. A számítógépes chipeket gyakran úgy tervezték, hogy optimalizálják a különböző számításokat – például a grafikus GPU-kat, vagy AI chipek gépi tanuláshoz– és az algoritmusnak a legmegfelelőbb hardverrel való egyeztetése növeli a hatékonyságot.

Itt a csapat az AlphaTensor segítségével algoritmust keresett a gépi tanulásban két népszerű chiphez: az NVIDIA V100 GPU-hoz és a Google TPU-hoz. Összességében az AI által kifejlesztett algoritmusok akár 20 százalékkal is megnövelték a számítási sebességet.

Nehéz megmondani, hogy az AI felgyorsíthatja-e az okostelefonokat, laptopokat vagy más mindennapi eszközöket. Azonban „ez a fejlesztés nagyon izgalmas lenne, ha a gyakorlatban is használható lenne” – mondta Dr. Virginia Williams, az MIT munkatársa. "A teljesítmény növelése sok alkalmazást javítana."

Egy mesterséges intelligencia elméje

Annak ellenére, hogy az AlphaTensor megdöntötte a mátrixszorzás legújabb emberi rekordját, a DeepMind csapata még nem tudja megmagyarázni, miért.

„Ezzel a játékkal elképesztő intuícióra tett szert” – mondta a DeepMind tudósa és társszerzője, Dr. Pushmeet Kohli egy sajtótájékoztatón.

A fejlődő algoritmusoknak nem kell az ember versus gépeknek lennie.

Míg az AlphaTensor egy lépcsőfok a gyorsabb algoritmusok felé, létezhetnek még gyorsabbak is. „Mivel a keresést meghatározott formájú algoritmusokra kell korlátoznia, kihagyhat más típusú algoritmusokat, amelyek hatékonyabbak lehetnek” – írta Balog és Fawzi.

Talán egy még érdekesebb út egyesítené az emberi és a gépi intuíciót. "Jó lenne rájönni, hogy ez az új módszer valóban magában foglalja-e az összes korábbit, vagy kombinálhatja őket, és még jobbat kaphat" mondott Williams. Más szakértők egyetértenek. Rengeteg algoritmus áll rendelkezésükre, így a tudósok elkezdhetik boncolgatni azokat, hogy megtudják, mi okozta az AlphaTensor megoldásait, így előkészítve az utat a következő áttöréshez.

A kép forrása: DeepMind

Időbélyeg:

Még több Singularity Hub