DeepMind AI One-Ups Μαθηματικοί σε έναν υπολογισμό ζωτικής σημασίας για τον υπολογισμό της νοημοσύνης δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

DeepMind AI One-Ups μαθηματικοί σε έναν υπολογισμό ζωτικής σημασίας για τους υπολογιστές

Η DeepMind το έκανε ξανά.

Μετά την επίλυση μιας θεμελιώδους πρόκλησης στη βιολογία—πρόβλεψη πρωτεϊνικής δομής-και ξεμπερδεύοντας τα μαθηματικά της θεωρίας των κόμβων, στοχεύει σε μια θεμελιώδη υπολογιστική διαδικασία ενσωματωμένη σε χιλιάδες καθημερινές εφαρμογές. Από την ανάλυση εικόνων έως μοντελοποίηση καιρού Ή ακόμα και διερευνώντας την εσωτερική λειτουργία των τεχνητών νευρωνικών δικτύων, η τεχνητή νοημοσύνη θα μπορούσε θεωρητικά να επιταχύνει τους υπολογισμούς σε μια σειρά πεδίων, αυξάνοντας την απόδοση, μειώνοντας παράλληλα τη χρήση ενέργειας και το κόστος.

Αλλά πιο εντυπωσιακό είναι πως τα κατάφεραν. Ο αλγόριθμος που σπάει ρεκόρ, που ονομάστηκε AlphaTensor, είναι ένα spinoff του αλφαμηδέν, που κατατρόπωσε τους ανθρώπους παίκτες στο σκάκι και το Go.

«Οι αλγόριθμοι έχουν χρησιμοποιηθεί σε όλους τους πολιτισμούς του κόσμου για την εκτέλεση θεμελιωδών λειτουργιών εδώ και χιλιάδες χρόνια». Έγραψε συν-συγγραφείς Δρ. Οι Matej Balog και Alhussein Fawzi στο DeepMind. "Ωστόσο, η ανακάλυψη αλγορίθμων είναι πολύ δύσκολη."

Το AlphaTensor ανοίγει ένα μονοπάτι σε έναν νέο κόσμο όπου η τεχνητή νοημοσύνη σχεδιάζει προγράμματα που ξεπερνούν ό,τι έχει να κάνει με τους ανθρώπους, ενώ ταυτόχρονα βελτιώνει τον δικό της «εγκέφαλο» της μηχανής.

«Αυτή η εργασία ωθεί σε αχαρτογράφητη περιοχή χρησιμοποιώντας την τεχνητή νοημοσύνη για ένα πρόβλημα βελτιστοποίησης που οι άνθρωποι έχουν εργαστεί για δεκαετίες… οι λύσεις που βρίσκει μπορούν να αναπτυχθούν αμέσως για τη βελτίωση των υπολογιστικών χρόνων εκτέλεσης», δήλωσε ο Δρ. Federico Levi, ανώτερος συντάκτης στο Φύση, Το οποίο δημοσιεύθηκε η μελέτη.

Εισαγάγετε τον πολλαπλασιασμό μήτρας

Το πρόβλημα που αντιμετωπίζει το AlphaTensor είναι ο πολλαπλασιασμός του πίνακα. Αν ξαφνικά οραματίζεστε σειρές και στήλες πράσινων αριθμών να κινούνται προς τα κάτω στην οθόνη σας, δεν είστε μόνοι. Σε γενικές γραμμές, μια μήτρα είναι κάπως έτσι—ένα πλέγμα αριθμών που αναπαριστά ψηφιακά δεδομένα της επιλογής σας. Θα μπορούσε να είναι pixel σε μια εικόνα, οι συχνότητες ενός κλιπ ήχου ή η εμφάνιση και οι ενέργειες των χαρακτήρων σε βιντεοπαιχνίδια.

Ο πολλαπλασιασμός πίνακα παίρνει δύο πλέγματα αριθμών και πολλαπλασιάζει το ένα με το άλλο. Είναι ένας υπολογισμός που διδάσκεται συχνά στο γυμνάσιο, αλλά είναι επίσης κρίσιμος για τα υπολογιστικά συστήματα. Εδώ, οι σειρές αριθμών σε έναν πίνακα πολλαπλασιάζονται με στήλες σε έναν άλλο. Τα αποτελέσματα δημιουργούν ένα αποτέλεσμα—για παράδειγμα, μια εντολή για μεγέθυνση ή κλίση της προβολής μιας σκηνής βιντεοπαιχνιδιού. Αν και αυτοί οι υπολογισμοί λειτουργούν κάτω από την κουκούλα, όποιος χρησιμοποιεί τηλέφωνο ή υπολογιστή εξαρτάται από τα αποτελέσματά του κάθε μέρα.

Μπορείτε να δείτε πώς το πρόβλημα μπορεί να γίνει εξαιρετικά δύσκολο, εξαιρετικά γρήγορα. Ο πολλαπλασιασμός μεγάλων πινάκων απαιτεί απίστευτη ένταση ενέργειας και χρόνου. Κάθε ζεύγος αριθμών πρέπει να πολλαπλασιαστεί ξεχωριστά για να κατασκευαστεί ένας νέος πίνακας. Καθώς οι πίνακες μεγαλώνουν, το πρόβλημα γίνεται γρήγορα αβάσιμο - ακόμη περισσότερο από την πρόβλεψη των καλύτερων κινήσεων σκάκι ή Go. Ορισμένοι ειδικοί εκτιμούν ότι υπάρχουν περισσότερους τρόπους να λύσει τον πολλαπλασιασμό μήτρας από τον αριθμό των ατόμων στο σύμπαν.

Πίσω στο 1969, ο Volker Strassen, ένας Γερμανός μαθηματικός, έδειξε ότι υπάρχουν τρόποι να κοπούν οι γωνίες, μειώνοντας έναν γύρο πολλαπλασιασμού μήτρας δύο προς δύο από συνολικά οκτώ έως επτά. Μπορεί να μην ακούγεται εντυπωσιακό, αλλά η μέθοδος του Strassen έδειξε ότι είναι δυνατό να ξεπεραστούν τα μακροχρόνια πρότυπα πράξεων - δηλαδή, οι αλγόριθμοι - για τον πολλαπλασιασμό πινάκων. Η προσέγγισή του, ο αλγόριθμος Strassen, βασιλεύει ως η πιο αποτελεσματική προσέγγιση για περισσότερα από 50 χρόνια.

Τι γίνεται όμως αν υπάρχουν ακόμη πιο αποτελεσματικές μέθοδοι; «Κανείς δεν ξέρει τον καλύτερο αλγόριθμο για την επίλυσή του», είπε ο Δρ François Le Gall στο Πανεπιστήμιο Nagoya στην Ιαπωνία, ο οποίος δεν συμμετείχε στην εργασία, είπε MIT Technology Review. "Είναι ένα από τα μεγαλύτερα ανοιχτά προβλήματα στην επιστήμη των υπολογιστών."

AI Chasing Algorithms

Εάν η ανθρώπινη διαίσθηση παραπαίει, γιατί να μην αξιοποιήσετε ένα μηχανικό μυαλό;

Στη νέα μελέτη, η ομάδα του DeepMind μετέτρεψε τον πολλαπλασιασμό μήτρας σε παιχνίδι. Παρόμοια με τον προκάτοχό του AlphaZero, το AlphaTensor χρησιμοποιεί βαθιά ενισχυτική μάθηση, μια μέθοδο μηχανικής μάθησης εμπνευσμένη από τον τρόπο με τον οποίο μαθαίνουν οι βιολογικοί εγκέφαλοι. Εδώ, ένας πράκτορας AI (συχνά ένα τεχνητό νευρωνικό δίκτυο) αλληλεπιδρά με το περιβάλλον του για να λύσει ένα πρόβλημα πολλαπλών βημάτων. Εάν πετύχει, κερδίζει μια «ανταμοιβή»—δηλαδή, οι παράμετροι δικτύου του AI ενημερώνονται, ώστε να είναι πιο πιθανό να πετύχει ξανά στο μέλλον.

Είναι σαν να μαθαίνεις να γυρίζεις μια τηγανίτα. Αρχικά θα πέσουν πολλά στο πάτωμα, αλλά τελικά τα νευρωνικά σας δίκτυα θα μάθουν τις κινήσεις των χεριών και των χεριών για μια τέλεια ανατροπή.

Το γήπεδο εκπαίδευσης για το AlphaTensor είναι ένα είδος τρισδιάστατου επιτραπέζιου παιχνιδιού. Είναι ουσιαστικά ένα παζλ για έναν παίκτη περίπου παρόμοιο με το Sudoku. Η τεχνητή νοημοσύνη πρέπει να πολλαπλασιάζει πλέγματα αριθμών με τα λιγότερα δυνατά βήματα, ενώ επιλέγει από μια μυριάδα επιτρεπόμενων κινήσεων—πάνω από ένα τρισεκατομμύριο από αυτές.

Αυτές οι επιτρεπόμενες κινήσεις σχεδιάστηκαν σχολαστικά στο AlphaTensor. Σε μια ενημέρωση Τύπου, ο συν-συγγραφέας Δρ. Hussain Fawzi εξήγησε: «Η διαμόρφωση του χώρου της αλγοριθμικής ανακάλυψης είναι πολύ περίπλοκη… ακόμα πιο δύσκολο είναι πώς μπορούμε να πλοηγηθούμε σε αυτόν τον χώρο».

Με άλλα λόγια, όταν αντιμετωπίζουμε μια συγκλονιστική σειρά επιλογών, πώς μπορούμε να τις περιορίσουμε για να βελτιώσουμε τις πιθανότητές μας να βρούμε τη βελόνα στα άχυρα; Και πώς μπορούμε να σχεδιάσουμε καλύτερα τη στρατηγική για να φτάσουμε στη βελόνα χωρίς να σκάψουμε ολόκληρη τη θημωνιά;

Ένα κόλπο που ενσωμάτωσε η ομάδα στο AlphaTensor είναι μια μέθοδος που ονομάζεται αναζήτηση δέντρου. Αντί, μεταφορικά μιλώντας, να σκάβουν τυχαία τη θημωνιά, εδώ η τεχνητή νοημοσύνη εξετάζει «δρόμους» που θα μπορούσαν να οδηγήσουν σε καλύτερο αποτέλεσμα. Οι ενδιάμεσες γνώσεις στη συνέχεια βοηθούν το AI να σχεδιάσει την επόμενη κίνησή του για να ενισχύσει τις πιθανότητες επιτυχίας. Η ομάδα έδειξε επίσης δείγματα αλγορίθμου επιτυχημένων παιχνιδιών, όπως να διδάξει σε ένα παιδί τις αρχικές κινήσεις του σκακιού. Τέλος, μόλις η τεχνητή νοημοσύνη ανακάλυψε πολύτιμες κινήσεις, η ομάδα της επέτρεψε να αναδιατάξει αυτές τις λειτουργίες για πιο προσαρμοσμένη μάθηση σε αναζήτηση καλύτερου αποτελέσματος.

Σπάζοντας νέα γη

Το AlphaTensor έπαιξε καλά. Σε μια σειρά δοκιμών, η ομάδα προκάλεσε την τεχνητή νοημοσύνη να βρει τις πιο αποτελεσματικές λύσεις για πίνακες έως πέντε επί πέντε — δηλαδή, με πέντε αριθμούς ο καθένας σε μια σειρά ή στήλη.

Ο αλγόριθμος ανακάλυψε ξανά γρήγορα το αρχικό hack του Strassen, αλλά στη συνέχεια ξεπέρασε όλες τις λύσεις που είχε επινοήσει προηγουμένως το ανθρώπινο μυαλό. Δοκιμάζοντας το AI με διαφορετικά μεγέθη πινάκων, το AlphaTensor βρήκε πιο αποτελεσματικές λύσεις για πάνω από 70. «Στην πραγματικότητα, το AlphaTensor ανακαλύπτει συνήθως χιλιάδες αλγόριθμους για κάθε μέγεθος πίνακα», είπε η ομάδα. «Είναι συγκλονιστικό».

Σε μια περίπτωση, πολλαπλασιάζοντας έναν πίνακα πέντε επί πέντε με έναν πίνακα τέσσερα επί πέντε, η τεχνητή νοημοσύνη μείωσε το προηγούμενο ρεκόρ των 80 μεμονωμένων πολλαπλασιασμών σε μόνο 76. Έλαμψε επίσης σε μεγαλύτερους πίνακες, μειώνοντας τον αριθμό των υπολογισμών που απαιτούνται για δύο έντεκα επί έντεκα πίνακες από 919 έως 896.

Απόδειξη της ιδέας, η ομάδα στράφηκε στην πρακτική χρήση. Τα τσιπ υπολογιστών είναι συχνά σχεδιασμένα για να βελτιστοποιούν διαφορετικούς υπολογισμούς—για παράδειγμα GPU για γραφικά ή Τσιπ AI για μηχανική μάθηση—και η αντιστοίχιση ενός αλγόριθμου με το καταλληλότερο υλικό αυξάνει την απόδοση.

Εδώ, η ομάδα χρησιμοποίησε το AlphaTensor για να βρει αλγόριθμους για δύο δημοφιλή τσιπ στη μηχανική εκμάθηση: την GPU NVIDIA V100 και το Google TPU. Συνολικά, οι αλγόριθμοι που αναπτύχθηκαν από το AI αύξησαν την υπολογιστική ταχύτητα έως και 20%.

Είναι δύσκολο να πούμε εάν το AI μπορεί επίσης να επιταχύνει smartphone, φορητούς υπολογιστές ή άλλες καθημερινές συσκευές. Ωστόσο, «αυτή η εξέλιξη θα ήταν πολύ συναρπαστική αν μπορούσε να χρησιμοποιηθεί στην πράξη», δήλωσε η Δρ Βιρτζίνια Γουίλιαμς του MIT. "Μια ώθηση στην απόδοση θα βελτίωνε πολλές εφαρμογές."

Το μυαλό ενός AI

Παρά το γεγονός ότι το AlphaTensor κατατρόπωσε το πιο πρόσφατο ανθρώπινο ρεκόρ πολλαπλασιασμού μήτρας, η ομάδα του DeepMind δεν μπορεί ακόμη να εξηγήσει γιατί.

«Έχει αυτή την καταπληκτική διαίσθηση παίζοντας αυτά τα παιχνίδια», είπε ο επιστήμονας και συν-συγγραφέας του DeepMind, Δρ Pushmeet Kohli σε μια ενημέρωση τύπου.

Οι εξελισσόμενοι αλγόριθμοι επίσης δεν χρειάζεται να είναι ο άνθρωπος εναντίον των μηχανών.

Ενώ ο AlphaTensor είναι ένα σκαλοπάτι προς ταχύτερους αλγόριθμους, θα μπορούσαν να υπάρχουν ακόμα πιο γρήγοροι. «Επειδή πρέπει να περιορίσει την αναζήτησή του σε αλγόριθμους συγκεκριμένης μορφής, θα μπορούσε να χάσει άλλους τύπους αλγορίθμων που μπορεί να είναι πιο αποτελεσματικοί», έγραψαν οι Balog και Fawzi.

Ίσως ένα ακόμη πιο ενδιαφέρον μονοπάτι θα συνδύαζε ανθρώπινη και μηχανή διαίσθηση. «Θα ήταν ωραίο να καταλάβουμε αν αυτή η νέα μέθοδος περιλαμβάνει πραγματικά όλες τις προηγούμενες ή αν μπορείτε να τις συνδυάσετε και να αποκτήσετε κάτι ακόμα καλύτερο». είπε Ουίλιαμς. Άλλοι ειδικοί συμφωνούν. Με έναν πλούτο αλγορίθμων στη διάθεσή τους, οι επιστήμονες μπορούν να αρχίσουν να τους αναλύουν για ενδείξεις σχετικά με το τι έκανε τις λύσεις του AlphaTensor, ανοίγοντας το δρόμο για την επόμενη σημαντική ανακάλυψη.

Πιστωτική εικόνα: DeepMind

Σφραγίδα ώρας:

Περισσότερα από Κέντρο μοναδικότητας