Ο Επιστήμονας Υπολογιστών Προκαλεί την Τεχνητή Νοημοσύνη να μάθει καλύτερα τη νοημοσύνη δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

The Computer Scientist Challening AI to Learn Better

Οι αλγόριθμοι τεχνητής νοημοσύνης έχουν σχεδιαστεί για να μαθαίνουν εναρμονισμένα. Αντί να ενημερώνουν συνεχώς τη βάση γνώσεων τους με νέες πληροφορίες με την πάροδο του χρόνου όπως κάνουν οι άνθρωποι, οι αλγόριθμοι μπορούν να μάθουν μόνο κατά τη φάση της εκπαίδευσης. Μετά από αυτό, οι γνώσεις τους παραμένουν παγωμένες. εκτελούν την εργασία για την οποία εκπαιδεύτηκαν χωρίς να μπορούν να συνεχίσουν να μαθαίνουν καθώς το κάνουν. Για να μάθετε έστω και ένα νέο πράγμα, οι αλγόριθμοι πρέπει να εκπαιδεύονται ξανά από την αρχή. Λες και κάθε φορά που γνωρίζατε ένα νέο άτομο, ο μόνος τρόπος που θα μπορούσατε να μάθετε το όνομά του θα ήταν να επανεκκινήσετε τον εγκέφαλό σας.

Η εκπαίδευση από το μηδέν μπορεί να οδηγήσει σε μια συμπεριφορά γνωστή ως καταστροφική λήθη, όπου ένα μηχάνημα ενσωματώνει νέα γνώση με κόστος να ξεχάσει σχεδόν όλα όσα έχει ήδη μάθει. Αυτή η κατάσταση προκύπτει λόγω του τρόπου με τον οποίο οι πιο ισχυροί αλγόριθμοι τεχνητής νοημοσύνης σήμερα, που ονομάζονται νευρωνικά δίκτυα, μαθαίνουν νέα πράγματα.

Αυτοί οι αλγόριθμοι βασίζονται χαλαρά στον εγκέφαλό μας, όπου η μάθηση περιλαμβάνει την αλλαγή της ισχύος των συνδέσεων μεταξύ των νευρώνων. Αλλά αυτή η διαδικασία γίνεται δύσκολη. Οι νευρωνικές συνδέσεις αντιπροσωπεύουν επίσης γνώσεις του παρελθόντος, επομένως η υπερβολική τους αλλαγή θα προκαλέσει τη λήθη.

Τα βιολογικά νευρωνικά δίκτυα έχουν εξελίξει στρατηγικές για εκατοντάδες εκατομμύρια χρόνια για να διασφαλίσουν ότι οι σημαντικές πληροφορίες παραμένουν σταθερές. Όμως τα σημερινά τεχνητά νευρωνικά δίκτυα αγωνίζονται να επιτύχουν μια καλή ισορροπία μεταξύ της νέας και της παλιάς γνώσης. Οι συνδέσεις τους αντικαθίστανται πολύ εύκολα όταν το δίκτυο βλέπει νέα δεδομένα, γεγονός που μπορεί να οδηγήσει σε ξαφνική και σοβαρή αποτυχία αναγνώρισης προηγούμενων πληροφοριών.

Για να βοηθήσει στην αντιμετώπιση αυτού, Κρίστοφερ Κανάν, ένας 41χρονος επιστήμονας υπολογιστών στο Πανεπιστήμιο του Ρότσεστερ, βοήθησε στη δημιουργία ενός νέου πεδίου έρευνας για την τεχνητή νοημοσύνη, γνωστό ως συνεχής μάθηση. Στόχος του είναι η τεχνητή νοημοσύνη να συνεχίσει να μαθαίνει νέα πράγματα από συνεχείς ροές δεδομένων και να το κάνει χωρίς να ξεχνάει όλα όσα προηγήθηκαν.

Ο Kanan έπαιζε με τη νοημοσύνη των μηχανών σχεδόν όλη του τη ζωή. Ως παιδί στην επαρχία της Οκλαχόμα που ήθελε απλώς να διασκεδάσει με μηχανές, έμαθε στα bots να παίζουν πρώιμα παιχνίδια υπολογιστή για πολλούς παίκτες. Αυτό τον έκανε να αναρωτηθεί για τη δυνατότητα της τεχνητής γενικής νοημοσύνης - μια μηχανή με την ικανότητα να σκέφτεται σαν άνθρωπος από κάθε άποψη. Αυτό τον έκανε να ενδιαφέρεται για το πώς λειτουργούν τα μυαλά και σπούδασε στη φιλοσοφία και την επιστήμη των υπολογιστών στο State University της Οκλαχόμα προτού οι μεταπτυχιακές του σπουδές τον οδηγήσουν στο Πανεπιστήμιο της Καλιφόρνια στο Σαν Ντιέγκο.

Τώρα ο Kanan βρίσκει έμπνευση όχι μόνο στα βιντεοπαιχνίδια, αλλά και στο να βλέπει τη σχεδόν 2χρονη κόρη του να μαθαίνει για τον κόσμο, με κάθε νέα μαθησιακή εμπειρία να βασίζεται στην τελευταία. Λόγω του έργου του και των άλλων, η καταστροφική λήθη δεν είναι πλέον τόσο καταστροφική.

Quanta μίλησε με τον Kanan για τις μνήμες μηχανών, για την παραβίαση των κανόνων εκπαίδευσης των νευρωνικών δικτύων και για το αν η τεχνητή νοημοσύνη θα επιτύχει ποτέ μάθηση σε ανθρώπινο επίπεδο. Η συνέντευξη έχει συμπυκνωθεί και επεξεργαστεί για λόγους σαφήνειας.

Πώς επηρεάζει η εκπαίδευσή σας στη φιλοσοφία τον τρόπο που σκέφτεστε τη δουλειά σας;

Με έχει εξυπηρετήσει πολύ καλά ως ακαδημαϊκός. Η φιλοσοφία σας διδάσκει: «Πώς προβάλλεις αιτιολογημένα επιχειρήματα» και «Πώς αναλύεις τα επιχειρήματα των άλλων;» Είναι πολλά από αυτά που κάνετε στην επιστήμη. Έχω ακόμα δοκίμια από τότε για τις αποτυχίες του τεστ Τούρινγκ και τέτοια πράγματα. Και έτσι αυτά τα πράγματα τα σκέφτομαι ακόμα πολύ.

Το εργαστήριό μου έχει εμπνευστεί κάνοντας την ερώτηση: Λοιπόν, αν δεν μπορούμε να κάνουμε το Χ, πώς θα μπορέσουμε να κάνουμε το Υ; Μαθαίνουμε με τον καιρό, αλλά τα νευρωνικά δίκτυα, γενικά, όχι. Τους εκπαιδεύεις μια φορά. Είναι μια σταθερή οντότητα μετά από αυτό. Και αυτό είναι ένα θεμελιώδες πράγμα που θα έπρεπε να λύσετε εάν θέλετε να δημιουργήσετε μια τεχνητή γενική νοημοσύνη μια μέρα. Εάν δεν μπορεί να μάθει χωρίς να ανακατέψει τον εγκέφαλό του και να ξαναρχίσει από την αρχή, δεν πρόκειται πραγματικά να φτάσεις εκεί, σωστά; Αυτή είναι μια προαπαιτούμενη ικανότητα για μένα.

Πώς αντιμετώπισαν μέχρι τώρα οι ερευνητές την καταστροφική λήθη;

Η πιο επιτυχημένη μέθοδος, που ονομάζεται επανάληψη, αποθηκεύει προηγούμενες εμπειρίες και στη συνέχεια τις επαναλαμβάνει κατά τη διάρκεια της προπόνησης με νέα παραδείγματα, ώστε να μην χαθούν. Είναι εμπνευσμένο από την εδραίωση της μνήμης στον εγκέφαλό μας, όπου κατά τη διάρκεια του ύπνου οι κωδικοποιήσεις υψηλού επιπέδου των δραστηριοτήτων της ημέρας «αναπαράγονται» καθώς οι νευρώνες επανενεργοποιούνται.

Με άλλα λόγια, για τους αλγόριθμους, η νέα μάθηση δεν μπορεί να εξαλείψει εντελώς την προηγούμενη μάθηση, καθώς αναμιγνύουμε αποθηκευμένες προηγούμενες εμπειρίες.

Υπάρχουν τρία στυλ για να το κάνετε αυτό. Το πιο κοινό στυλ είναι η «επαληθευμένη επανάληψη», όπου οι ερευνητές αποθηκεύουν ένα υποσύνολο των ακατέργαστων εισόδων - για παράδειγμα, τις αρχικές εικόνες για μια εργασία αναγνώρισης αντικειμένων - και στη συνέχεια αναμιγνύουν αυτές τις αποθηκευμένες εικόνες από το παρελθόν με νέες εικόνες προς εκμάθηση. Η δεύτερη προσέγγιση επαναλαμβάνει συμπιεσμένες αναπαραστάσεις των εικόνων. Μια τρίτη πολύ λιγότερο κοινή μέθοδος είναι η «γεννητική επανάληψη». Εδώ, ένα τεχνητό νευρωνικό δίκτυο δημιουργεί στην πραγματικότητα μια συνθετική εκδοχή μιας προηγούμενης εμπειρίας και στη συνέχεια αναμιγνύει αυτό το συνθετικό παράδειγμα με νέα παραδείγματα. Το εργαστήριό μου έχει επικεντρωθεί στις δύο τελευταίες μεθόδους.

Δυστυχώς, όμως, η επανάληψη δεν είναι μια πολύ ικανοποιητική λύση.

Γιατί όχι;

Για να μάθει κάτι νέο, το νευρωνικό δίκτυο πρέπει να αποθηκεύσει τουλάχιστον κάποιες πληροφορίες για κάθε έννοια που έμαθε στο παρελθόν. Και από νευροεπιστημονική σκοπιά, η υπόθεση είναι ότι εσείς και εγώ έχουμε επαναλάβει μια σχετικά πρόσφατη εμπειρία - όχι κάτι που συνέβη στην παιδική μας ηλικία - για να αποτρέψουμε τη λήθη αυτής της πρόσφατης εμπειρίας. Ενώ με τον τρόπο που το κάνουμε στα βαθιά νευρωνικά δίκτυα, αυτό δεν είναι αλήθεια. Δεν χρειάζεται απαραίτητα να αποθηκεύει όλα όσα έχει δει, αλλά πρέπει να αποθηκεύει κάτι για κάθε εργασία που έμαθε στο παρελθόν για να χρησιμοποιεί την επανάληψη. Και δεν είναι σαφές τι πρέπει να αποθηκεύσει. Έτσι, η επανάληψη, όπως γίνεται σήμερα, εξακολουθεί να φαίνεται σαν να μην είναι μέχρι εκεί.

Εάν μπορούσαμε να λύσουμε εντελώς την καταστροφική λήθη, θα σήμαινε ότι η τεχνητή νοημοσύνη θα μπορούσε να μαθαίνει νέα πράγματα συνεχώς με την πάροδο του χρόνου;

Οχι ακριβώς. Νομίζω ότι τα μεγάλα, μεγάλα, μεγάλα ανοιχτά ερωτήματα στον τομέα της συνεχούς μάθησης δεν είναι σε καταστροφική λήθη. Αυτό που πραγματικά με ενδιαφέρει είναι: Πώς η προηγούμενη μάθηση κάνει πιο αποτελεσματική τη μελλοντική μάθηση; Και πώς η εκμάθηση κάτι στο μέλλον διορθώνει τις γνώσεις του παρελθόντος; Αυτά είναι πράγματα που δεν μετρούν πολλοί άνθρωποι, και νομίζω ότι αυτό είναι ένα κρίσιμο μέρος της προώθησης του γηπέδου, γιατί στην πραγματικότητα, δεν είναι απλώς να ξεχνάμε πράγματα. Είναι να γίνεις καλύτερος μαθητής.

Εκεί νομίζω ότι στο χωράφι λείπει κάπως το δάσος για τα δέντρα. Μεγάλο μέρος της κοινότητας θέτει το πρόβλημα με τρόπους που δεν ταιριάζουν ούτε με ενδιαφέρουσες βιολογικές ερωτήσεις ούτε με ενδιαφέρουσες εφαρμογές μηχανικής. Δεν μπορούμε απλώς να κάνουμε όλους το ίδιο πρόβλημα με τα παιχνίδια για πάντα. Πρέπει να πείτε: Ποιο είναι το γάντι μας; Πώς προωθούμε τα πράγματα;

Τότε γιατί πιστεύετε ότι οι περισσότεροι άνθρωποι εστιάζουν σε αυτά τα απλά προβλήματα;

Μπορώ μόνο να κάνω εικασίες. Οι περισσότερες εργασίες γίνονται από μαθητές που παρακολουθούν προηγούμενες εργασίες. Αντιγράφουν τη ρύθμιση του τι έχουν κάνει άλλοι και δείχνουν κάποια μικρά κέρδη στην απόδοση με τις ίδιες μετρήσεις. Η δημιουργία νέων αλγορίθμων είναι πιο πιθανό να οδηγήσει σε δημοσίευση, ακόμα κι αν αυτοί οι αλγόριθμοι δεν μας δίνουν πραγματικά τη δυνατότητα να κάνουμε σημαντική πρόοδο στη συνεχή μάθηση. Αυτό που με εκπλήσσει είναι ότι το ίδιο είδος εργασίας παράγεται από μεγάλες εταιρείες που δεν έχουν τα ίδια κίνητρα, εκτός από την εργασία που καθοδηγείται από πρακτικής άσκησης.

Επίσης, αυτό το έργο δεν είναι τετριμμένο. Πρέπει να καθιερώσουμε το σωστό πείραμα και την αλγοριθμική ρύθμιση για να μετρήσουμε εάν η προηγούμενη μάθηση βοηθά τη μελλοντική μάθηση. Το μεγάλο ζήτημα είναι ότι δεν έχουμε καλά σύνολα δεδομένων για τη μελέτη της συνεχούς μάθησης αυτή τη στιγμή. Εννοώ ότι βασικά λαμβάνουμε υπάρχοντα σύνολα δεδομένων που χρησιμοποιούνται στην παραδοσιακή μηχανική εκμάθηση και τα επανατοποθετούμε.

Ουσιαστικά, στο δόγμα της μηχανικής μάθησης (ή τουλάχιστον όποτε αρχίζω να διδάσκω μηχανική μάθηση), έχουμε ένα σετ εκπαίδευσης, έχουμε ένα σετ δοκιμών — προπονούμαστε στο σετ εκπαίδευσης, δοκιμάζουμε στο σετ δοκιμών. Η συνεχής μάθηση σπάει αυτούς τους κανόνες. Το σετ εκπαίδευσής σας γίνεται τότε κάτι που εξελίσσεται καθώς μαθαίνει ο εκπαιδευόμενος. Αλλά εξακολουθούμε να περιοριζόμαστε στα υπάρχοντα σύνολα δεδομένων. Πρέπει να δουλέψουμε σε αυτό. Χρειαζόμαστε ένα πραγματικά καλό περιβάλλον συνεχούς μάθησης στο οποίο μπορούμε πραγματικά να πιέσουμε τον εαυτό μας.

Πώς θα ήταν το ιδανικό περιβάλλον συνεχούς μάθησης;

Είναι πιο εύκολο να σου πω τι δεν είναι παρά τι είναι. Ήμουν σε ένα πάνελ όπου το προσδιορίσαμε ως κρίσιμο πρόβλημα, αλλά δεν νομίζω ότι κάποιος έχει αμέσως την απάντηση.

Μπορώ να σας πω τις ιδιότητες που μπορεί να έχει. Προς το παρόν, ας υποθέσουμε ότι οι αλγόριθμοι τεχνητής νοημοσύνης δεν είναι ενσωματωμένους πράκτορες σε προσομοιώσεις. Στη συνέχεια, τουλάχιστον, ιδανικά, μαθαίνουμε από βίντεο, ή κάτι τέτοιο, όπως πολυτροπικές ροές βίντεο, και ελπίζουμε να κάνουμε περισσότερα από την απλή ταξινόμηση [στατικών εικόνων].

Υπάρχουν πολλά ανοιχτά ερωτήματα σχετικά με αυτό. Ήμουν σε ένα εργαστήριο συνεχούς μάθησης πριν από μερικά χρόνια και μερικοί άνθρωποι σαν εμένα έλεγαν, «Πρέπει να σταματήσουμε να χρησιμοποιούμε ένα σύνολο δεδομένων που ονομάζεται MNIST, είναι πολύ απλό». Και τότε κάποιος είπε, "Εντάξει, ας κάνουμε σταδιακή εκμάθηση του [το βιντεοπαιχνίδι που βασίζεται σε στρατηγική] StarCraft." Και το κάνω αυτό και τώρα για διάφορους λόγους, αλλά δεν νομίζω ότι το κάνει πραγματικά ούτε αυτό. Η ζωή είναι πολύ πιο πλούσια από το να μάθεις να παίζεις StarCraft.

Πώς έχει προσπαθήσει το εργαστήριό σας να σχεδιάσει αλγόριθμους που μπορούν να συνεχίσουν να μαθαίνουν με την πάροδο του χρόνου;

Με τον πρώην μαθητή μου Tyler Hayes, εγώ πρωτοστάτησε σε ένα έργο συνεχούς μάθησης για αναλογικό συλλογισμό. Θεωρήσαμε ότι θα ήταν ένας καλός τομέας για να μελετήσουμε την ιδέα της μεταφοράς μάθησης, όπου αποκτάς δεξιότητες και τώρα πρέπει να χρησιμοποιείς πιο σύνθετες δεξιότητες για να λύνεις πιο περίπλοκα προβλήματα. Συγκεκριμένα, μετρήσαμε τη μεταφορά προς τα πίσω — πόσο καλά σας βοηθά η εκμάθηση κάτι στο παρελθόν στο μέλλον και το αντίστροφο. Και βρήκαμε καλά στοιχεία για μεταφορά, πολύ πιο σημαντικά από ό,τι για μια απλή εργασία όπως η αναγνώριση αντικειμένων.

Το εργαστήριό σας εστιάζει επίσης σε αλγόριθμους εκπαίδευσης για να μαθαίνει συνεχώς από ένα παράδειγμα κάθε φορά ή από πολύ μικρά σετ παραδειγμάτων. Πώς βοηθά αυτό;

Πολλές ρυθμίσεις συνεχούς μάθησης εξακολουθούν να χρησιμοποιούν πολύ μεγάλες παρτίδες παραδειγμάτων. Έτσι ουσιαστικά θα πουν στον αλγόριθμο: «Εδώ είναι 100,000 πράγματα. μάθε τα. Εδώ είναι τα επόμενα 100,000 πράγματα. μάθε τα.» Αυτό δεν ταιριάζει πραγματικά με αυτό που θα έλεγα ότι είναι η εφαρμογή του πραγματικού κόσμου, η οποία είναι: «Εδώ είναι ένα νέο πράγμα. Μάθε το. Εδώ είναι ένα άλλο νέο πράγμα? Μάθε το."

Εάν θέλουμε η τεχνητή νοημοσύνη να μάθει περισσότερα όπως εμείς, θα πρέπει επίσης να επιδιώξουμε να αναπαράγουμε πώς οι άνθρωποι μαθαίνουν διαφορετικά πράγματα σε διαφορετικές ηλικίες, βελτιώνοντας πάντα τις γνώσεις μας;

Νομίζω ότι είναι μια πολύ γόνιμη οδός για να σημειωθεί πρόοδος σε αυτόν τον τομέα. Ο κόσμος μου λέει ότι έχω εμμονή με την ανάπτυξη τώρα που έχω ένα παιδί, αλλά μπορώ να δω ότι η κόρη μου είναι ικανή να μάθει μια φορά, όπου με βλέπει να κάνω κάτι μια φορά και μπορεί να το αντιγράψει αμέσως. Και οι αλγόριθμοι μηχανικής μάθησης δεν μπορούν να κάνουν κάτι τέτοιο σήμερα.

Πραγματικά μου άνοιξε τα μάτια. Πρέπει να συμβαίνουν πολλά περισσότερα στο κεφάλι μας παρά στα σύγχρονα νευρωνικά μας δίκτυα. Γι' αυτό πιστεύω ότι το πεδίο πρέπει να στραφεί προς αυτήν την ιδέα της μάθησης με την πάροδο του χρόνου, όπου οι αλγόριθμοι γίνονται καλύτεροι μαθητές βασιζόμενοι στην εμπειρία του παρελθόντος.

Πιστεύετε ότι η τεχνητή νοημοσύνη θα μάθει ποτέ πραγματικά με τον ίδιο τρόπο που μαθαίνουν οι άνθρωποι;

Νομίζω ότι θα το κάνουν. Σίγουρα. Είναι πολύ πιο ελπιδοφόρα σήμερα γιατί υπάρχουν τόσοι πολλοί άνθρωποι που εργάζονται στον τομέα. Χρειαζόμαστε όμως περισσότερη δημιουργικότητα. Τόσο μεγάλο μέρος της κουλτούρας στην κοινότητα μηχανικής μάθησης είναι μια προσέγγιση που ακολουθεί τον ηγέτη.

Μας θεωρώ απλά βιοχημικές μηχανές και τελικά θα καταλάβουμε πώς να φτιάξουμε τους αλγόριθμούς μας για τις σωστές αρχιτεκτονικές που νομίζω ότι θα έχουν περισσότερες από τις δυνατότητές μας από ό,τι έχουν σήμερα. Δεν υπάρχει κανένα πειστικό επιχείρημα για μένα που να λέει ότι είναι αδύνατο.

Σφραγίδα ώρας:

Περισσότερα από Quantamamagazine