Η τεχνητή νοημοσύνη διαμορφώνει τον εγκέφαλο για να μας βοηθήσει να δούμε, να ακούσουμε και να δημιουργήσουμε την ευφυΐα δεδομένων PlatoBlockchain. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Η τεχνητή νοημοσύνη διαμορφώνει τον εγκέφαλο για να μας βοηθήσει να δούμε, να ακούσουμε και να δημιουργήσουμε

Αυτή είναι μια επεξεργασμένη έκδοση μιας ανάρτησης που κυκλοφόρησε αρχικά εδώ.


Η νευροεπιστήμη και η τεχνητή νοημοσύνη έχουν μια μακρά, αλληλένδετη ιστορία. Οι πρωτοπόροι της τεχνητής νοημοσύνης εξέτασαν τις αρχές της οργάνωσης του εγκεφάλου ως έμπνευση για την κατασκευή ευφυών μηχανών. Σε μια εκπληκτική ανατροπή, η τεχνητή νοημοσύνη μας βοηθά τώρα να κατανοήσουμε την ίδια την πηγή έμπνευσής της: τον ανθρώπινο εγκέφαλο. Αυτή η προσέγγιση χρήσης της τεχνητής νοημοσύνης για τη δημιουργία μοντέλων του εγκεφάλου αναφέρεται ως neuroAI. Την επόμενη δεκαετία, θα κάνουμε ολοένα και πιο ακριβείς σε πυρίτιο μοντέλα εγκεφάλου, ειδικά μοντέλα των δύο πιο σημαντικών αισθήσεών μας, της όρασης και της ακοής. Ως αποτέλεσμα, θα μπορούμε να κατεβάζουμε και να χρησιμοποιούμε αισθητηριακά μοντέλα, κατόπιν αιτήματος, με την ίδια ευκολία που μπορούμε να κάνουμε αναγνώριση αντικειμένων ή επεξεργασία φυσικής γλώσσας.

Πολλοί νευροεπιστήμονες και ερευνητές τεχνητής νοημοσύνης είναι – κατανοητό! – πολύ ενθουσιασμένος με αυτό: μυαλό κατά παραγγελία! Ανακαλύπτοντας τι σημαίνει να βλέπεις, να νιώθεις, να είσαι άνθρωπος! Λιγότερο γνωστό είναι ότι υπάρχουν ευρείες πρακτικές εφαρμογές στη βιομηχανία. Είμαι εδώ και καιρό ερευνητής σε αυτόν τον τομέα, έχοντας εργαστεί πάνω στο πώς ο εγκέφαλος μετατρέπει την όραση σε νόημα από το διδακτορικό μου. Έχω δει την πρόοδο του τομέα από την έναρξή του και νομίζω ότι τώρα είναι η ώρα να επιδιώξουμε πώς το neuroAI μπορεί να οδηγήσει σε περισσότερη δημιουργικότητα και να βελτιώσει την υγεία μας. 

Προβλέπω ότι το neuroAI θα βρει πρώτα ευρεία χρήση στην τέχνη και τη διαφήμιση, ειδικά όταν συνδέεται με νέα μοντέλα γενετικής τεχνητής νοημοσύνης όπως το GPT-3 και το DALL-E. Ενώ τα τρέχοντα μοντέλα τεχνητής νοημοσύνης που δημιουργούνται μπορούν να παράγουν δημιουργική τέχνη και μέσα, δεν μπορούν να σας πουν εάν αυτά τα μέσα θα επικοινωνήσουν τελικά ένα μήνυμα στο κοινό που θέλετε – αλλά το neuroAI θα μπορούσε. Για παράδειγμα, θα μπορούσαμε να αντικαταστήσουμε τη δοκιμή και το σφάλμα των ομάδων εστίασης και των δοκιμών A/B και να δημιουργήσουμε απευθείας μέσα που επικοινωνούν ακριβώς αυτό που θέλουμε. Οι τεράστιες πιέσεις της αγοράς γύρω από αυτήν την εφαρμογή θα δημιουργήσουν έναν ενάρετο κύκλο που βελτιώνει τα μοντέλα neuroAI. 

Τα προκύπτοντα βελτιωμένα μοντέλα θα επιτρέψουν εφαρμογές στην υγεία στην ιατρική, από τη βοήθεια ατόμων με νευρολογικά προβλήματα έως την ενίσχυση των ικανοτήτων του πηγαδιού. Φανταστείτε να δημιουργείτε τις σωστές εικόνες και ήχους για να βοηθήσετε ένα άτομο να ανακτήσει την όραση ή την ακοή του πιο γρήγορα μετά από επέμβαση LASIK ή μετά από κοχλιακό εμφύτευμα, αντίστοιχα. 

Αυτές οι καινοτομίες θα γίνουν πολύ πιο ισχυρές από άλλες τεχνολογίες που θα ακολουθήσουν: επαυξημένη πραγματικότητα και διεπαφές εγκεφάλου-υπολογιστή. Ωστόσο, για να συνειδητοποιήσουμε πλήρως τη δυνητική χρησιμότητα των αισθητηριακών συστημάτων με δυνατότητα λήψης κατά παραγγελία, θα χρειαστεί να καλύψουμε τα τρέχοντα κενά σε εργαλεία, ταλέντο και χρηματοδότηση.

Σε αυτό το κομμάτι θα εξηγήσω τι είναι το neuroAI, πώς μπορεί να αρχίσει να εξελίσσεται και να αρχίσει να επηρεάζει τη ζωή μας, πώς συμπληρώνει άλλες καινοτομίες και τεχνολογίες και τι χρειάζεται για να το προωθήσουμε.  

Τι είναι το neuroAI;

Το NeuroAI είναι ένας αναδυόμενος κλάδος που επιδιώκει 1) να μελετήσει τον εγκέφαλο για να μάθει πώς να χτίζει καλύτερη τεχνητή νοημοσύνη και 2) να χρησιμοποιήσει την τεχνητή νοημοσύνη για να κατανοήσει καλύτερα τον εγκέφαλο. Ένα από τα βασικά εργαλεία του neuroAI είναι η χρήση τεχνητών νευρωνικών δικτύων για τη δημιουργία μοντέλων υπολογιστών συγκεκριμένων εγκεφαλικών λειτουργιών. Αυτή η προσέγγιση ξεκίνησε το 2014, όταν οι ερευνητές στο MIT και Κολούμπια έδειξε ότι τα βαθιά τεχνητά νευρωνικά δίκτυα θα μπορούσαν να εξηγήσουν τις αποκρίσεις σε ένα μέρος του εγκεφάλου που κάνει αναγνώριση αντικειμένων: τον κάτω κροταφικό φλοιό (IT). Εισήγαγαν μια βασική συνταγή για να συγκρίνουν ένα τεχνητό νευρωνικό δίκτυο με έναν εγκέφαλο. Χρησιμοποιώντας αυτή τη συνταγή και επαναλαμβάνοντας επαναληπτικές δοκιμές σε όλες τις διαδικασίες του εγκεφάλου - αναγνώριση σχήματος, επεξεργασία κίνησης, επεξεργασία ομιλίας, έλεγχος του χεριού, χωρική μνήμη - οι επιστήμονες χτίζουν ένα συνονθύλευμα μοντέλων υπολογιστών για τον εγκέφαλο. 

Μια συνταγή για σύγκριση εγκεφάλου με μηχανές

Πώς λοιπόν δημιουργείτε ένα μοντέλο NeuroAI; Από την ίδρυσή του το 2014, το πεδίο ακολουθεί την ίδια βασική συνταγή:

1. Εκπαιδεύστε τεχνητά νευρωνικά δίκτυα σε silico για την επίλυση μιας εργασίας, για παράδειγμα για την αναγνώριση αντικειμένων. Το δίκτυο που προκύπτει ονομάζεται βελτιστοποιημένο για εργασίες. Είναι σημαντικό ότι αυτό συνήθως περιλαμβάνει εκπαίδευση μόνο σε εικόνες, ταινίες και ήχους, όχι σε δεδομένα εγκεφάλου.

2. Συγκρίνετε τις ενδιάμεσες ενεργοποιήσεις εκπαιδευμένων τεχνητών νευρωνικών δικτύων με πραγματικές εγγραφές εγκεφάλου. Η σύγκριση γίνεται χρησιμοποιώντας στατιστικές τεχνικές όπως γραμμική παλινδρόμηση ή ανάλυση αναπαραστατικής ομοιότητας.

3. Επιλέξτε το μοντέλο με την καλύτερη απόδοση ως το τρέχον μοντέλο με τις καλύτερες επιδόσεις αυτών των περιοχών του εγκεφάλου.

Αυτή η συνταγή μπορεί να εφαρμοστεί με δεδομένα που συλλέγονται μέσα στον εγκέφαλο από μεμονωμένους νευρώνες ή από μη επεμβατικές τεχνικές όπως η μαγνητοεγκεφαλογραφία (MEG) ή η λειτουργική μαγνητική τομογραφία (fMRI).

Ένα μοντέλο neuroAI τμήματος του εγκεφάλου έχει δύο βασικά χαρακτηριστικά. Είναι υπολογίσιμο: μπορούμε να τροφοδοτήσουμε αυτό το μοντέλο υπολογιστή με ένα ερέθισμα και θα μας πει πώς θα αντιδράσει μια περιοχή του εγκεφάλου. Είναι επίσης διαφοροποιήσιμο: είναι ένα βαθύ νευρωνικό δίκτυο που μπορούμε να βελτιστοποιήσουμε με τον ίδιο τρόπο που βελτιστοποιούμε τα μοντέλα που επιλύουν την οπτική αναγνώριση και την επεξεργασία φυσικής γλώσσας. Αυτό σημαίνει ότι οι νευροεπιστήμονες έχουν πρόσβαση σε όλα τα ισχυρά εργαλεία που έχουν τροφοδοτήσει την επανάσταση της βαθιάς μάθησης, συμπεριλαμβανομένων των συστημάτων τανυστικής άλγεβρας όπως τα PyTorch και TensorFlow. 

Τι σημαίνει αυτό? Φτάσαμε από το να μην καταλαβαίνουμε μεγάλα κομμάτια του εγκεφάλου στο να μπορούμε να κατεβάζουμε καλά μοντέλα του σε λιγότερο από μια δεκαετία. Με τις σωστές επενδύσεις, σύντομα θα έχουμε εξαιρετικά μοντέλα μεγάλων τμημάτων του εγκεφάλου. Το οπτικό σύστημα ήταν το πρώτο που μοντελοποιήθηκε. το ακουστικό σύστημα δεν ήταν πολύ πίσω; και άλλες περιοχές σίγουρα θα πέσουν σαν ντόμινο καθώς ατρόμητοι νευροεπιστήμονες σπεύδουν να λύσουν τα μυστήρια του εγκεφάλου. Εκτός από την ικανοποίηση της διανοητικής μας περιέργειας –ένα μεγάλο κίνητρο για τους επιστήμονες!– αυτή η καινοτομία θα επιτρέψει σε κάθε προγραμματιστή να κατεβάσει καλά μοντέλα εγκεφάλου και να ξεκλειδώσει μυριάδες εφαρμογές.

Τομείς εφαρμογής

Τέχνη και διαφήμιση

Ας ξεκινήσουμε με αυτή την απλή υπόθεση: το 99% των μέσων που βιώνουμε είναι μέσα από τα μάτια και τα αυτιά μας. Υπάρχουν ολόκληρες βιομηχανίες που μπορούν να συνοψιστούν στην παροχή των σωστών pixel και των τόνων σε αυτές τις αισθήσεις: η εικαστική τέχνη, το σχέδιο, οι ταινίες, τα παιχνίδια, η μουσική και η διαφήμιση είναι μόνο μερικά από αυτά. Τώρα, δεν είναι τα ίδια τα μάτια και τα αυτιά μας που ερμηνεύουν αυτές τις εμπειρίες, καθώς είναι απλώς αισθητήρες: είναι ο εγκέφαλός μας που δίνει νόημα σε αυτές τις πληροφορίες. Τα μέσα ενημέρωσης δημιουργούνται για να ενημερώνουν, να ψυχαγωγούν, να προκαλούν επιθυμητά συναισθήματα. Αλλά ο καθορισμός του εάν το μήνυμα σε έναν πίνακα, ένα επαγγελματικό στιγμιότυπο ή μια διαφήμιση θα ληφθεί όπως προορίζεται είναι μια απογοητευτική άσκηση δοκιμής και λάθους: οι άνθρωποι πρέπει να είναι στο βρόχο για να καθορίσουν εάν το μήνυμα εμφανίζεται, κάτι που είναι ακριβό και χρονοβόρο- καταναλώνοντας.

Οι διαδικτυακές υπηρεσίες μεγάλης κλίμακας έχουν βρει τρόπους να το αντιμετωπίσουν αυτοματοποιώντας δοκιμές και λάθη: δοκιμές A/B. Google περίφημα δοκίμασε ποια από τις 50 αποχρώσεις του μπλε να χρησιμοποιήσει για τους συνδέσμους στη σελίδα αποτελεσμάτων της μηχανής αναζήτησης. Σύμφωνα με τον The Guardian, η καλύτερη επιλογή προκάλεσε βελτιώσεις στα έσοδα πάνω από τα 200 εκατομμύρια $ το 2009, ή περίπου 1% των εσόδων της Google εκείνη την εποχή. Το Netflix προσαρμόζει τις μικρογραφίες στον θεατή για να βελτιστοποιήσει την εμπειρία χρήστη του. Αυτές οι μέθοδοι είναι διαθέσιμες σε διαδικτυακούς γίγαντες με τεράστια κίνηση, η οποία μπορεί να ξεπεράσει τον θόρυβο που είναι εγγενής στη συμπεριφορά των ανθρώπων.

Τι θα γινόταν αν μπορούσαμε να προβλέψουμε πώς θα αντιδράσουν οι άνθρωποι στα μέσα πριν λάβουν δεδομένα; Αυτό θα επέτρεπε στις μικρές επιχειρήσεις να βελτιστοποιήσουν το γραπτό υλικό και τις ιστοσελίδες τους παρά το γεγονός ότι είχαν μικρή προϋπάρχουσα έλξη. Το NeuroAI πλησιάζει όλο και περισσότερο στο να μπορεί να προβλέψει πώς θα αντιδράσουν οι άνθρωποι στο οπτικό υλικό. Για παράδειγμα, ερευνητές στην Adobe εργάζονται πάνω σε εργαλεία να προβλέψει και να κατευθύνει την οπτική προσοχή σε εικονογραφήσεις.

Οι ερευνητές έχουν επίσης επιδείξει την επεξεργασία φωτογραφιών για τη δημιουργία τους πιο οπτικά αξέχαστο ή αισθητικά ευχάριστος. Θα μπορούσε να χρησιμοποιηθεί, για παράδειγμα, για την αυτόματη επιλογή ενός επαγγελματικού στιγμιότυπου κεφαλιού που είναι πιο ευθυγραμμισμένο με την εικόνα που θέλουν να προβάλουν οι άνθρωποι για τον εαυτό τους—επαγγελματική, σοβαρή ή δημιουργική. Τα τεχνητά νευρωνικά δίκτυα μπορούν ακόμη και να βρουν τρόπους επικοινωνίας μηνυμάτων πιο αποτελεσματικά από ρεαλιστικές εικόνες. Το CLIP του OpenAI μπορεί να ανιχνευθεί για να βρει εικόνες που είναι ευθυγραμμισμένες με τα συναισθήματα. Η εικόνα που ευθυγραμμίζεται καλύτερα με την έννοια του σοκ δεν θα ήταν παράταιρη δίπλα στο Scream του Munch.

OpenAI CLIP που μεγιστοποιεί την εικόνα για την έννοια του σοκ. Μέσω του μικροσκοπίου OpenAI, που κυκλοφόρησε υπό την έκδοση CC-BY 4.0.

Τον τελευταίο χρόνο, το OpenAI και η Google έχουν επιδείξει δίκτυα δημιουργίας τέχνης με εντυπωσιακή ικανότητα δημιουργίας φωτορεαλιστικών εικόνων από μηνύματα κειμένου. Δεν έχουμε φτάσει ακριβώς αυτή τη στιγμή για τη μουσική, αλλά με τον ρυθμό προόδου στα γενετικά μοντέλα, αυτό θα συμβεί σίγουρα τα επόμενα χρόνια. Κατασκευάζοντας μηχανές που μπορούν να ακούν όπως οι άνθρωποι, μπορεί να είμαστε σε θέση να εκδημοκρατίσουμε τη μουσική παραγωγή, δίνοντας σε οποιονδήποτε τη δυνατότητα να κάνει ό,τι μπορούν να κάνουν οι παραγωγοί υψηλής εξειδίκευσης: να μεταδώσουν το σωστό συναίσθημα κατά τη διάρκεια μιας χορωδίας, είτε μελαγχολία είτε χαρά. για να δημιουργήσετε ένα σκουλήκι του αυτιού μιας μελωδίας. ή να κάνει ένα κομμάτι ακαταμάχητα χορευτικό.

Υπάρχουν τεράστιες πιέσεις στην αγορά για τη βελτιστοποίηση των οπτικοακουστικών μέσων, των ιστότοπων και ιδιαίτερα των διαφημίσεων, και ήδη ενσωματώνουμε το neuroAI και την αλγοριθμική τέχνη σε αυτή τη διαδικασία. Αυτή η πίεση θα οδηγήσει σε έναν ενάρετο κύκλο όπου το neuroAI θα γίνει καλύτερο και πιο χρήσιμο καθώς περισσότεροι πόροι διατίθενται σε πρακτικές εφαρμογές. Μια παρενέργεια αυτού είναι ότι θα έχουμε πολύ καλά μοντέλα εγκεφάλου που θα είναι χρήσιμα πολύ εκτός διαφημίσεων. 

Προσβασιμότητα και αλγοριθμικός σχεδιασμός

Μία από τις πιο συναρπαστικές εφαρμογές του neuroAI είναι η προσβασιμότητα. Τα περισσότερα μέσα έχουν σχεδιαστεί για το «μέσο» άτομο, ωστόσο όλοι επεξεργαζόμαστε οπτικές και ακουστικές πληροφορίες με διαφορετικό τρόπο. Το 8% των ανδρών και το 0.5% των γυναικών έχουν κόκκινο-πράσινο αχρωματοψία και μεγάλος αριθμός μέσων δεν είναι προσαρμοσμένος στις ανάγκες τους. Υπάρχουν πολλά προϊόντα που προσομοιώνουν την αχρωματοψία σήμερα, αλλά απαιτούν από ένα άτομο με φυσιολογική χρωματική όραση να ερμηνεύσει τα αποτελέσματα και να κάνει τις απαραίτητες αλλαγές. Η στατική επαναχαρτογράφηση χρωμάτων δεν λειτουργεί ούτε για αυτές τις ανάγκες, καθώς ορισμένα υλικά δεν διατηρούν τη σημασιολογία τους με τη χρωματική επαναχαρτογράφηση (π.χ. γραφήματα που γίνονται δυσανάγνωστα). Θα μπορούσαμε να αυτοματοποιήσουμε τη δημιουργία υλικών και ιστοτόπων που είναι ασφαλή για αχρωματοψία μέσω μεθόδων neuroAI που διατηρούν τη σημασιολογία των υπαρχόντων γραφικών.

Ένα άλλο παράδειγμα είναι να βοηθήσουμε άτομα με μαθησιακές δυσκολίες, όπως η δυσλεξία, η οποία επηρεάζει έως και το 10% των ανθρώπων παγκοσμίως. Ένα από τα υποκείμενα ζητήματα στη δυσλεξία είναι ευαισθησία στο συνωστισμό, που είναι η δυσκολία αναγνώρισης σχημάτων με παρόμοια υποκείμενα χαρακτηριστικά, συμπεριλαμβανομένων των κατοπτρικών συμμετρικών γραμμάτων όπως το p και το q. Η Anne Harrington και ο Arturo Deza στο MIT εργάζονται πάνω σε μοντέλα neuroAI που μοντελοποιούν αυτό το αποτέλεσμα και να πάρει μερικά πολλά υποσχόμενα αποτελέσματα. Φανταστείτε να παίρνετε μοντέλα του δυσλεξικού οπτικού συστήματος για να σχεδιάσετε γραμματοσειρές που είναι αισθητικά ευχάριστες και ευανάγνωστες. Με τα σωστά δεδομένα για το οπτικό σύστημα ενός συγκεκριμένου ατόμου, μπορούμε ακόμη εξατομικεύστε τη γραμματοσειρά σε ένα συγκεκριμένο άτομο, το οποίο έχει δείξει πολλά υποσχόμενα για τη βελτίωση της απόδοσης στην ανάγνωση. Αυτές είναι δυνητικά μεγάλες βελτιώσεις στην ποιότητα ζωής που περιμένουν εδώ.

Υγεία

Πολλοί νευροεπιστήμονες μπαίνουν στο πεδίο με την ελπίδα ότι η έρευνά τους θα επηρεάσει θετικά την ανθρώπινη υγεία, ιδιαίτερα για άτομα που ζουν με νευρολογικές διαταραχές ή προβλήματα ψυχικής υγείας. Είμαι πολύ αισιόδοξος ότι το neuroAI θα ξεκλειδώσει νέες θεραπείες: με ένα καλό μοντέλο εγκεφάλου, μπορούμε να δημιουργήσουμε τα σωστά ερεθίσματα ώστε να φτάσει το σωστό μήνυμα, όπως ένα κλειδί που ταιριάζει σε μια κλειδαριά. Υπό αυτή την έννοια, το neuroAI θα μπορούσε να εφαρμοστεί παρόμοια στον αλγοριθμικό σχεδιασμό φαρμάκων, αλλά αντί για μικρά μόρια, παρέχουμε εικόνες και ήχους. 

Τα πιο προσιτά προβλήματα αφορούν τους υποδοχείς των ματιών και των αυτιών, οι οποίοι είναι ήδη καλά χαρακτηρισμένοι. Εκατοντάδες χιλιάδες άνθρωποι έχουν λάβει κοχλιακά εμφυτεύματα, νευροπροσθετικά που διεγείρουν ηλεκτρικά τον κοχλία του αυτιού, επιτρέποντας σε κωφούς ή βαρήκοους να ακούσουν ξανά. Αυτά τα εμφυτεύματα, τα οποία περιέχουν μερικές δεκάδες ηλεκτρόδια, μπορεί να είναι δύσκολο να χρησιμοποιηθούν σε θορυβώδη περιβάλλοντα με πολλά ηχεία. Ένα μοντέλο εγκεφάλου μπορεί βελτιστοποιήστε το μοτίβο διέγερσης του εμφυτεύματος να ενισχύσει την ομιλία. Αυτό που είναι αξιοσημείωτο είναι ότι αυτή η τεχνολογία, που αναπτύχθηκε για άτομα με εμφυτεύματα, θα μπορούσε να προσαρμοστεί για να βοηθήσει τα άτομα χωρίς εμφυτεύματα να κατανοήσουν καλύτερα την ομιλία τροποποιώντας τους ήχους σε πραγματικό χρόνο, είτε έχουν διαταραχή ακουστικής επεξεργασίας είτε απλώς βρίσκονται συχνά σε δυνατά περιβάλλοντα.

Πολλοί άνθρωποι βιώνουν αλλαγές στα αισθητηριακά τους συστήματα καθ 'όλη τη διάρκεια της ζωής τους, είτε πρόκειται για ανάρρωση από χειρουργική επέμβαση καταρράκτη είτε για μυωπία με την ηλικία. Γνωρίζουμε ότι μετά από μια τέτοια αλλαγή, οι άνθρωποι μπορούν να μάθουν να επανερμηνεύουν τον κόσμο σωστά μέσω της επανάληψης, ένα φαινόμενο που ονομάζεται αντιληπτική μάθηση. Ίσως είμαστε σε θέση να μεγιστοποιήσουμε αυτήν την αντιληπτική μάθηση, έτσι ώστε οι άνθρωποι να μπορούν να ανακτήσουν τις δεξιότητές τους πιο γρήγορα και πιο αποτελεσματικά. Μια παρόμοια ιδέα θα μπορούσε να βοηθήσει άτομα που έχουν χάσει την ικανότητα να κινούν τα άκρα τους με ρευστά μετά από ένα εγκεφαλικό. Εάν μπορούσαμε να βρούμε τη σωστή σειρά κινήσεων για να ενισχύσουμε τον εγκέφαλο βέλτιστα, ίσως μπορέσουμε να βοηθήσουμε τους επιζώντες από εγκεφαλικό να ανακτήσουν περισσότερες λειτουργίες, όπως το να περπατούν πιο ρευστά ή απλά να κρατούν ένα φλιτζάνι καφέ χωρίς να χυθεί. Εκτός από το να βοηθήσει τους ανθρώπους να ανακτήσουν τις χαμένες σωματικές τους λειτουργίες, η ίδια ιδέα θα μπορούσε να βοηθήσει υγιείς ανθρώπους να φτάσουν στο μέγιστο της αισθητηριακής απόδοσης – είτε είναι παίκτες του μπέιζμπολ, τοξότες ή παθολόγοι.

Τέλος, θα μπορούσαμε να δούμε αυτές τις ιδέες να εφαρμόζονται στη θεραπεία των διαταραχών της διάθεσης. Πήγα σε πολλές παραστάσεις εικαστικών τεχνών για να ανακουφίσω την πλήξη μου κατά τη διάρκεια της πανδημίας και μου ανέβασε τρομερά τη διάθεση. Η οπτική τέχνη και η μουσική μπορούν να μας φτιάξουν τη διάθεση, και είναι μια απόδειξη της ιδέας ότι μπορεί να είμαστε μπορεί να προσφέρει θεραπείες για διαταραχές της διάθεσης μέσω των αισθήσεων. Γνωρίζουμε ότι ο έλεγχος της δραστηριότητας συγκεκριμένων τμημάτων του εγκεφάλου με ηλεκτρική διέγερση μπορεί να ανακουφίσει την ανθεκτική στη θεραπεία κατάθλιψη. Ίσως ο έλεγχος της δραστηριότητας του εγκεφάλου έμμεσα μέσω των αισθήσεων θα μπορούσε να δείξει παρόμοια αποτελέσματα. Με την ανάπτυξη απλών μοντέλων – χαμηλών φρούτων – που επηρεάζουν καλά κατανοητά μέρη του εγκεφάλου, θα κάνουμε το μπαλάκι να χτίσουμε πιο περίπλοκα μοντέλα που μπορούν να βοηθήσουν την ανθρώπινη υγεία. 

Ενεργοποίηση τεχνολογικών τάσεων

Το NeuroAI θα χρειαστεί πολλά χρόνια για να εξημερωθεί και να αναπτυχθεί σε εφαρμογές και θα υποκλέψει άλλες αναδυόμενες τάσεις της τεχνολογίας. Εδώ επισημαίνω δύο τάσεις συγκεκριμένα που θα κάνουν το neuroAI πολύ πιο ισχυρό: την επαυξημένη πραγματικότητα (AR), η οποία μπορεί να προσφέρει ερεθίσματα με ακρίβεια. και διεπαφές εγκεφάλου-υπολογιστή (BCI), οι οποίες μπορούν να μετρήσουν την εγκεφαλική δραστηριότητα για να επαληθεύσουν ότι τα ερεθίσματα δρουν με τον αναμενόμενο τρόπο.  

Επαυξημένης πραγματικότητας

Μια τάση που θα κάνει τις εφαρμογές neuroAI πολύ πιο ισχυρές είναι η υιοθέτηση γυαλιών επαυξημένης πραγματικότητας. Η επαυξημένη πραγματικότητα (AR) έχει τη δυνατότητα να γίνει μια πανταχού παρούσα υπολογιστική πλατφόρμα, επειδή το AR ενσωματώνεται στην καθημερινή ζωή.

Η υπόθεση του Michael Abrash, επικεφαλής επιστήμονα στα Meta Reality Labs, είναι ότι εάν κατασκευάσετε επαρκώς ικανά γυαλιά AR, όλοι θα τα θέλουν. Αυτό σημαίνει οικοδόμηση γυαλιά που έχουν επίγνωση του κόσμου που μπορούν να δημιουργήσουν επίμονα εικονικά αντικείμενα κλειδωμένα στον κόσμο; ελαφριά και μοντέρνα κουφώματα, σαν ένα ζευγάρι Ray-Bans. και να σου δίνει πραγματικές υπερδυνάμεις, όπως να μπορείς αλληλεπιδρούν φυσικά με τους ανθρώπους ανεξάρτητα από την απόσταση και βελτιώνοντας την ακοή σας. Εάν μπορείτε να τα κατασκευάσετε –μια τεράστια τεχνική πρόκληση– τα γυαλιά AR θα μπορούσαν να ακολουθήσουν μια τροχιά παρόμοια με το iPhone, έτσι ώστε όλοι να έχουν ένα (ή ένα knockoff) 5 χρόνια μετά την κυκλοφορία.

Για να γίνει αυτό πραγματικότητα, ο Μέτα ξόδεψε 10 δισεκατομμύρια δολάρια πέρυσι για την Ε&Α για το metaverse. Αν και δεν γνωρίζουμε με βεβαιότητα τι κάνει η Apple, υπάρχουν ισχυρές ενδείξεις ότι εργάζονται σε γυαλιά AR. Επομένως, υπάρχει επίσης μια τεράστια ώθηση από την πλευρά της προσφοράς για να πραγματοποιηθεί το AR.

Αυτό θα καταστήσει ευρέως διαθέσιμη μια συσκευή προβολής που είναι πολύ πιο ισχυρή από τις σημερινές στατικές οθόνες. Αν αυτο ακολουθεί την τροχιά του VR, τελικά θα έχει ενσωματωμένη παρακολούθηση ματιών. Αυτό θα σήμαινε έναν ευρέως διαθέσιμο τρόπο παρουσίασης ερεθισμάτων που είναι πολύ πιο ελεγχόμενος από ό,τι είναι σήμερα δυνατό, ένα όνειρο για τους νευροεπιστήμονες. Και αυτές οι συσκευές είναι πιθανό να έχουν εκτεταμένες εφαρμογές υγείας, όπως είπε ο Michael Abrash το 2017, όπως η ενίσχυση της όρασης σε χαμηλό φωτισμό ή η δυνατότητα στους ανθρώπους να ζήσουν μια φυσιολογική ζωή παρά την εκφύλιση της ωχράς κηλίδας.

Η σημασία για το neuroAI είναι ξεκάθαρη: θα μπορούσαμε να προσφέρουμε το σωστό ερέθισμα με άκρως ελεγχόμενο τρόπο σε συνεχή βάση στην καθημερινή ζωή. Αυτό ισχύει για την όραση, και ίσως λιγότερο προφανώς για την ακοή, καθώς μπορούμε να παραδώσουμε χωρικό ήχο. Αυτό σημαίνει ότι τα εργαλεία μας για τη δημιουργία θεραπειών neuroAI για άτομα με νευρολογικά προβλήματα ή για βελτιώσεις προσβασιμότητας θα γίνουν πολύ πιο ισχυρά.

BCI

Με μια εξαιρετική οθόνη και ηχεία, μπορούμε να ελέγξουμε με ακρίβεια τις κύριες εισόδους στον εγκέφαλο. Το επόμενο, πιο ισχυρό στάδιο στην παροχή ερεθισμάτων μέσω των αισθήσεων είναι να επαληθευτεί ότι ο εγκέφαλος αντιδρά με τον αναμενόμενο τρόπο μέσω μιας διεπαφής εγκεφάλου-υπολογιστή μόνο για ανάγνωση (BCI). Έτσι, μπορούμε να μετρήσουμε τα αποτελέσματα των ερεθισμάτων στον εγκέφαλο και αν δεν είναι τα αναμενόμενα, μπορούμε να προσαρμοστούμε ανάλογα σε αυτό που ονομάζεται έλεγχος κλειστού βρόχου. 

Για να είμαι ξεκάθαρος, εδώ δεν μιλάω για μεθόδους BCI όπως το τσιπ του Neuralink ή διεγέρτες βαθιάς εγκεφάλου που μπαίνουν μέσα στο κρανίο. Είναι αρκετό για αυτούς τους σκοπούς να μετρηθεί η εγκεφαλική δραστηριότητα έξω από το κρανίο, μη επεμβατικά. Δεν χρειάζεται να διεγείρετε άμεσα τον εγκέφαλο: τα γυαλιά και τα ακουστικά είναι όλα όσα χρειάζεστε για να ελέγξετε τις περισσότερες από τις εισόδους του εγκεφάλου.

Υπάρχει ένας αριθμός μη επεμβατικών BCI μόνο για ανάγνωση που διατίθενται στο εμπόριο σήμερα ή βρίσκονται σε εξέλιξη και θα μπορούσαν να χρησιμοποιηθούν για έλεγχο κλειστού βρόχου. Μερικά παραδείγματα περιλαμβάνουν:

  • EEG. Η ηλεκτροεγκεφαλογραφία μετρά την ηλεκτρική δραστηριότητα του εγκεφάλου έξω από το κρανίο. Επειδή το κρανίο λειτουργεί ως αγωγός όγκου, το ΗΕΓ έχει υψηλή χρονική ανάλυση αλλά χαμηλή χωρική ανάλυση. Αν και αυτό έχει περιορίσει την εφαρμογή των καταναλωτών σε προϊόντα διαλογισμού (Μούσα) και εξειδικευμένες εφαρμογές νευρομάρκετινγκ, είμαι θετικός σε ορισμένες από τις χρήσεις του στο πλαίσιο του ελέγχου κλειστού βρόχου. Το ΗΕΓ μπορεί να είναι πολύ πιο ισχυρό όταν κάποιος έχει τον έλεγχο του ερεθίσματος, επειδή είναι δυνατό να συσχετιστεί το παρουσιαζόμενο ερέθισμα με το σήμα ΗΕΓ και να αποκωδικοποιηθεί αυτό στο οποίο έδινε προσοχή ένα άτομο (προκαλούμενες πιθανές μεθόδους). Πράγματι, το NextMind, το οποίο έκανε ένα «κλικ μυαλού» βασισμένο σε ΗΕΓ βάσει προκλημένων δυνατοτήτων, αποκτήθηκε από το Snap, η οποία πλέον κατασκευάζει προϊόντα AR. Το OpenBCI είναι σχεδιασμό να απελευθερώσει ένα σετ μικροφώνου-ακουστικού που ενσωματώνει τους αισθητήρες EEG του με τα κορυφαία ακουστικά Aero της Varjo. Δεν θα υπολόγιζα το ΗΕΓ.
  • fMRI. Η λειτουργική μαγνητική τομογραφία μετρά τις μικρές αλλαγές στην οξυγόνωση του αίματος που σχετίζονται με τη νευρική δραστηριότητα. Είναι αργό, δεν είναι φορητό, θέλει δικό του δωμάτιο και είναι πολύ ακριβό. Ωστόσο, η fMRI παραμένει η μόνη τεχνολογία που μπορεί να διαβάσει μη επεμβατικά τη δραστηριότητα βαθιά στον εγκέφαλο με χωρικά ακριβή τρόπο. Υπάρχουν δύο παραδείγματα που είναι αρκετά ώριμα και σχετικά με νευρωνικό έλεγχο κλειστού βρόχου. Το πρώτο είναι η βιοανάδραση που βασίζεται σε fMRI. Ένα υποπεδίο fMRI δείχνει ότι οι άνθρωποι μπορούν να ρυθμίσουν τη δραστηριότητα του εγκεφάλου τους παρουσιάζοντάς την οπτικά σε μια οθόνη ή ακουστικά. Το δεύτερο είναι η χαρτογράφηση του φλοιού, συμπεριλαμβανομένων προσεγγίσεων όπως τα πεδία υποδοχής πληθυσμού και εκτίμηση της επιλεκτικότητας voxel με αποσπάσματα ταινιών ή podcast, που επιτρέπουν σε κάποιον να εκτιμήσει πώς ανταποκρίνονται διαφορετικές περιοχές του εγκεφάλου σε διαφορετικά οπτικά και ακουστικά ερεθίσματα. Αυτές οι δύο μέθοδοι υποδηλώνουν ότι θα πρέπει να είναι δυνατό να εκτιμηθεί πώς μια παρέμβαση νευροΑΙ επηρεάζει τον εγκέφαλο και να τον κατευθύνουμε ώστε να είναι πιο αποτελεσματικός.
  • fNIRS. Η λειτουργική φασματοσκοπία κοντά στο υπέρυθρο χρησιμοποιεί διάχυτο φως για να εκτιμήσει τον όγκο του εγκεφαλικού αίματος μεταξύ ενός πομπού και ενός υποδοχέα. Βασίζεται στο γεγονός ότι το αίμα είναι αδιαφανές και η αυξημένη νευρική δραστηριότητα οδηγεί σε καθυστερημένη εισροή αίματος σε έναν δεδομένο όγκο εγκεφάλου (ίδια αρχή με το fMRI). Το συμβατικό NIRS έχει χαμηλή χωρική ανάλυση, αλλά με τη χρονική πύλη (TD-NIRS) και τη μαζική υπερδειγματοληψία (διάχυτη οπτική τομογραφία), η χωρική ανάλυση είναι πολύ καλύτερη. Στο ακαδημαϊκό μέτωπο, Η ομάδα του Joe Culver στο WUSTL έχουν δείξει αποκωδικοποίηση ταινιών από τον οπτικό φλοιό. Στο εμπορικό μέτωπο, ο Kernel βρίσκεται πλέον κατασκευή και αποστολή ακουστικών TD-NIRS που είναι εντυπωσιακά κατορθώματα της μηχανικής. Και είναι ένας τομέας όπου οι άνθρωποι συνεχίζουν να πιέζουν και η πρόοδος είναι ταχεία. η παλιά μου ομάδα στο Meta έδειξε 32 φορές βελτίωση στην αναλογία σήματος προς θόρυβο (η οποία θα μπορούσε να κλιμακωθεί σε >300) σε μια σχετική τεχνική.
  • MEG. Η μαγνητοεγκεφαλογραφία μετρά μικρές αλλαγές στα μαγνητικά πεδία, εντοπίζοντας έτσι την εγκεφαλική δραστηριότητα. Το MEG είναι παρόμοιο με το EEG στο ότι μετρά τις αλλαγές στο ηλεκτρομαγνητικό πεδίο, αλλά δεν υποφέρει από αγωγιμότητα όγκου και επομένως έχει καλύτερη χωρική ανάλυση. Το φορητό MEG που δεν απαιτεί ψύξη θα μπορούσε να αλλάξει το παιχνίδι για το μη επεμβατικό BCI. Οι άνθρωποι σημειώνουν πρόοδο με τα μαγνητόμετρα με οπτική άντληση και είναι δυνατή η αγορά μεμονωμένων αισθητήρων OPM στην ανοιχτή αγορά, από κατασκευαστές όπως η QuSpin.

Εκτός από αυτές τις πιο γνωστές τεχνικές, ορισμένες τεχνολογίες σκούρου αλόγων όπως η ψηφιακή ολογραφία, η φωτοακουστική τομογραφία και ο λειτουργικός υπέρηχος θα μπορούσαν να οδηγήσουν σε γρήγορες αλλαγές παραδειγμάτων σε αυτόν τον χώρο.

Ενώ το μη επεμβατικό BCI καταναλωτικής ποιότητας βρίσκεται ακόμη σε αρχικό στάδιο, υπάρχουν πολλές πιέσεις στην αγορά γύρω από περιπτώσεις χρήσης AR που θα κάνουν την πίτα μεγαλύτερη. Πράγματι, ένα σημαντικό πρόβλημα για το AR είναι ο έλεγχος της συσκευής: δεν θέλετε να περπατάτε με ένα χειριστήριο ή να μουρμουρίζετε στα γυαλιά σας, αν μπορείτε να το αποφύγετε. Οι εταιρείες είναι πολύ σοβαρές για την επίλυση αυτού του προβλήματος, όπως αποδεικνύεται από την αγορά του CTRL+Labs από το Facebook σε 2019, Snap εξαγοράζοντας το NextMind και η Valve συνεργάζεται με το OpenBCI. Έτσι, είναι πιθανό να δούμε BCI χαμηλών διαστάσεων να αναπτύσσονται γρήγορα. Τα BCI υψηλών διαστάσεων μπορεί να ακολουθήσουν την ίδια τροχιά αν βρουν μια εφαρμογή δολοφονίας όπως το AR. Είναι πιθανό τα είδη των εφαρμογών neuroAI για τα οποία υποστηρίζω εδώ να είναι ακριβώς η σωστή περίπτωση χρήσης για αυτήν την τεχνολογία.

Εάν μπορούμε να ελέγξουμε την είσοδο στα μάτια και τα αυτιά καθώς και να μετρήσουμε με ακρίβεια τις καταστάσεις του εγκεφάλου, μπορούμε να προσφέρουμε θεραπείες που βασίζονται σε νευροΑΙ με έναν παρακολουθούμενο τρόπο για μέγιστη αποτελεσματικότητα.

Τι λείπει από το γήπεδο

Η βασική επιστήμη πίσω από τις εφαρμογές NeuroAI ωριμάζει γρήγορα και υπάρχουν ορισμένες θετικές τάσεις που θα αυξήσουν τη γενική εφαρμογή της. Τι λείπει λοιπόν για να φέρουμε τις εφαρμογές neuroAI στην αγορά;

  1. Εργαλεία. Άλλα υποπεδία εντός της τεχνητής νοημοσύνης έχουν ωφεληθεί πάρα πολύ από εργαλειοθήκες που επιτρέπουν την ταχεία πρόοδο και την κοινή χρήση αποτελεσμάτων. Αυτό περιλαμβάνει βιβλιοθήκες τανυστικής άλγεβρας όπως το Tensorflow και το PyTorch, εκπαιδευτικά περιβάλλοντα όπως το OpenAI Gym και οικοσυστήματα για κοινή χρήση δεδομένων και μοντέλα όπως το 🤗 HuggingFace. Ένα κεντρικό αποθετήριο μοντέλων και μεθόδων, καθώς και σειρές αξιολόγησης, που πιθανώς αξιοποιούν άφθονα δεδομένα προσομοίωσης, θα ωθήσει το πεδίο προς τα εμπρός. Υπάρχει ήδη μια ισχυρή κοινότητα οργανισμών νευροεπιστήμης ανοιχτού κώδικα και θα μπορούσαν να χρησιμεύσουν ως φυσικοί οικοδεσπότες για αυτές τις προσπάθειες.
  2. Ταλέντο. Υπάρχει ένας εξαφανιστικά μικρός αριθμός τόπων όπου γίνεται έρευνα και ανάπτυξη στη διασταύρωση της νευροεπιστήμης και της τεχνητής νοημοσύνης. Η περιοχή Bay, με εργαστήρια στο Στάνφορντ και το Μπέρκλεϋ, και η περιοχή του μετρό της Βοστώνης με πολλά εργαστήρια στο MIT και το Χάρβαρντ, πιθανότατα θα δουν το μεγαλύτερο μέρος της επένδυσης από το προϋπάρχον οικοσύστημα κεφαλαίων επιχειρηματικού κινδύνου. Ένας τρίτος πιθανός κόμβος είναι το Μόντρεαλ του Καναδά, που αναπτύχθηκε από τεράστια τμήματα νευροεπιστήμης στο McGill και στο Universite de Montreal, σε συνδυασμό με την έλξη του Mila, του ινστιτούτου τεχνητής νοημοσύνης που ιδρύθηκε από τον πρωτοπόρο της τεχνητής νοημοσύνης Yoshua Bengio. Ο τομέας μας θα επωφεληθεί από εξειδικευμένα διδακτορικά προγράμματα και κέντρα αριστείας στο neuroAI για να ξεκινήσει η εμπορευματοποίηση.
  3. Νέα μοντέλα χρηματοδότησης και εμπορευματοποίησης για ιατρικές εφαρμογές. Οι ιατρικές εφαρμογές έχουν μακρύ δρόμο προς την εμπορευματοποίηση και η προστατευόμενη πνευματική ιδιοκτησία είναι συνήθως απαραίτητη προϋπόθεση για τη λήψη χρηματοδότησης για την απομάκρυνση του κινδύνου επένδυσης στην τεχνολογία. Οι καινοτομίες που βασίζονται στην τεχνητή νοημοσύνη είναι εμφανώς δύσκολο να κατοχυρωθούν με δίπλωμα ευρεσιτεχνίας και το λογισμικό ως ιατρική συσκευή (SaMD) μόλις αρχίζει να έρχεται στην αγορά, καθιστώντας αβέβαιο τον δρόμο προς την εμπορευματοποίηση. Θα χρειαστούμε κεφάλαια που θα επικεντρώνονται στη συγκέντρωση της τεχνογνωσίας της τεχνητής νοημοσύνης και της ιατρικής τεχνολογίας για να καλλιεργήσουμε αυτόν τον εκκολαπτόμενο τομέα. 

Ας φτιάξουμε το neuroAI

Οι επιστήμονες και οι φιλόσοφοι έχουν προβληματιστεί σχετικά με το πώς λειτουργούν οι εγκέφαλοι από αμνημονεύτων χρόνων. Πώς ένα λεπτό φύλλο ιστού, ένα τετραγωνικό πόδι σε έκταση, μας επιτρέπει να βλέπουμε, να ακούμε, να αισθανόμαστε και να σκεφτόμαστε; Το NeuroAI μας βοηθά να λύσουμε αυτά τα βαθιά ερωτήματα δημιουργώντας μοντέλα νευρολογικών συστημάτων σε υπολογιστές. Με την ικανοποίηση αυτής της θεμελιώδους δίψας για γνώση – τι σημαίνει να είσαι άνθρωπος; – Οι νευροεπιστήμονες κατασκευάζουν επίσης εργαλεία που θα μπορούσαν να βοηθήσουν εκατομμύρια ανθρώπους να ζήσουν πιο πλούσια ζωή.

Δημοσιεύτηκε στις 4 Αυγούστου 2022

Τεχνολογία, καινοτομία και μέλλον, όπως είπαν όσοι την κατασκευάζουν.

Ευχαριστώ για την εγγραφή σας.

Ελέγξτε τα εισερχόμενά σας για μια σημείωση καλωσορίσματος.

Σφραγίδα ώρας:

Περισσότερα από Andreessen Horowitz