NeurIPS 2023: Βασικά στοιχεία από τις προσκεκλημένες συνομιλίες

NeurIPS 2023: Βασικά στοιχεία από τις προσκεκλημένες συνομιλίες

Ομιλίες NeurIPS 2023

Δημιουργήθηκε με το Midjourney

Το συνέδριο NeurIPS 2023, που πραγματοποιήθηκε στη ζωντανή πόλη της Νέας Ορλεάνης από τις 10 έως τις 16 Δεκεμβρίου, έδωσε ιδιαίτερη έμφαση στη γενετική τεχνητή νοημοσύνη και στα μεγάλα γλωσσικά μοντέλα (LLM). Υπό το φως των πρόσφατων πρωτοποριακών προόδων σε αυτόν τον τομέα, δεν ήταν έκπληξη το γεγονός ότι αυτά τα θέματα κυριάρχησαν στις συζητήσεις.

Ένα από τα βασικά θέματα του φετινού συνεδρίου ήταν η αναζήτηση για πιο αποτελεσματικά συστήματα τεχνητής νοημοσύνης. Ερευνητές και προγραμματιστές αναζητούν ενεργά τρόπους να κατασκευάσουν τεχνητή νοημοσύνη που όχι μόνο μαθαίνει γρηγορότερα από τα τρέχοντα LLM, αλλά διαθέτει επίσης βελτιωμένες δυνατότητες συλλογιστικής ενώ καταναλώνει λιγότερους υπολογιστικούς πόρους. Αυτή η επιδίωξη είναι ζωτικής σημασίας στον αγώνα για την επίτευξη της Τεχνητής Γενικής Νοημοσύνης (AGI), ένας στόχος που φαίνεται όλο και περισσότερο εφικτός στο άμεσο μέλλον.

Οι προσκεκλημένες συνομιλίες στο NeurIPS 2023 ήταν μια αντανάκλαση αυτών των δυναμικών και ταχέως εξελισσόμενων ενδιαφερόντων. Παρουσιαστές από διάφορους τομείς της έρευνας της τεχνητής νοημοσύνης μοιράστηκαν τα τελευταία τους επιτεύγματα, προσφέροντας ένα παράθυρο στις εξελίξεις της τεχνητής νοημοσύνης αιχμής. Σε αυτό το άρθρο, εμβαθύνουμε σε αυτές τις συνομιλίες, εξάγοντας και συζητώντας τα βασικά συμπεράσματα και διδάγματα, τα οποία είναι απαραίτητα για την κατανόηση του τρέχοντος και του μελλοντικού τοπίου της καινοτομίας AI.

NextGenAI: The Delusion of Scaling and the Future of Generative AI 

In η ομιλία του, Björn Ommer, Επικεφαλής του Computer Vision & Learning Group στο Πανεπιστήμιο Ludwig Maximilian του Μονάχου, μοιράστηκε πώς το εργαστήριό του ανέπτυξε το Stable Diffusion, μερικά μαθήματα που έμαθαν από αυτή τη διαδικασία και τις πρόσφατες εξελίξεις, συμπεριλαμβανομένου του τρόπου με τον οποίο μπορούμε να συνδυάσουμε μοντέλα διάχυσης με αντιστοίχιση ροής, αύξηση ανάκτησης και προσεγγίσεις LoRA, μεταξύ άλλων.

μοντέλα διάχυσης

Βασικά πιάτα:

  • Στην εποχή του Generative AI, περάσαμε από την εστίαση στην αντίληψη στα μοντέλα όρασης (δηλαδή, στην αναγνώριση αντικειμένων) στην πρόβλεψη των τμημάτων που λείπουν (π.χ. δημιουργία εικόνας και βίντεο με μοντέλα διάχυσης).
  • Για 20 χρόνια, η υπολογιστική όραση εστιαζόταν στην έρευνα συγκριτικής αξιολόγησης, η οποία βοήθησε να επικεντρωθεί στα πιο σημαντικά προβλήματα. Στο Generative AI, δεν έχουμε κανένα σημείο αναφοράς για βελτιστοποίηση, το οποίο άνοιξε το πεδίο στον καθένα να πάει προς τη δική του κατεύθυνση.
  • Τα μοντέλα διάχυσης συνδυάζουν τα πλεονεκτήματα των προηγούμενων μοντέλων παραγωγής, βασισμένα στη βαθμολογία με μια σταθερή διαδικασία εκπαίδευσης και αποτελεσματική επεξεργασία δειγμάτων, αλλά είναι ακριβά λόγω της μεγάλης αλυσίδας Markov.
  • Η πρόκληση με τα μοντέλα ισχυρής πιθανότητας είναι ότι τα περισσότερα από τα bit μπαίνουν σε λεπτομέρειες που δύσκολα γίνονται αντιληπτές από το ανθρώπινο μάτι, ενώ η κωδικοποίηση της σημασιολογίας, που έχει τη μεγαλύτερη σημασία, διαρκεί μόνο μερικά bits. Η κλιμάκωση από μόνη της δεν θα έλυνε αυτό το πρόβλημα, επειδή η ζήτηση για υπολογιστικούς πόρους αυξάνεται 9 φορές ταχύτερα από την προσφορά GPU.
  • Η προτεινόμενη λύση είναι ο συνδυασμός των δυνατοτήτων των μοντέλων διάχυσης και των ConvNets, ιδιαίτερα της αποτελεσματικότητας των συνελίξεων για την αναπαράσταση τοπικών λεπτομερειών και της εκφραστικότητας των μοντέλων διάχυσης για περιβάλλον μεγάλης εμβέλειας.
  • Ο Björn Ommer προτείνει επίσης τη χρήση μιας προσέγγισης αντιστοίχισης ροής για να επιτραπεί η σύνθεση εικόνας υψηλής ανάλυσης από μικρά μοντέλα λανθάνουσας διάχυσης.
  • Μια άλλη προσέγγιση για την αύξηση της αποτελεσματικότητας της σύνθεσης εικόνας είναι η εστίαση στη σύνθεση σκηνής ενώ χρησιμοποιείται η αύξηση ανάκτησης για τη συμπλήρωση των λεπτομερειών.
  • Τέλος, εισήγαγε την προσέγγιση iPoke για ελεγχόμενη στοχαστική σύνθεση βίντεο.

Εάν αυτό το σε βάθος περιεχόμενο είναι χρήσιμο για εσάς, εγγραφείτε στη λίστα αλληλογραφίας AI μας να ειδοποιούμε όταν κυκλοφορούμε νέο υλικό. 

​The Many Faces of Responsible AI 

In την παρουσίασή της, η Lora Aroyo, ερευνήτρια στο Google Research, τόνισε έναν βασικό περιορισμό στις παραδοσιακές προσεγγίσεις μηχανικής μάθησης: την εξάρτησή τους από δυαδικές κατηγοριοποιήσεις δεδομένων ως θετικά ή αρνητικά παραδείγματα. Αυτή η υπεραπλούστευση, υποστήριξε, παραβλέπει την περίπλοκη υποκειμενικότητα που είναι εγγενής στα σενάρια και το περιεχόμενο του πραγματικού κόσμου. Μέσα από διάφορες περιπτώσεις χρήσης, ο Aroyo έδειξε πώς η ασάφεια περιεχομένου και η φυσική διακύμανση στις ανθρώπινες απόψεις συχνά οδηγούν σε αναπόφευκτες διαφωνίες. Τόνισε τη σημασία της αντιμετώπισης αυτών των διαφωνιών ως σημαντικών σημάτων και όχι ως απλού θορύβου.

υπεύθυνη AI

Ακολουθούν βασικά σημεία από την ομιλία:

  • Η διαφωνία μεταξύ των ανθρώπινων εργαζομένων μπορεί να είναι παραγωγική. Αντί να αντιμετωπίζει όλες τις απαντήσεις ως σωστές ή λανθασμένες, η Lora Aroyo εισήγαγε την «αλήθεια μέσω διαφωνίας», μια προσέγγιση της διανεμητικής αλήθειας για την αξιολόγηση της αξιοπιστίας των δεδομένων αξιοποιώντας τη διαφωνία των αξιολογητών.
  • Η ποιότητα των δεδομένων είναι δύσκολη ακόμη και με ειδικούς, επειδή οι ειδικοί διαφωνούν τόσο πολύ όσο και οι ειδικοί. Αυτές οι διαφωνίες μπορεί να είναι πολύ πιο κατατοπιστικές από τις απαντήσεις ενός και μόνο ειδικού.
    • Στις εργασίες αξιολόγησης ασφάλειας, οι ειδικοί διαφωνούν στο 40% των παραδειγμάτων. Αντί να προσπαθούμε να επιλύσουμε αυτές τις διαφωνίες, πρέπει να συλλέξουμε περισσότερα τέτοια παραδείγματα και να τα χρησιμοποιήσουμε για να βελτιώσουμε τα μοντέλα και τις μετρήσεις αξιολόγησης.
  • Η Lora Aroyo παρουσίασε επίσης τους Ασφάλεια με Ποικιλομορφία μέθοδος για την ενδελεχή εξέταση των δεδομένων ως προς το τι περιέχει και ποιος τα έχει σχολιάσει.
    • Αυτή η μέθοδος παρήγαγε ένα σύνολο δεδομένων αναφοράς με μεταβλητότητα στις κρίσεις ασφάλειας LLM σε διάφορες δημογραφικές ομάδες αξιολογητών (2.5 εκατομμύρια αξιολογήσεις συνολικά).
    • Για το 20% των συνομιλιών, ήταν δύσκολο να αποφασίσει αν η απάντηση του chatbot ήταν Ασφαλής ή Μη ασφαλής, καθώς υπήρχε περίπου ίσος αριθμός ερωτηθέντων που τους χαρακτήρισαν ασφαλείς ή μη.
  • Η ποικιλομορφία των αξιολογητών και των δεδομένων διαδραματίζει κρίσιμο ρόλο στην αξιολόγηση των μοντέλων. Η αποτυχία αναγνώρισης του ευρέος φάσματος των ανθρώπινων προοπτικών και της ασάφειας που υπάρχει στο περιεχόμενο μπορεί να εμποδίσει την ευθυγράμμιση της απόδοσης της μηχανικής εκμάθησης με τις προσδοκίες του πραγματικού κόσμου.
  • Το 80% των προσπαθειών για την ασφάλεια της τεχνητής νοημοσύνης είναι ήδη αρκετά καλές, αλλά το υπόλοιπο 20% απαιτεί διπλασιασμό της προσπάθειας για την αντιμετώπιση περιπτώσεων αιχμής και όλων των παραλλαγών στον άπειρο χώρο της διαφορετικότητας.

​Στατιστικά στοιχεία συνοχής, εμπειρία που δημιουργείται από τον εαυτό μας και γιατί οι νέοι άνθρωποι είναι πολύ πιο έξυπνοι από την τρέχουσα τεχνητή νοημοσύνη 

In ο λόγος της, η Linda Smith, διακεκριμένη καθηγήτρια στο Πανεπιστήμιο της Ιντιάνα στο Bloomington, διερεύνησε το θέμα της αραιότητας των δεδομένων στις μαθησιακές διαδικασίες βρεφών και μικρών παιδιών. Επικεντρώθηκε συγκεκριμένα στην αναγνώριση αντικειμένων και στην εκμάθηση ονομάτων, εμβαθύνοντας στο πώς τα στατιστικά στοιχεία των εμπειριών που δημιουργούνται από μόνα τους από βρέφη προσφέρουν πιθανές λύσεις στην πρόκληση της σπανιότητας των δεδομένων.

Βασικά πιάτα:

  • Μέχρι την ηλικία των τριών ετών, τα παιδιά έχουν αναπτύξει την ικανότητα να μαθαίνουν μεμονωμένα σε διάφορους τομείς. Σε λιγότερο από 16,000 ώρες αφύπνισης μέχρι τα τέταρτα γενέθλιά τους, καταφέρνουν να μάθουν περισσότερες από 1,000 κατηγορίες αντικειμένων, να κατακτήσουν τη σύνταξη της μητρικής τους γλώσσας και να απορροφήσουν τις πολιτιστικές και κοινωνικές αποχρώσεις του περιβάλλοντός τους.
  • Η Δρ Linda Smith και η ομάδα της ανακάλυψαν τρεις αρχές της ανθρώπινης μάθησης που επιτρέπουν στα παιδιά να συλλάβουν τόσα πολλά από τόσο αραιά δεδομένα:
    • Οι μαθητές ελέγχουν την εισαγωγή, από στιγμή σε στιγμή διαμορφώνουν και δομούν την εισαγωγή. Για παράδειγμα, κατά τους πρώτους μήνες της ζωής τους, τα μωρά τείνουν να κοιτάζουν περισσότερο αντικείμενα με απλές άκρες.
    • Δεδομένου ότι τα μωρά εξελίσσονται συνεχώς ως προς τις γνώσεις και τις δυνατότητές τους, ακολουθούν ένα εξαιρετικά περιορισμένο πρόγραμμα σπουδών. Τα δεδομένα στα οποία εκτίθενται είναι οργανωμένα με πολύ σημαντικούς τρόπους. Για παράδειγμα, τα μωρά κάτω των 4 μηνών περνούν τον περισσότερο χρόνο κοιτάζοντας πρόσωπα, περίπου 15 λεπτά την ώρα, ενώ τα μεγαλύτερα των 12 μηνών εστιάζουν κυρίως στα χέρια, παρατηρώντας τα για περίπου 20 λεπτά την ώρα.
    • Τα μαθησιακά επεισόδια αποτελούνται από μια σειρά αλληλένδετων εμπειριών. Οι χωρικοί και χρονικοί συσχετισμοί δημιουργούν συνοχή, η οποία με τη σειρά της διευκολύνει το σχηματισμό μόνιμων αναμνήσεων από γεγονότα μιας φοράς. Για παράδειγμα, όταν παρουσιάζονται με μια τυχαία ποικιλία παιχνιδιών, τα παιδιά συχνά εστιάζουν σε μερικά «αγαπημένα» παιχνίδια. Ασχολούνται με αυτά τα παιχνίδια χρησιμοποιώντας επαναλαμβανόμενα μοτίβα, τα οποία βοηθούν στην ταχύτερη εκμάθηση των αντικειμένων.
  • Οι παροδικές (εργάσιμες) μνήμες διατηρούνται περισσότερο από την αισθητηριακή είσοδο. Οι ιδιότητες που ενισχύουν τη διαδικασία μάθησης περιλαμβάνουν την πολυτροπικότητα, τους συσχετισμούς, τις προγνωστικές σχέσεις και την ενεργοποίηση των προηγούμενων αναμνήσεων.
  • Για γρήγορη μάθηση, χρειάζεστε μια συμμαχία μεταξύ των μηχανισμών που δημιουργούν τα δεδομένα και των μηχανισμών που μαθαίνουν.
μάθηση νηπίων

​Σχεδιασμός: βασικά εργαλεία, μάθηση-αύξηση και προσαρμοστική ευρωστία 

Jelani Nelson, Καθηγήτρια Ηλεκτρολόγων Μηχανικών και Επιστημών Υπολογιστών στο UC Berkeley, εισήγαγε την έννοια των «σκίτσα» δεδομένων – μια αναπαράσταση συμπιεσμένη με μνήμη ενός συνόλου δεδομένων που εξακολουθεί να επιτρέπει την απάντηση χρήσιμων ερωτημάτων. Αν και η ομιλία ήταν αρκετά τεχνική, παρείχε μια εξαιρετική επισκόπηση ορισμένων θεμελιωδών εργαλείων σκιαγράφησης, συμπεριλαμβανομένων των πρόσφατων εξελίξεων.

Βασικά φαγητά:

  • Το CountSketch, το βασικό εργαλείο σκιαγράφησης, εισήχθη για πρώτη φορά το 2002 για να αντιμετωπίσει το πρόβλημα των «βαρέων χτυπημάτων», αναφέροντας μια μικρή λίστα με τα πιο συχνά αντικείμενα από τη δεδομένη ροή αντικειμένων. Το CountSketch ήταν ο πρώτος γνωστός υπογραμμικός αλγόριθμος που χρησιμοποιήθηκε για το σκοπό αυτό.
  • Δύο εφαρμογές βαρέων χτυπητών χωρίς ροή περιλαμβάνουν:
    • Μέθοδος που βασίζεται σε εσωτερικά σημεία (IPM) που δίνει έναν ασυμπτωτικά ταχύτερο γνωστό αλγόριθμο για γραμμικό προγραμματισμό.
    • Μέθοδος HyperAttention που αντιμετωπίζει την υπολογιστική πρόκληση που τίθεται από την αυξανόμενη πολυπλοκότητα των μακρών πλαισίων που χρησιμοποιούνται στα LLM.
  • Πολλές πρόσφατες εργασίες έχουν επικεντρωθεί στο σχεδιασμό σκίτσων που είναι ανθεκτικά στην προσαρμοστική αλληλεπίδραση. Η κύρια ιδέα είναι να χρησιμοποιηθούν πληροφορίες από την προσαρμοστική ανάλυση δεδομένων.

Πέρα από τον πίνακα κλιμάκωσης 

Αυτός ο διαλογισμός στα υπέροχο πάνελ σε μεγάλα γλωσσικά μοντέλα Συντονίσθηκε από τον Alexander Rush, αναπληρωτή καθηγητή στο Cornell Tech και ερευνητή στο Hugging Face. Οι υπόλοιποι συμμετέχοντες ήταν:

  • Aakanksha Chowdhery – Επιστήμονας ερευνητής στο Google DeepMind με ερευνητικά ενδιαφέροντα σε συστήματα, προεκπαίδευση LLM και πολυτροπικότητα. Ήταν μέλος της ομάδας που ανέπτυξε τα PaLM, Gemini και Pathways.
  • Angela Fan – Επιστήμονας ερευνητής στο Meta Generative AI με ερευνητικά ενδιαφέροντα στην ευθυγράμμιση, τα κέντρα δεδομένων και την πολυγλωσσία. Συμμετείχε στην ανάπτυξη του Llama-2 και του Meta AI Assistant.
  • Percy Liang – Καθηγητής στο Stanford που ερευνά δημιουργούς, ανοιχτού κώδικα και παραγωγούς. Είναι Διευθυντής του Κέντρου Έρευνας για Μοντέλα Θεμελίωσης (CRFM) στο Στάνφορντ και ιδρυτής του Together AI.

Η συζήτηση επικεντρώθηκε σε τέσσερα βασικά θέματα: (1) αρχιτεκτονικές και μηχανική, (2) δεδομένα και ευθυγράμμιση, (3) αξιολόγηση και διαφάνεια και (4) δημιουργοί και συντελεστές.

Ακολουθούν μερικά από τα στοιχεία από αυτό το πάνελ:

  • Η εκπαίδευση σύγχρονων μοντέλων γλώσσας δεν είναι εγγενώς δύσκολη. Η κύρια πρόκληση στην εκπαίδευση ενός μοντέλου όπως το Llama-2-7b έγκειται στις απαιτήσεις υποδομής και στην ανάγκη συντονισμού μεταξύ πολλαπλών GPU, κέντρων δεδομένων κ.λπ. Ωστόσο, εάν ο αριθμός των παραμέτρων είναι αρκετά μικρός ώστε να επιτρέπει την εκπαίδευση σε μία μόνο GPU, ακόμα και ένας προπτυχιακός μπορεί να το διαχειριστεί.
  • Ενώ τα αυτοπαλινδρομικά μοντέλα χρησιμοποιούνται συνήθως για τη δημιουργία κειμένου και τα μοντέλα διάχυσης για τη δημιουργία εικόνων και βίντεο, έχουν γίνει πειράματα με την αντιστροφή αυτών των προσεγγίσεων. Συγκεκριμένα, στο έργο Gemini, χρησιμοποιείται ένα αυτοπαλινδρομικό μοντέλο για τη δημιουργία εικόνων. Υπήρξαν επίσης εξερευνήσεις σχετικά με τη χρήση μοντέλων διάχυσης για τη δημιουργία κειμένου, αλλά αυτά δεν έχουν ακόμη αποδειχθεί επαρκώς αποτελεσματικά.
  • Δεδομένης της περιορισμένης διαθεσιμότητας αγγλόφωνων δεδομένων για μοντέλα εκπαίδευσης, οι ερευνητές διερευνούν εναλλακτικές προσεγγίσεις. Μια δυνατότητα είναι η εκπαίδευση πολυτροπικών μοντέλων σε συνδυασμό κειμένου, βίντεο, εικόνων και ήχου, με την προσδοκία ότι οι δεξιότητες που αποκτήθηκαν από αυτές τις εναλλακτικές μεθόδους μπορούν να μεταφερθούν σε κείμενο. Μια άλλη επιλογή είναι η χρήση συνθετικών δεδομένων. Είναι σημαντικό να σημειωθεί ότι τα συνθετικά δεδομένα συχνά συνδυάζονται με πραγματικά δεδομένα, αλλά αυτή η ενοποίηση δεν είναι τυχαία. Το κείμενο που δημοσιεύεται στο διαδίκτυο συνήθως υποβάλλεται σε επιμέλεια και επεξεργασία από τον άνθρωπο, κάτι που μπορεί να προσθέσει πρόσθετη αξία για την εκπαίδευση μοντέλων.
  • Τα μοντέλα ανοιχτής βάσης θεωρούνται συχνά ωφέλιμα για την καινοτομία, αλλά δυνητικά επιβλαβή για την ασφάλεια της τεχνητής νοημοσύνης, καθώς μπορούν να τα εκμεταλλευτούν κακόβουλοι παράγοντες. Ωστόσο, ο Δρ Percy Liang υποστηρίζει ότι τα ανοιχτά μοντέλα συμβάλλουν θετικά στην ασφάλεια. Υποστηρίζει ότι με το να είναι προσβάσιμα, παρέχουν σε περισσότερους ερευνητές ευκαιρίες να διεξάγουν έρευνα για την ασφάλεια της τεχνητής νοημοσύνης και να επανεξετάσουν τα μοντέλα για πιθανές ευπάθειες.
  • Σήμερα, ο σχολιασμός δεδομένων απαιτεί σημαντικά μεγαλύτερη εξειδίκευση στον τομέα των σχολιασμών σε σύγκριση με πριν από πέντε χρόνια. Ωστόσο, εάν οι βοηθοί τεχνητής νοημοσύνης λειτουργήσουν όπως αναμένεται στο μέλλον, θα λάβουμε πιο πολύτιμα δεδομένα ανατροφοδότησης από τους χρήστες, μειώνοντας την εξάρτηση από εκτεταμένα δεδομένα από τους σχολιαστές.

​Συστήματα για Μοντέλα Θεμελίωσης και Μοντέλα Θεμελίωσης για Συστήματα 

In αυτή τη συζήτηση, Christopher Ré, Αναπληρωτής Καθηγητής στο Τμήμα Επιστήμης Υπολογιστών στο Πανεπιστήμιο του Στάνφορντ, δείχνει πώς τα θεμελιώδη μοντέλα άλλαξαν τα συστήματα που κατασκευάζουμε. Διερευνά επίσης πώς να χτίζει αποτελεσματικά μοντέλα θεμελίωσης, δανειζόμενος γνώσεις από την έρευνα συστημάτων βάσεων δεδομένων και συζητά δυνητικά πιο αποτελεσματικές αρχιτεκτονικές για μοντέλα θεμελίωσης από το Transformer.

μοντέλα θεμελίων για καθαρισμό δεδομένων

Εδώ είναι τα βασικά σημεία από αυτήν την ομιλία:

  • Τα μοντέλα θεμελίωσης είναι αποτελεσματικά στην αντιμετώπιση προβλημάτων «θανάτων κατά 1000 περικοπές», όπου κάθε μεμονωμένη εργασία μπορεί να είναι σχετικά απλή, αλλά το τεράστιο εύρος και η ποικιλία των εργασιών αποτελούν σημαντική πρόκληση. Ένα καλό παράδειγμα αυτού είναι το πρόβλημα καθαρισμού δεδομένων, το οποίο τα LLM μπορούν πλέον να βοηθήσουν στην επίλυση πολύ πιο αποτελεσματικά.
  • Καθώς οι επιταχυντές γίνονται πιο γρήγοροι, η μνήμη συχνά εμφανίζεται ως εμπόδιο. Αυτό είναι ένα πρόβλημα που οι ερευνητές βάσεων δεδομένων αντιμετωπίζουν εδώ και δεκαετίες και μπορούμε να υιοθετήσουμε ορισμένες από τις στρατηγικές τους. Για παράδειγμα, η προσέγγιση Flash Attention ελαχιστοποιεί τις ροές εισόδου-εξόδου μέσω αποκλεισμού και επιθετικής σύντηξης: κάθε φορά που έχουμε πρόσβαση σε μια πληροφορία, εκτελούμε όσο το δυνατόν περισσότερες λειτουργίες σε αυτήν.
  • Υπάρχει μια νέα κατηγορία αρχιτεκτονικών, που βασίζεται στην επεξεργασία σήματος, που θα μπορούσε να είναι πιο αποτελεσματική από το μοντέλο του Transformer, ειδικά στον χειρισμό μεγάλων ακολουθιών. Η επεξεργασία σήματος προσφέρει σταθερότητα και αποτελεσματικότητα, θέτοντας τα θεμέλια για καινοτόμα μοντέλα όπως το S4.

Διαδικτυακή Ενισχυτική Μάθηση στις Ψηφιακές Παρεμβάσεις Υγείας 

In ο λόγος της, Susan Murphy, Καθηγήτρια Στατιστικής και Επιστήμης Υπολογιστών στο Πανεπιστήμιο του Χάρβαρντ, μοιράστηκε τις πρώτες λύσεις σε ορισμένες από τις προκλήσεις που αντιμετωπίζουν στην ανάπτυξη διαδικτυακών αλγορίθμων RL για χρήση σε ψηφιακές παρεμβάσεις υγείας.

Ακολουθούν μερικά στοιχεία από την παρουσίαση:

  • Η Δρ Σούζαν Μέρφι συζήτησε δύο έργα στα οποία εργάζεται:
    • HeartStep, όπου έχουν προταθεί δραστηριότητες βάσει δεδομένων από smartphone και φορετούς ιχνηλάτες και
    • Oralytics για καθοδήγηση στοματικής υγείας, όπου οι παρεμβάσεις βασίστηκαν σε δεδομένα εμπλοκής που ελήφθησαν από μια ηλεκτρονική οδοντόβουρτσα.
  • Κατά την ανάπτυξη μιας πολιτικής συμπεριφοράς για έναν πράκτορα τεχνητής νοημοσύνης, οι ερευνητές πρέπει να διασφαλίσουν ότι είναι αυτόνομη και ότι μπορεί να εφαρμοστεί εφικτά στο ευρύτερο σύστημα υγειονομικής περίθαλψης. Αυτό συνεπάγεται τη διασφάλιση ότι ο χρόνος που απαιτείται για τη δέσμευση ενός ατόμου είναι εύλογος και ότι οι προτεινόμενες ενέργειες είναι ηθικά ορθές και επιστημονικά εύλογες.
  • Οι κύριες προκλήσεις στην ανάπτυξη ενός πράκτορα RL για παρεμβάσεις ψηφιακής υγείας περιλαμβάνουν την αντιμετώπιση υψηλών επιπέδων θορύβου, καθώς οι άνθρωποι ζουν τη ζωή τους και μπορεί να μην είναι πάντα σε θέση να ανταποκριθούν σε μηνύματα, ακόμη κι αν το επιθυμούν, καθώς και τη διαχείριση ισχυρών, καθυστερημένων αρνητικών επιπτώσεων .

Όπως μπορείτε να δείτε, το NeurIPS 2023 έδωσε μια διαφωτιστική ματιά στο μέλλον της τεχνητής νοημοσύνης. Οι προσκεκλημένες ομιλίες τόνισαν μια τάση προς πιο αποτελεσματικά μοντέλα με συνείδηση ​​των πόρων και την εξερεύνηση νέων αρχιτεκτονικών πέρα ​​από τα παραδοσιακά παραδείγματα.

Σας αρέσει αυτό το άρθρο; Εγγραφείτε για περισσότερες ενημερώσεις έρευνας για την τεχνητή νοημοσύνη.

Θα σας ενημερώσουμε όταν κυκλοφορούμε περισσότερα συνοπτικά άρθρα όπως αυτό.

#gform_wrapper_11[data-form-index=”0″].gform-theme,[data-parent-form=”11_0″]{–gform-theme-color-primary: #204ce5;–gform-theme-color-primary-rgb: 32, 76, 229;–gform-theme-color-primary-contrast: #fff;–gform-theme-color-primary-contrast-rgb: 255, 255, 255;–gform-theme-color-primary-darker: #001AB3;–gform-theme-color-primary-lighter: #527EFF;–gform-theme-color-secondary: #fff;–gform-theme-color-secondary-rgb: 255, 255, 255;–gform-theme-color-secondary-contrast: #112337;–gform-theme-color-secondary-contrast-rgb: 17, 35, 55;–gform-theme-color-secondary-darker: #F5F5F5;–gform-theme-color-secondary-lighter: #FFFFFF;–gform-theme-color-outside-control-light: rgba(17, 35, 55, 0.1);–gform-theme-color-outside-control-light-rgb: 17, 35, 55;–gform-theme-color-outside-control-light-darker: rgba(104, 110, 119, 0.35);–gform-theme-color-outside-control-light-lighter: #F5F5F5;–gform-theme-color-outside-control-dark: #585e6a;–gform-theme-color-outside-control-dark-rgb: 88, 94, 106;–gform-theme-color-outside-control-dark-darker: #112337;–gform-theme-color-outside-control-dark-lighter: rgba(17, 35, 55, 0.65);–gform-theme-color-inside-control: #fff;–gform-theme-color-inside-control-rgb: 255, 255, 255;–gform-theme-color-inside-control-contrast: #112337;–gform-theme-color-inside-control-contrast-rgb: 17, 35, 55;–gform-theme-color-inside-control-darker: #F5F5F5;–gform-theme-color-inside-control-lighter: #FFFFFF;–gform-theme-color-inside-control-primary: #204ce5;–gform-theme-color-inside-control-primary-rgb: 32, 76, 229;–gform-theme-color-inside-control-primary-contrast: #fff;–gform-theme-color-inside-control-primary-contrast-rgb: 255, 255, 255;–gform-theme-color-inside-control-primary-darker: #001AB3;–gform-theme-color-inside-control-primary-lighter: #527EFF;–gform-theme-color-inside-control-light: rgba(17, 35, 55, 0.1);–gform-theme-color-inside-control-light-rgb: 17, 35, 55;–gform-theme-color-inside-control-light-darker: rgba(104, 110, 119, 0.35);–gform-theme-color-inside-control-light-lighter: #F5F5F5;–gform-theme-color-inside-control-dark: #585e6a;–gform-theme-color-inside-control-dark-rgb: 88, 94, 106;–gform-theme-color-inside-control-dark-darker: #112337;–gform-theme-color-inside-control-dark-lighter: rgba(17, 35, 55, 0.65);–gform-theme-border-radius: 3px;–gform-theme-font-size-secondary: 14px;–gform-theme-font-size-tertiary: 13px;–gform-theme-icon-control-number: url(“data:image/svg+xml,%3Csvg width=’8′ height=’14’ viewBox=’0 0 8 14′ fill=’none’ xmlns=’http://www.w3.org/2000/svg’%3E%3Cpath fill-rule=’evenodd’ clip-rule=’evenodd’ d=’M4 0C4.26522 5.96046e-08 4.51957 0.105357 4.70711 0.292893L7.70711 3.29289C8.09763 3.68342 8.09763 4.31658 7.70711 4.70711C7.31658 5.09763 6.68342 5.09763 6.29289 4.70711L4 2.41421L1.70711 4.70711C1.31658 5.09763 0.683417 5.09763 0.292893 4.70711C-0.0976311 4.31658 -0.097631 3.68342 0.292893 3.29289L3.29289 0.292893C3.48043 0.105357 3.73478 0 4 0ZM0.292893 9.29289C0.683417 8.90237 1.31658 8.90237 1.70711 9.29289L4 11.5858L6.29289 9.29289C6.68342 8.90237 7.31658 8.90237 7.70711 9.29289C8.09763 9.68342 8.09763 10.3166 7.70711 10.7071L4.70711 13.7071C4.31658 14.0976 3.68342 14.0976 3.29289 13.7071L0.292893 10.7071C-0.0976311 10.3166 -0.0976311 9.68342 0.292893 9.29289Z’ fill=’rgba(17, 35, 55, 0.65)’/%3E%3C/svg%3E”);–gform-theme-icon-control-select: url(“data:image/svg+xml,%3Csvg width=’10’ height=’6′ viewBox=’0 0 10 6′ fill=’none’ xmlns=’http://www.w3.org/2000/svg’%3E%3Cpath fill-rule=’evenodd’ clip-rule=’evenodd’ d=’M0.292893 0.292893C0.683417 -0.097631 1.31658 -0.097631 1.70711 0.292893L5 3.58579L8.29289 0.292893C8.68342 -0.0976311 9.31658 -0.0976311 9.70711 0.292893C10.0976 0.683417 10.0976 1.31658 9.70711 1.70711L5.70711 5.70711C5.31658 6.09763 4.68342 6.09763 4.29289 5.70711L0.292893 1.70711C-0.0976311 1.31658 -0.0976311 0.683418 0.292893 0.292893Z’ fill=’rgba(17, 35, 55, 0.65)’/%3E%3C/svg%3E”);–gform-theme-icon-control-search: url(“data:image/svg+xml,%3Csvg version=’1.1′ xmlns=’http://www.w3.org/2000/svg’ width=’640′ height=’640’%3E%3Cpath d=’M256 128c-70.692 0-128 57.308-128 128 0 70.691 57.308 128 128 128 70.691 0 128-57.309 128-128 0-70.692-57.309-128-128-128zM64 256c0-106.039 85.961-192 192-192s192 85.961 192 192c0 41.466-13.146 79.863-35.498 111.248l154.125 154.125c12.496 12.496 12.496 32.758 0 45.254s-32.758 12.496-45.254 0L367.248 412.502C335.862 434.854 297.467 448 256 448c-106.039 0-192-85.962-192-192z’ fill=’rgba(17, 35, 55, 0.65)’/%3E%3C/svg%3E”);–gform-theme-control-border-color: #686e77;–gform-theme-control-size: var(–gform-theme-control-size-md);–gform-theme-control-label-color-primary: #112337;–gform-theme-control-label-color-secondary: #112337;–gform-theme-control-choice-size: var(–gform-theme-control-choice-size-md);–gform-theme-control-checkbox-check-size: var(–gform-theme-control-checkbox-check-size-md);–gform-theme-control-radio-check-size: var(–gform-theme-control-radio-check-size-md);–gform-theme-control-button-font-size: var(–gform-theme-control-button-font-size-md);–gform-theme-control-button-padding-inline: var(–gform-theme-control-button-padding-inline-md);–gform-theme-control-button-size: var(–gform-theme-control-button-size-md);–gform-theme-control-button-border-color-secondary: #686e77;–gform-theme-control-file-button-background-color-hover: #EBEBEB;–gform-theme-field-page-steps-number-color: rgba(17, 35, 55, 0.8);}

Σφραγίδα ώρας:

Περισσότερα από ΚΟΡΥΦΑΙΑ