Το μοντέλο μεγάλης γλώσσας προβλέπει πώς να δημιουργηθούν ανόργανες ενώσεις – Physics World

Το μοντέλο μεγάλης γλώσσας προβλέπει πώς να δημιουργηθούν ανόργανες ενώσεις – Physics World

Σχηματικό διάγραμμα που δείχνει πώς η ομάδα εκπαίδευσε το νέο μοντέλο

Ερευνητές στην Κίνα έχουν τελειοποιήσει ένα υπάρχον μοντέλο μεγάλης γλώσσας (LLM) για να δημιουργήσουν ένα σύστημα που μπορεί να προβλέψει τα βήματα που απαιτούνται για τη σύνθεση μιας ανόργανης ένωσης. Αν και το νέο μοντέλο, που ονομάστηκε MatChat, χρειάζεται περαιτέρω βελτίωση προτού μπορέσει να χρησιμοποιηθεί στο εργαστήριο, οι προγραμματιστές του λένε ότι αντιπροσωπεύει μια σημαντική πρώιμη προσπάθεια για την εφαρμογή της γενετικής τεχνητής νοημοσύνης σε ένα επιστημονικό πλαίσιο.

Τα LLM είναι ένας τύπος τεχνητής νοημοσύνης που εξάγει νοήματα από μια ακολουθία κειμένου. Για να γίνει αυτό, πρέπει πρώτα να εκπαιδευτούν σε τεράστιες ποσότητες δεδομένων. Ωστόσο, αυτή η εκπαίδευση μπορεί να είναι χωρίς επίβλεψη, που σημαίνει ότι τα LLM λέγεται ότι είναι αυτομάθητα. Είναι επίσης πολύ ευέλικτοι, ικανοί να εκτελούν εργασίες όπως να απαντούν σε ερωτήσεις, να γράφουν κείμενο, να μεταφράζουν γλώσσες και να συμπληρώνουν προτάσεις. Γνωστά παραδείγματα περιλαμβάνουν το μοντέλο GPT-3 του Open AI και το προσβάσιμο spin-off του, το ChatGPT, το οποίο μπορεί ήδη να κάνει προβλέψεις από έναν σχετικά μικρό αριθμό εισόδων ή "προτροπών".

Για να δημιουργήσουν ένα LLM που «καταλαβαίνει» την ανόργανη σύνθεση, οι ερευνητές με επικεφαλής Miao Liu, φυσικός στο Ινστιτούτο Φυσικής, Κινεζική Ακαδημία Επιστημών, Πεκίνο και ιδρυτής της atomly.net, παρείχε ένα κορυφαίο LLM ανοιχτού κώδικα που ονομάζεται LLaMA2-7B με πρόσθετα επιστημονικά δεδομένα. Κάνοντας αυτό, λέει ο Liu, «το εξουσιοδοτούν να σκέφτεται παρόμοια με την ανθρώπινη γνώση χρησιμοποιώντας ένα ελάχιστο σύνολο δεδομένων». Εκπαίδευσαν το μοντέλο χρησιμοποιώντας πρωτόκολλα χημικής σύνθεσης που εξήχθησαν από 13 878 ανόργανες ενώσεις, τις οποίες προμήθευσαν από μια συλλογή άνω των τεσσάρων εκατομμυρίων επιστημονικών δημοσιεύσεων που συγκεντρώθηκαν από Κριστίν Σέντερ και συναδέλφους στο Εθνικό Εργαστήριο του Lawrence Berkeley στις Η.Π.Α.

«Αυτά τα δεδομένα εκπαίδευσης επιτρέπουν στο μοντέλο να κατανοήσει και να απαντήσει σε ερωτήσεις ανόργανης σύνθεσης με τον ίδιο τρόπο που θα έκανε ένας έμπειρος ειδικός», εξηγεί ο Liu. «Για παράδειγμα, όταν ρωτήθηκε για τη σύνθεση LiMnO2, το MatChat μπορεί να παρέχει μια λεπτομερή απάντηση που περιλαμβάνει πρόδρομες αντιδράσεις, εξισώσεις και σχετικές αναφορές στη βιβλιογραφία.

Μια τυπική ανταλλαγή, λέει, μπορεί να μοιάζει κάπως έτσι:

Ερώτηση: πώς γίνεται η σύνθεση LiMnO2;

Απάντηση: LiMnO2 μπορεί να κατασκευαστεί από Li2CO3 και MnO2 μέσω αντίδρασης στερεάς κατάστασης. Η εξίσωση της χημικής αντίδρασης είναι (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Οι πρόδρομοι αναμειγνύονται, πυρώνονται στους 800.0°C στον αέρα για 2.0 ώρες, αναμιγνύονται, πυρώνονται στους 800.0°C στον αέρα για 2.0 ώρες. Η αναλυτική συνταγή βρίσκεται στη βιβλιογραφία…

Μια νέα ιδέα έργου

Ο Liu πήρε την ιδέα για το έργο MatChat τον Αύγουστο του 2023, αφού παρακολούθησε ένα συνέδριο που διοργάνωσε η Intel με θέμα την τεχνολογία πληροφοριών και την τεχνητή νοημοσύνη. «Αν και η συνάντηση δεν είχε καμία σχέση με την επιστήμη, έμαθα πολλά για τα μοντέρνα θέματα στην τεχνητή νοημοσύνη και τις εφαρμογές της», λέει ο Liu. «Με ενέπνευσε να εφαρμόσω το LLM στην πρόβλεψη συνταγών σύνθεσης».

Για να πραγματοποιηθεί το έργο, ο Liu συνεργάστηκε με έναν συνάδελφο, Zongguo Wangκαι διδάκτωρ, Φανκάι Σιε. Ενώ ο Xie εκπαίδευε το μοντέλο, ο Wang κατασκεύασε το δωρεάν διαθέσιμη διαδικτυακή πλατφόρμα που του επιτρέπει να αλληλεπιδρά με τους χρήστες.

"Ενώ το MatChat μπορεί να μην είναι η απόλυτη λύση για αυτόν τον τύπο εφαρμογής, η εργασία μας αντιπροσωπεύει μία από τις πρώτες προσπάθειες εφαρμογής του LLM σε ένα επιστημονικό πλαίσιο", λέει ο Liu. Κόσμος Φυσικής. «Ελπίζουμε ότι η μελέτη μας θα χρησιμεύσει ως καταλύτης για τη δημιουργία παρόμοιων εργαλείων τεχνητής νοημοσύνης σε πολλά πεδία».

Προσβλέποντας στο μέλλον, οι ερευνητές σχεδιάζουν να βελτιώσουν τις δυνατότητες του MatChat επεκτείνοντας το σύνολο δεδομένων του και ενσωματώνοντας υπολογιστικά και πειραματικά δεδομένα από τη δική τους εκτενή βάση δεδομένων επιστήμης υλικών, atomly.net, καθώς και ένα προσεχές ρομποτικό αυτόνομο εργαστήριο σύνθεσης ανόργανων υλικών. «Αξιοποιώντας αυτούς τους πόρους, στοχεύουμε να συνεχίσουμε να αναπτύσσουμε προηγμένα εργαλεία τεχνητής νοημοσύνης για αυτόν τον τομέα», λέει ο Liu.

Το νέο μοντέλο AI περιγράφεται αναλυτικά στο Κινεζική Φυσική Β, και εμφανίστηκε σε προτυπωμένη μορφή στο arXiv περίπου την ίδια εποχή με α προεκτύπωση από ερευνητές της Microsoft που επέδειξαν παρόμοιο κατόρθωμα χρησιμοποιώντας το δημοφιλές ChatGPT4 LLM.

Σφραγίδα ώρας:

Περισσότερα από Κόσμος Φυσικής