Suur keelemudel ennustab anorgaaniliste ühendite valmistamist – Füüsikamaailm

Suur keelemudel ennustab anorgaaniliste ühendite valmistamist – Füüsikamaailm

Skemaatiline diagramm, mis näitab, kuidas meeskond uut mudelit koolitas

Hiina teadlased on viimistlenud olemasolevat suure keele mudelit (LLM), et luua süsteem, mis suudab ennustada anorgaanilise ühendi sünteesimiseks vajalikke samme. Kuigi uus mudel, mille nimi on MatChat, vajab enne laboris kasutuselevõttu täiendavat viimistlemist, on selle arendajate sõnul tegemist olulise varajase ettevõtmisega generatiivse tehisintellekti rakendamisel teaduslikus kontekstis.

LLM-id on teatud tüüpi tehisintellekt, mis eraldab tekstijadast tähendusi. Selleks tuleb neid esmalt õpetada tohutute andmehulkade osas. Kuid see koolitus võib olla ilma järelevalveta, mis tähendab, et LLM-id on väidetavalt iseõppivad. Samuti on nad väga paindlikud, suutelised täitma selliseid ülesandeid nagu küsimustele vastamine, teksti kirjutamine, keelte tõlkimine ja lausete lõpetamine. Tuntud näited hõlmavad Open AI GPT-3 mudelit ja selle ligipääsetavat lisandmoodulit ChatGPT, mis suudab ennustada juba suhteliselt väikese arvu sisendite või "viipade" põhjal.

Anorgaanilisest sünteesist "mõistva" LLM-i loomiseks juhtisid teadlased Miao Liu, füüsik Hiina Teaduste Akadeemia füüsikainstituut, Peking ja asutaja atomly.net, tarnis juhtivat avatud lähtekoodiga LLM-i nimega LLaMA2-7B täiendavate teaduslike andmetega. Seda tehes, ütleb Liu, nad "võimaldasid seda mõelda inimese tunnetusega sarnaselt, kasutades minimaalset andmekogumit". Nad koolitasid mudelit, kasutades keemilise sünteesi protokolle, mis ekstraheeriti 13 878 anorgaanilisest ühendist, mille nad hankisid enam kui neljast miljonist teaduspublikatsioonist koosnevast kogust. Kristin Seeder ja kolleegid Lawrence Berkeley riiklik labor USA-s.

"Need koolitusandmed võimaldavad mudelil anorgaanilise sünteesi küsimusi mõista ja neile vastata samamoodi, nagu teadlik ekspert teeks, " selgitab Liu. "Näiteks kui küsitakse LiMnO sünteesi kohta2, võib MatChat anda üksikasjaliku vastuse, mis sisaldab reaktsiooni eelkäijaid, võrrandeid ja suhtelisi viiteid kirjanduses.

Tema sõnul võib tüüpiline vahetus välja näha umbes selline:

Küsimus: kuidas LiMnO2 sünteesida?

Vastus: LiMnO2 saab valmistada Li2CO3-st ja MnO2-st tahkefaasilise reaktsiooni kaudu. Keemilise reaktsiooni võrrand on (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Eelühendid segatakse, kaltsineeritakse 800.0 °C juures õhu käes 2.0 tundi, segatakse, kaltsineeritakse õhu käes temperatuuril 800.0 °C 2.0 tundi. Üksikasjaliku retsepti leiate kirjandusest ...

Uus projekti idee

MatChati projekti idee sai Liu 2023. aasta augustis pärast seda, kui ta osales Inteli korraldatud konverentsil infotehnoloogia ja tehisintellekti teemal. "Kuigi koosolekul polnud teadusega midagi pistmist, õppisin palju AI ja selle rakenduste trendikate teemade kohta," ütleb Liu. "See inspireeris mind rakendama LLM-i sünteesiretseptide ennustamiseks."

Projekti elluviimiseks tegi Liu koostööd kolleegiga, Zongguo Wangja doktorant, Fankai Xie. Samal ajal kui Xie mudelit koolitas, ehitas Wang selle vabalt kättesaadav veebiplatvorm mis võimaldab tal kasutajatega suhelda.

"Kuigi MatChat ei pruugi seda tüüpi rakenduste jaoks olla parim lahendus, on meie töö üks esimesi püüdlusi rakendada LLM-i teaduslikus kontekstis," räägib Liu. Füüsika maailm. "Loodame, et meie uuring toimib katalüsaatorina sarnaste AI-tööriistade loomisel mitmes valdkonnas."

Tulevikku vaadates kavatsevad teadlased täiustada MatChati võimalusi, laiendades selle andmestikku ning integreerides arvutus- ja eksperimentaalandmed oma ulatuslikust materjaliteaduse andmebaasist atomly.net, aga ka peatsest anorgaaniliste materjalide sünteesiks mõeldud autonoomsest robotlaborist. "Neid ressursse kasutades on meie eesmärk jätkata täiustatud tehisintellekti tööriistade väljatöötamist selles valdkonnas, " ütleb Liu.

Uus tehisintellekti mudel on üksikasjalikult kirjeldatud Hiina füüsika B, ja ilmus trükieelses vormis arXiv umbes samal ajal kui a eeltrükk Microsofti teadlastelt kes demonstreeris sarnast saavutust, kasutades populaarset ChatGPT4 LLM-i.

Ajatempel:

Veel alates Füüsika maailm