Suuri kielimalli ennustaa epäorgaanisten yhdisteiden valmistusta – Physics World

Suuri kielimalli ennustaa epäorgaanisten yhdisteiden valmistusta – Physics World

Kaaviokaavio, joka näyttää kuinka tiimi koulutti uutta mallia

Kiinalaiset tutkijat ovat hienosäätäneet olemassa olevaa laajaa kielimallia (LLM) luodakseen järjestelmän, joka voi ennustaa epäorgaanisen yhdisteen syntetisoimiseen tarvittavat vaiheet. Vaikka uusi malli, nimeltään MatChat, vaatii lisähientämistä ennen kuin sitä voidaan käyttää laboratoriossa, sen kehittäjät sanovat, että se edustaa tärkeää varhaista yritystä generatiivisen tekoälyn soveltamisessa tieteellisessä kontekstissa.

LLM:t ovat tekoälyn tyyppi, joka poimii merkityksiä tekstisarjasta. Tätä varten heidät on ensin koulutettava valtaviin tietomääriin. Tämä koulutus voi kuitenkin olla ilman valvontaa, mikä tarkoittaa, että LLM:ien sanotaan olevan itseoppivia. He ovat myös erittäin joustavia ja pystyvät suorittamaan tehtäviä, kuten vastaamaan kysymyksiin, kirjoittamaan tekstiä, kääntämään kieliä ja viimeistelemään lauseita. Tunnettuja esimerkkejä ovat Open AI:n GPT-3-malli ja sen helppokäyttöinen lisäosa, ChatGPT, joka osaa jo tehdä ennusteita suhteellisen pienestä määrästä syötteitä tai "kehotteita".

Luodakseen LLM:n, joka "ymmärtää" epäorgaanisen synteesin, tutkijat johtivat Miao Liu, fyysikko yrityksessä Fysiikan instituutti, Kiinan tiedeakatemia, Peking ja perustaja atomly.net, toimitti johtavalle avoimen lähdekoodin LLM:lle LLaMA2-7B tieteellistä lisätietoa. Liu sanoo, että tehdessään niin, he "valtuuttavat sen ajattelemaan ihmisen kognition tavoin minimaalisen tietojoukon avulla". He kouluttivat mallia käyttämällä kemiallisia synteesiprotokollia, jotka on uutettu 13 878 epäorgaanisesta yhdisteestä, jotka he hankkivat yli neljän miljoonan tieteellisen julkaisun kokoelmasta, jonka on kokoanut Kristin Ceder ja kollegat Lawrence Berkeleyn kansallinen laboratorio Yhdysvalloissa.

"Tämä koulutusdata antaa mallille mahdollisuuden ymmärtää epäorgaanisen synteesin kysymyksiä ja vastata niihin samalla tavalla kuin asiantunteva asiantuntija tekisi", Liu selittää. ”Esimerkiksi kun kysytään LiMnO:n syntetisoinnista2, MatChat voi tarjota yksityiskohtaisen vastauksen, joka sisältää reaktion esiasteita, yhtälöitä ja suhteellisia viittauksia kirjallisuudessa."

Tyypillinen vaihto, hän sanoo, saattaa näyttää tältä:

Kysymys: kuinka LiMnO2 syntetisoidaan?

Vastaus: LiMnO2 voidaan valmistaa Li2CO3:sta ja MnO2:sta kiinteän olomuodon reaktiolla. Kemiallinen reaktioyhtälö on (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Prekursorit sekoitetaan, kalsinoidaan 800.0 °C:ssa ilmassa 2.0 tuntia, sekoitetaan, kalsinoidaan 800.0 °C:ssa ilmassa 2.0 tuntia. Yksityiskohtainen resepti löytyy kirjallisuudesta…

Uusi projekti-idea

Liu sai idean MatChat-projektiin elokuussa 2023, kun hän osallistui Intelin järjestämään tietotekniikkaa ja tekoälyä käsittelevään konferenssiin. "Vaikka kokouksella ei ollut mitään tekemistä tieteen kanssa, opin paljon tekoälyn ja sen sovellusten trendiaiheista", Liu sanoo. "Se inspiroi minua soveltamaan LLM:ää synteesireseptien ennustamiseen."

Hankkeen toteuttamiseksi Liu teki yhteistyötä kollegansa kanssa, Zongguo Wang, ja tohtoriopiskelija, Fankai Xie. Kun Xie koulutti mallia, Wang rakensi sen ilmainen online-alusta jonka avulla se voi olla vuorovaikutuksessa käyttäjien kanssa.

"Vaikka MatChat ei ehkä ole lopullinen ratkaisu tämäntyyppisiin sovelluksiin, työmme on yksi ensimmäisistä pyrkimyksistä soveltaa LLM:ää tieteellisessä kontekstissa", Liu kertoo. Fysiikan maailma. "Toivomme, että tutkimuksemme toimii katalysaattorina samankaltaisten tekoälytyökalujen luomiselle useilla aloilla."

Tulevaisuudessa tutkijat aikovat hioa MatChatin kykyjä laajentamalla sen tietojoukkoa ja integroimalla laskennallista ja kokeellista dataa omasta laajasta materiaalitieteen tietokannastaan, atomly.net, sekä tulevasta robottiautonomisesta laboratoriosta epäorgaanisten materiaalien synteesiä varten. "Hyödyntämällä näitä resursseja pyrimme jatkamaan edistyneiden tekoälytyökalujen kehittämistä tälle alalle", Liu sanoo.

Uusi AI-malli on kuvattu yksityiskohtaisesti Kiinalainen fysiikka B, ja ilmestyi preprint-muodossa arXiv suunnilleen samaan aikaan kuin a preprint Microsoftin tutkijoilta joka osoitti samanlaisen saavutuksen käyttämällä suosittua ChatGPT4 LLM:ää.

Aikaleima:

Lisää aiheesta Fysiikan maailma