Suuri kielimalli ennustaa epäorgaanisten yhdisteiden valmistamisen

Julkaissut Platon

seuraajia: 0

Kaaviokaavio, joka näyttää kuinka tiimi koulutti uutta mallia — Ryhmä koulutti uuden mallin käyttämällä kemiallisia synteesiprotokollia, jotka on uutettu 13 878 epäorgaanisesta yhdisteestä, jotka he hankkivat yli neljän miljoonan tieteellisen julkaisun kokoelmasta. Kohteliaisuus: *Kiinalainen fysiikka B*

Kiinalaiset tutkijat ovat hienosäätäneet olemassa olevaa laajaa kielimallia (LLM) luodakseen järjestelmän, joka voi ennustaa epäorgaanisen yhdisteen syntetisoimiseen tarvittavat vaiheet. Vaikka uusi malli, nimeltään MatChat, vaatii lisähientämistä ennen kuin sitä voidaan käyttää laboratoriossa, sen kehittäjät sanovat, että se edustaa tärkeää varhaista yritystä generatiivisen tekoälyn soveltamisessa tieteellisessä kontekstissa.

LLM:t ovat tekoälyn tyyppi, joka poimii merkityksiä tekstisarjasta. Tätä varten heidät on ensin koulutettava valtaviin tietomääriin. Tämä koulutus voi kuitenkin olla ilman valvontaa, mikä tarkoittaa, että LLM:ien sanotaan olevan itseoppivia. He ovat myös erittäin joustavia ja pystyvät suorittamaan tehtäviä, kuten vastaamaan kysymyksiin, kirjoittamaan tekstiä, kääntämään kieliä ja viimeistelemään lauseita. Tunnettuja esimerkkejä ovat Open AI:n GPT-3-malli ja sen helppokäyttöinen lisäosa, ChatGPT, joka osaa jo tehdä ennusteita suhteellisen pienestä määrästä syötteitä tai "kehotteita".

Luodakseen LLM:n, joka "ymmärtää" epäorgaanisen synteesin, tutkijat johtivat Miao Liu, fyysikko yrityksessä Fysiikan instituutti, Kiinan tiedeakatemia, Peking ja perustaja atomly.net, toimitti johtavalle avoimen lähdekoodin LLM:lle LLaMA2-7B tieteellistä lisätietoa. Liu sanoo, että tehdessään niin, he "valtuuttavat sen ajattelemaan ihmisen kognition tavoin minimaalisen tietojoukon avulla". He kouluttivat mallia käyttämällä kemiallisia synteesiprotokollia, jotka on uutettu 13 878 epäorgaanisesta yhdisteestä, jotka he hankkivat yli neljän miljoonan tieteellisen julkaisun kokoelmasta, jonka on kokoanut Kristin Ceder ja kollegat Lawrence Berkeleyn kansallinen laboratorio Yhdysvalloissa.

"Tämä koulutusdata antaa mallille mahdollisuuden ymmärtää epäorgaanisen synteesin kysymyksiä ja vastata niihin samalla tavalla kuin asiantunteva asiantuntija tekisi", Liu selittää. ”Esimerkiksi kun kysytään LiMnO:n syntetisoinnista₂, MatChat voi tarjota yksityiskohtaisen vastauksen, joka sisältää reaktion esiasteita, yhtälöitä ja suhteellisia viittauksia kirjallisuudessa."

Tyypillinen vaihto, hän sanoo, saattaa näyttää tältä:

Kysymys: kuinka LiMnO2 syntetisoidaan?

Vastaus: LiMnO₂ voidaan valmistaa Li2CO3:sta ja MnO2:sta kiinteän olomuodon reaktiolla. Kemiallinen reaktioyhtälö on (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Prekursorit sekoitetaan, kalsinoidaan 800.0 °C:ssa ilmassa 2.0 tuntia, sekoitetaan, kalsinoidaan 800.0 °C:ssa ilmassa 2.0 tuntia. Yksityiskohtainen resepti löytyy kirjallisuudesta…

Uusi projekti-idea

Liu sai idean MatChat-projektiin elokuussa 2023, kun hän osallistui Intelin järjestämään tietotekniikkaa ja tekoälyä käsittelevään konferenssiin. "Vaikka kokouksella ei ollut mitään tekemistä tieteen kanssa, opin paljon tekoälyn ja sen sovellusten trendiaiheista", Liu sanoo. "Se inspiroi minua soveltamaan LLM:ää synteesireseptien ennustamiseen."

Hankkeen toteuttamiseksi Liu teki yhteistyötä kollegansa kanssa, Zongguo Wang, ja tohtoriopiskelija, Fankai Xie. Kun Xie koulutti mallia, Wang rakensi sen ilmainen online-alusta jonka avulla se voi olla vuorovaikutuksessa käyttäjien kanssa.

"Vaikka MatChat ei ehkä ole lopullinen ratkaisu tämäntyyppisiin sovelluksiin, työmme on yksi ensimmäisistä pyrkimyksistä soveltaa LLM:ää tieteellisessä kontekstissa", Liu kertoo. Fysiikan maailma. "Toivomme, että tutkimuksemme toimii katalysaattorina samankaltaisten tekoälytyökalujen luomiselle useilla aloilla."

Kuinka ChatGPT voi auttaa fyysikoita heidän päivittäisessä työssään

Tulevaisuudessa tutkijat aikovat hioa MatChatin kykyjä laajentamalla sen tietojoukkoa ja integroimalla laskennallista ja kokeellista dataa omasta laajasta materiaalitieteen tietokannastaan, atomly.net, sekä tulevasta robottiautonomisesta laboratoriosta epäorgaanisten materiaalien synteesiä varten. "Hyödyntämällä näitä resursseja pyrimme jatkamaan edistyneiden tekoälytyökalujen kehittämistä tälle alalle", Liu sanoo.

Uusi AI-malli on kuvattu yksityiskohtaisesti Kiinalainen fysiikka B, ja ilmestyi preprint-muodossa arXiv suunnilleen samaan aikaan kuin a preprint Microsoftin tutkijoilta joka osoitti samanlaisen saavutuksen käyttämällä suosittua ChatGPT4 LLM:ää.

SEO-pohjainen sisällön ja PR-jakelu. Vahvista jo tänään.
PlatoData.Network Vertical Generatiivinen Ai. Vahvista itseäsi. Pääsy tästä.
PlatoAiStream. Web3 Intelligence. Tietoa laajennettu. Pääsy tästä.
PlatoESG. hiili, CleanTech, energia, ympäristö, Aurinko, Jätehuolto. Pääsy tästä.
PlatonHealth. Biotekniikan ja kliinisten kokeiden älykkyys. Pääsy tästä.
Lähde: https://physicsworld.com/a/large-language-model-predicts-how-to-make-inorganic-compounds/

Aikaleima: Tammikuu 5, 2024

Aikaleima: Lokakuu 3, 2023

Julkaissut Platon

Kuinka ChatGPT voi auttaa fyysikoita heidän päivittäisessä työssään

Piivalomonistimet: valmistautuminen gammasäteilyn astronomian sovelluksiin – Physics World

Kansalaistutkija löytää 34 ruskeaa kääpiötä binäärijärjestelmistä

Magneettiset monopolit ilmestyvät hematiitissa – Physics World

"Suuret observatoriot" – NASAn avaruusteleskooppien seuraava sukupolvi ja niiden vaikutus seuraavan vuosisadan havaintoastronomiaan

Passiivinen optinen keskitin voisi lisätä aurinkokennojen tehokkuutta

Simulaatiot valaisevat DNA-vaurion mekanismeja protonihoidon aikana

Muutoksen tuulet: voisivatko huipputekniset purjealukset tehdä maailmanlaajuisesta merenkulusta vihreää?

Elektronien "potku" poistaa yksittäisiä atomeja 2D-materiaalista – Physics World

Pink Floydin kappale on luotu uudelleen aivotoiminnasta ja lähettää taidetta Kuuhun – fysiikan maailmaan

Xanadu tuo kvanttiedun pilveen

Oma suosikki Qubit: kvanttisimulaatio ja laskenta suprajohtavilla kubiteilla – Physics World

Tietoa meistä

Pystysuuntainen haku ja Ai

foorumi

Pysy yhteydessä

Tili