Un ampio modello linguistico prevede come creare composti inorganici – Physics World

Un ampio modello linguistico prevede come creare composti inorganici – Physics World

Diagramma schematico che mostra come il team ha addestrato il nuovo modello

Ricercatori in Cina hanno messo a punto un modello di linguaggio di grandi dimensioni (LLM) esistente per creare un sistema in grado di prevedere i passaggi necessari per sintetizzare un composto inorganico. Anche se il nuovo modello, soprannominato MatChat, necessita di ulteriore perfezionamento prima di poter essere impiegato in laboratorio, i suoi sviluppatori affermano che rappresenta un importante primo tentativo nell’applicazione dell’intelligenza artificiale generativa in un contesto scientifico.

Gli LLM sono un tipo di intelligenza artificiale che estrae significati da una sequenza di testo. Per fare questo devono prima essere addestrati su enormi quantità di dati. Tuttavia, questa formazione può non essere supervisionata, il che significa che si dice che i LLM siano ad autoapprendimento. Sono anche molto flessibili, in grado di svolgere compiti come rispondere a domande, scrivere testi, tradurre lingue e completare frasi. Esempi ben noti includono il modello GPT-3 di Open AI e il suo spin-off accessibile, ChatGPT, che può già fare previsioni da un numero relativamente piccolo di input o “prompt”.

Per creare un LLM che “comprende” la sintesi inorganica, i ricercatori guidati da Miao Liu, un fisico al Istituto di Fisica, Accademia Cinese delle Scienze, Pechino e fondatore di atomly.net, ha fornito dati scientifici aggiuntivi a un LLM open source leader chiamato LLaMA2-7B. In tal modo, afferma Liu, “gli consentono di pensare in modo simile alla cognizione umana utilizzando un set di dati minimo”. Hanno addestrato il modello utilizzando protocolli di sintesi chimica estratti da 13 composti inorganici, provenienti da una raccolta di oltre quattro milioni di pubblicazioni scientifiche compilate da Kristin Ceder e colleghi di Lawrence Berkeley National Laboratory negli Stati Uniti.

"Questi dati di addestramento consentono al modello di comprendere e rispondere alle domande di sintesi inorganica nello stesso modo in cui farebbe un esperto esperto", spiega Liu. “Ad esempio, quando viene interrogato sulla sintesi di LiMnO2, MatChat può fornire una risposta dettagliata che include precursori di reazione, equazioni e relativi riferimenti in letteratura.”

Uno scambio tipico, dice, potrebbe assomigliare a questo:

Domanda: come sintetizzare LiMnO2?

Risposta: LiMnO2 può essere ottenuto da Li2CO3 e MnO2 tramite una reazione allo stato solido. L'equazione della reazione chimica è (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). I precursori vengono miscelati, calcinati a 800.0°C in aria per 2.0 ore, miscelati, calcinati a 800.0°C in aria per 2.0 ore. La ricetta dettagliata può essere trovata in letteratura...

Una nuova idea progettuale

L'idea del progetto MatChat è venuta a Liu nell'agosto 2023, dopo aver partecipato a una conferenza organizzata da Intel sul tema della tecnologia dell'informazione e dell'intelligenza artificiale. "Sebbene l'incontro non avesse nulla a che fare con la scienza, ho imparato molto sugli argomenti di tendenza nel campo dell'intelligenza artificiale e delle sue applicazioni", afferma Liu. "Mi ha ispirato ad applicare il LLM alla previsione della ricetta di sintesi."

Per realizzare il progetto, Liu ha collaborato con un collega, Zongguo Wang, e uno studente di dottorato, Fankai Xie. Mentre Xie addestrava il modello, Wang costruiva il piattaforma on-line liberamente disponibile che gli consente di interagire con gli utenti.

"Anche se MatChat potrebbe non essere la soluzione definitiva per questo tipo di applicazione, il nostro lavoro rappresenta uno dei primi tentativi di applicare il LLM in un contesto scientifico", dice Liu Mondo della fisica. “Speriamo che il nostro studio serva da catalizzatore per la creazione di strumenti di intelligenza artificiale simili in più campi”.

Guardando al futuro, i ricercatori intendono perfezionare le capacità di MatChat espandendo il suo set di dati e integrando dati computazionali e sperimentali dal loro ampio database di scienza dei materiali, atomly.net, nonché da un prossimo laboratorio robotizzato autonomo per la sintesi di materiali inorganici. “Sfruttando queste risorse, miriamo a continuare a sviluppare strumenti avanzati di intelligenza artificiale per questo campo”, afferma Liu.

Il nuovo modello di intelligenza artificiale è dettagliato in Fisica cinese B, ed è apparso in forma prestampata sul arXiv più o meno nello stesso periodo di a prestampa dai ricercatori di Microsoft che ha dimostrato un'impresa simile utilizzando il popolare ChatGPT4 LLM.

Timestamp:

Di più da Mondo della fisica