Model bahasa besar memprediksi cara membuat senyawa anorganik – Dunia Fisika

Model bahasa besar memprediksi cara membuat senyawa anorganik – Dunia Fisika

Diagram skematik menunjukkan cara tim melatih model baru

Para peneliti di Tiongkok telah menyempurnakan model bahasa besar (LLM) yang ada untuk menciptakan sistem yang dapat memprediksi langkah-langkah yang diperlukan untuk mensintesis senyawa anorganik. Meskipun model baru, yang diberi nama MatChat, memerlukan penyempurnaan lebih lanjut sebelum dapat digunakan di laboratorium, para pengembangnya mengatakan bahwa model ini merupakan upaya awal yang penting dalam penerapan kecerdasan buatan generatif dalam konteks ilmiah.

LLM adalah jenis kecerdasan buatan yang mengekstraksi makna dari serangkaian teks. Untuk melakukan hal ini, pertama-tama mereka harus dilatih mengenai data dalam jumlah besar. Namun pelatihan ini bisa tanpa pengawasan, artinya LLM dikatakan belajar mandiri. Mereka juga sangat fleksibel, mampu melakukan tugas-tugas seperti menjawab pertanyaan, menulis teks, menerjemahkan bahasa dan menyelesaikan kalimat. Contoh yang terkenal adalah model GPT-3 Open AI dan spin-off yang dapat diakses, ChatGPT, yang sudah dapat membuat prediksi dari sejumlah kecil masukan atau “perintah”.

Untuk membuat LLM yang “memahami” sintesis anorganik, peneliti dipimpin oleh Miao Liu, seorang fisikawan di Institut Fisika, Akademi Ilmu Pengetahuan Tiongkok, Beijing dan pendiri atomly.net, memberikan LLM sumber terbuka terkemuka yang disebut LLaMA2-7B dengan data ilmiah tambahan. Dengan melakukan hal ini, kata Liu, mereka “memberdayakannya agar berpikir serupa dengan kognisi manusia dengan menggunakan kumpulan data minimal”. Mereka melatih model tersebut menggunakan protokol sintesis kimia yang diekstraksi dari 13 senyawa anorganik, yang bersumber dari koleksi lebih dari empat juta publikasi ilmiah yang dikumpulkan oleh Kristin Ceder dan rekan-rekan di Lawrence Berkeley National Laboratory di Amerika.

“Data pelatihan ini memungkinkan model untuk memahami dan merespons pertanyaan sintesis anorganik dengan cara yang sama seperti yang dilakukan oleh pakar yang berpengetahuan luas,” jelas Liu. “Misalnya ketika ditanya tentang sintesis LiMnO2, MatChat dapat memberikan respons terperinci yang mencakup prekursor reaksi, persamaan, dan referensi relatif dalam literatur.”

Pertukaran yang khas, katanya, mungkin terlihat seperti ini:

Pertanyaan: bagaimana cara mensintesis LiMnO2?

Jawaban: LiMnO2 dapat dibuat dari Li2CO3, dan MnO2 melalui reaksi keadaan padat. Persamaan reaksi kimianya adalah (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Prekursor dicampur, dikalsinasi pada 800.0°C di udara selama 2.0 jam, dicampur, dikalsinasi pada 800.0°C di udara selama 2.0 jam. Resep detailnya dapat ditemukan di literatur…

Ide proyek baru

Liu mendapatkan ide untuk proyek MatChat pada Agustus 2023, setelah ia menghadiri konferensi yang diselenggarakan oleh Intel mengenai topik teknologi informasi dan AI. “Meskipun pertemuan tersebut tidak ada hubungannya dengan sains, saya belajar banyak tentang topik yang sedang tren di bidang AI dan penerapannya,” kata Liu. “Ini menginspirasi saya untuk menerapkan LLM pada prediksi resep sintesis.”

Untuk mewujudkan proyek ini, Liu bekerja sama dengan seorang rekannya, Zongguo Wang, dan seorang mahasiswa PhD, Fankai Xie. Saat Xie melatih modelnya, Wang membangunnya platform online yang tersedia secara gratis yang memungkinkannya berinteraksi dengan pengguna.

“Meskipun MatChat mungkin bukan solusi akhir untuk jenis aplikasi ini, pekerjaan kami mewakili salah satu upaya awal untuk menerapkan LLM dalam konteks ilmiah,” kata Liu. Dunia Fisika. “Kami berharap penelitian kami dapat menjadi katalisator bagi penciptaan alat AI serupa di berbagai bidang.”

Ke depan, para peneliti berencana untuk menyempurnakan kemampuan MatChat dengan memperluas kumpulan datanya dan mengintegrasikan data komputasi dan eksperimen dari database ilmu material mereka yang luas, atomly.net, serta laboratorium otonom robotik untuk sintesis bahan anorganik. “Dengan memanfaatkan sumber daya ini, kami bertujuan untuk terus mengembangkan alat AI canggih untuk bidang ini,” kata Liu.

Model AI baru dirinci dalam Fisika Cina B, dan muncul dalam bentuk pracetak di arXiv sekitar waktu yang sama dengan a pracetak dari para peneliti di Microsoft yang mendemonstrasikan prestasi serupa menggunakan ChatGPT4 LLM yang populer.

Stempel Waktu:

Lebih dari Dunia Fisika