Велика мовна модель передбачає, як створювати неорганічні сполуки – Physics World

Велика мовна модель передбачає, як створювати неорганічні сполуки – Physics World

Схематична діаграма, яка показує, як команда тренувала нову модель

Дослідники з Китаю налаштували існуючу велику мовну модель (LLM), щоб створити систему, яка може передбачити кроки, необхідні для синтезу неорганічної сполуки. Хоча нова модель, яка отримала назву MatChat, потребує подальшого вдосконалення, перш ніж її можна буде використовувати в лабораторії, її розробники кажуть, що вона представляє важливий ранній крок у застосуванні генеративного штучного інтелекту в науковому контексті.

LLM — це тип штучного інтелекту, який витягує значення з послідовності тексту. Для цього їх потрібно спочатку навчити працювати з величезними масивами даних. Однак це навчання може проходити без нагляду, а це означає, що магістри права навчаються самостійно. Вони також дуже гнучкі, здатні виконувати такі завдання, як відповіді на запитання, написання тексту, переклад мов і завершення речень. Добре відомі приклади включають модель GPT-3 Open AI та її доступний допоміжний продукт ChatGPT, який уже може робити прогнози на основі відносно невеликої кількості вхідних даних або «підказок».

Щоб створити LLM, який «розуміє» неорганічний синтез, дослідники під керівництвом Мяо Лю, фізик в Інститут фізики Китайської академії наук, Пекін і засновник с atomly.net, надав додаткові наукові дані провідній LLM з відкритим вихідним кодом під назвою LLaMA2-7B. Роблячи це, за словами Лю, вони «надають йому можливості думати, схоже на людське пізнання, використовуючи мінімальний набір даних». Вони навчили модель, використовуючи протоколи хімічного синтезу, отримані з 13 878 неорганічних сполук, які вони взяли з колекції з понад чотирьох мільйонів наукових публікацій, зібраних Крістін Седер та колеги по Лоуренс Берклі Національна лабораторія в США.

«Ці навчальні дані дозволяють моделі розуміти та відповідати на питання неорганічного синтезу так само, як це зробив би досвідчений експерт», — пояснює Лю. «Наприклад, на запитання про синтез LiMnO2, MatChat може надати детальну відповідь, яка включає попередники реакції, рівняння та відносні посилання в літературі».

За його словами, типовий обмін може виглядати приблизно так:

Питання: як синтезувати LiMnO2?

Відповідь: LiMnO2 можна виготовити з Li2CO3 і MnO2 за допомогою твердофазної реакції. Рівняння хімічної реакції має вигляд (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Попередники змішують, прожарюють при 800.0°C на повітрі протягом 2.0 год, змішують, прожарюють при 800.0°С на повітрі протягом 2.0 год. Детальний рецепт можна знайти в літературі…

Ідея нового проекту

Ідея проекту MatChat виникла у Лю в серпні 2023 року після того, як він відвідав конференцію, організовану Intel на тему інформаційних технологій та ШІ. «Хоча зустріч не мала нічого спільного з наукою, я дізнався багато нового про актуальні теми ШІ та його застосування», — каже Лю. «Це надихнуло мене застосувати LLM для прогнозування рецептів синтезу».

Щоб реалізувати проект, Лю об’єднався з колегою, Цзунго Ванта аспірант, Фанькай Се. Поки Се тренував модель, Ван створив вільно доступна онлайн-платформа що дозволяє йому взаємодіяти з користувачами.

«Хоча MatChat може не бути найкращим рішенням для такого типу програм, наша робота є одним із перших спроб застосувати LLM у науковому контексті», — розповідає Лю. Світ фізики. «Ми сподіваємося, що наше дослідження послужить каталізатором для створення подібних інструментів штучного інтелекту в багатьох сферах».

У перспективі дослідники планують удосконалити можливості MatChat, розширивши його набір даних та об’єднавши обчислювальні та експериментальні дані з власної великої бази даних матеріалознавства atomly.net, а також роботизованої автономної лабораторії для синтезу неорганічних матеріалів. «Використовуючи ці ресурси, ми прагнемо продовжувати розробку передових інструментів штучного інтелекту для цієї сфери», — говорить Лю.

Нова модель штучного інтелекту детально описана в Китайська фізика Б, і з'явився у вигляді препринтів на ArXiv приблизно в той самий час, що й a препринт дослідників Microsoft який продемонстрував подібний результат за допомогою популярного ChatGPT4 LLM.

Часова мітка:

Більше від Світ фізики