Велика мовна модель передбачає, як створювати неорганічні сполуки

Перевидано Платоном

читають: 0

Схематична діаграма, яка показує, як команда тренувала нову модель — Команда навчила нову модель, використовуючи протоколи хімічного синтезу, отримані з 13 878 неорганічних сполук, які вони взяли з колекції з понад чотирьох мільйонів наукових публікацій. Надано: *Китайська фізика Б*

Дослідники з Китаю налаштували існуючу велику мовну модель (LLM), щоб створити систему, яка може передбачити кроки, необхідні для синтезу неорганічної сполуки. Хоча нова модель, яка отримала назву MatChat, потребує подальшого вдосконалення, перш ніж її можна буде використовувати в лабораторії, її розробники кажуть, що вона представляє важливий ранній крок у застосуванні генеративного штучного інтелекту в науковому контексті.

LLM — це тип штучного інтелекту, який витягує значення з послідовності тексту. Для цього їх потрібно спочатку навчити працювати з величезними масивами даних. Однак це навчання може проходити без нагляду, а це означає, що магістри права навчаються самостійно. Вони також дуже гнучкі, здатні виконувати такі завдання, як відповіді на запитання, написання тексту, переклад мов і завершення речень. Добре відомі приклади включають модель GPT-3 Open AI та її доступний допоміжний продукт ChatGPT, який уже може робити прогнози на основі відносно невеликої кількості вхідних даних або «підказок».

Щоб створити LLM, який «розуміє» неорганічний синтез, дослідники під керівництвом Мяо Лю, фізик в Інститут фізики Китайської академії наук, Пекін і засновник с atomly.net, надав додаткові наукові дані провідній LLM з відкритим вихідним кодом під назвою LLaMA2-7B. Роблячи це, за словами Лю, вони «надають йому можливості думати, схоже на людське пізнання, використовуючи мінімальний набір даних». Вони навчили модель, використовуючи протоколи хімічного синтезу, отримані з 13 878 неорганічних сполук, які вони взяли з колекції з понад чотирьох мільйонів наукових публікацій, зібраних Крістін Седер та колеги по Лоуренс Берклі Національна лабораторія в США.

«Ці навчальні дані дозволяють моделі розуміти та відповідати на питання неорганічного синтезу так само, як це зробив би досвідчений експерт», — пояснює Лю. «Наприклад, на запитання про синтез LiMnO₂, MatChat може надати детальну відповідь, яка включає попередники реакції, рівняння та відносні посилання в літературі».

За його словами, типовий обмін може виглядати приблизно так:

Питання: як синтезувати LiMnO2?

Відповідь: LiMnO₂ можна виготовити з Li2CO3 і MnO2 за допомогою твердофазної реакції. Рівняння хімічної реакції має вигляд (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Попередники змішують, прожарюють при 800.0°C на повітрі протягом 2.0 год, змішують, прожарюють при 800.0°С на повітрі протягом 2.0 год. Детальний рецепт можна знайти в літературі…

Ідея нового проекту

Ідея проекту MatChat виникла у Лю в серпні 2023 року після того, як він відвідав конференцію, організовану Intel на тему інформаційних технологій та ШІ. «Хоча зустріч не мала нічого спільного з наукою, я дізнався багато нового про актуальні теми ШІ та його застосування», — каже Лю. «Це надихнуло мене застосувати LLM для прогнозування рецептів синтезу».

Щоб реалізувати проект, Лю об’єднався з колегою, Цзунго Ванта аспірант, Фанькай Се. Поки Се тренував модель, Ван створив вільно доступна онлайн-платформа що дозволяє йому взаємодіяти з користувачами.

«Хоча MatChat може не бути найкращим рішенням для такого типу програм, наша робота є одним із перших спроб застосувати LLM у науковому контексті», — розповідає Лю. Світ фізики. «Ми сподіваємося, що наше дослідження послужить каталізатором для створення подібних інструментів штучного інтелекту в багатьох сферах».

Як ChatGPT може допомогти фізикам у їхній щоденній роботі

У перспективі дослідники планують удосконалити можливості MatChat, розширивши його набір даних та об’єднавши обчислювальні та експериментальні дані з власної великої бази даних матеріалознавства atomly.net, а також роботизованої автономної лабораторії для синтезу неорганічних матеріалів. «Використовуючи ці ресурси, ми прагнемо продовжувати розробку передових інструментів штучного інтелекту для цієї сфери», — говорить Лю.

Нова модель штучного інтелекту детально описана в Китайська фізика Б, і з'явився у вигляді препринтів на ArXiv приблизно в той самий час, що й a препринт дослідників Microsoft який продемонстрував подібний результат за допомогою популярного ChatGPT4 LLM.

Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
джерело: https://physicsworld.com/a/large-language-model-predicts-how-to-make-inorganic-compounds/

Часова мітка: Січень 5, 2024

Часова мітка: Жовтень 3, 2023

Перевидано Платоном

Як ChatGPT може допомогти фізикам у їхній щоденній роботі

Кремнієві фотопомножувачі: готуються до застосування в гамма-астрономії – Physics World

Вчений-громадянин відкриває 34 коричневих карликів у подвійних системах

Магнітні монополі з’являються в гематиті – Physics World

«Великі обсерваторії» – нове покоління космічних телескопів НАСА та їхній вплив на наступне століття спостережної астрономії

Пасивний оптичний концентратор може підвищити ефективність сонячних батарей

Моделювання проливає світло на механізми пошкодження ДНК під час протонної терапії

Вітри змін: чи можуть високотехнологічні вітрильні судна зробити глобальне судноплавство екологічним?

Електронний «удар» видаляє окремі атоми з двовимірного матеріалу – Physics World

Пісня Pink Floyd відтворена за допомогою діяльності мозку, надсилаючи мистецтво на Місяць – Physics World

Xanadu розміщує квантову перевагу в хмарі

Мій улюблений кубіт: квантове моделювання та обчислення з надпровідними кубітами – Physics World

Про нас

Вертикальний пошук & Ai

платформа

Залишайтеся на зв'язку

рахунки