Дослідники з Китаю налаштували існуючу велику мовну модель (LLM), щоб створити систему, яка може передбачити кроки, необхідні для синтезу неорганічної сполуки. Хоча нова модель, яка отримала назву MatChat, потребує подальшого вдосконалення, перш ніж її можна буде використовувати в лабораторії, її розробники кажуть, що вона представляє важливий ранній крок у застосуванні генеративного штучного інтелекту в науковому контексті.
LLM — це тип штучного інтелекту, який витягує значення з послідовності тексту. Для цього їх потрібно спочатку навчити працювати з величезними масивами даних. Однак це навчання може проходити без нагляду, а це означає, що магістри права навчаються самостійно. Вони також дуже гнучкі, здатні виконувати такі завдання, як відповіді на запитання, написання тексту, переклад мов і завершення речень. Добре відомі приклади включають модель GPT-3 Open AI та її доступний допоміжний продукт ChatGPT, який уже може робити прогнози на основі відносно невеликої кількості вхідних даних або «підказок».
Щоб створити LLM, який «розуміє» неорганічний синтез, дослідники під керівництвом Мяо Лю, фізик в Інститут фізики Китайської академії наук, Пекін і засновник с atomly.net, надав додаткові наукові дані провідній LLM з відкритим вихідним кодом під назвою LLaMA2-7B. Роблячи це, за словами Лю, вони «надають йому можливості думати, схоже на людське пізнання, використовуючи мінімальний набір даних». Вони навчили модель, використовуючи протоколи хімічного синтезу, отримані з 13 878 неорганічних сполук, які вони взяли з колекції з понад чотирьох мільйонів наукових публікацій, зібраних Крістін Седер та колеги по Лоуренс Берклі Національна лабораторія в США.
«Ці навчальні дані дозволяють моделі розуміти та відповідати на питання неорганічного синтезу так само, як це зробив би досвідчений експерт», — пояснює Лю. «Наприклад, на запитання про синтез LiMnO2, MatChat може надати детальну відповідь, яка включає попередники реакції, рівняння та відносні посилання в літературі».
За його словами, типовий обмін може виглядати приблизно так:
Питання: як синтезувати LiMnO2?
Відповідь: LiMnO2 можна виготовити з Li2CO3 і MnO2 за допомогою твердофазної реакції. Рівняння хімічної реакції має вигляд (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Попередники змішують, прожарюють при 800.0°C на повітрі протягом 2.0 год, змішують, прожарюють при 800.0°С на повітрі протягом 2.0 год. Детальний рецепт можна знайти в літературі…
Ідея нового проекту
Ідея проекту MatChat виникла у Лю в серпні 2023 року після того, як він відвідав конференцію, організовану Intel на тему інформаційних технологій та ШІ. «Хоча зустріч не мала нічого спільного з наукою, я дізнався багато нового про актуальні теми ШІ та його застосування», — каже Лю. «Це надихнуло мене застосувати LLM для прогнозування рецептів синтезу».
Щоб реалізувати проект, Лю об’єднався з колегою, Цзунго Ванта аспірант, Фанькай Се. Поки Се тренував модель, Ван створив вільно доступна онлайн-платформа що дозволяє йому взаємодіяти з користувачами.
«Хоча MatChat може не бути найкращим рішенням для такого типу програм, наша робота є одним із перших спроб застосувати LLM у науковому контексті», — розповідає Лю. Світ фізики. «Ми сподіваємося, що наше дослідження послужить каталізатором для створення подібних інструментів штучного інтелекту в багатьох сферах».
Як ChatGPT може допомогти фізикам у їхній щоденній роботі
У перспективі дослідники планують удосконалити можливості MatChat, розширивши його набір даних та об’єднавши обчислювальні та експериментальні дані з власної великої бази даних матеріалознавства atomly.net, а також роботизованої автономної лабораторії для синтезу неорганічних матеріалів. «Використовуючи ці ресурси, ми прагнемо продовжувати розробку передових інструментів штучного інтелекту для цієї сфери», — говорить Лю.
Нова модель штучного інтелекту детально описана в Китайська фізика Б, і з'явився у вигляді препринтів на ArXiv приблизно в той самий час, що й a препринт дослідників Microsoft який продемонстрував подібний результат за допомогою популярного ChatGPT4 LLM.
- Розповсюдження контенту та PR на основі SEO. Отримайте посилення сьогодні.
- PlatoData.Network Vertical Generative Ai. Додайте собі сили. Доступ тут.
- PlatoAiStream. Web3 Intelligence. Розширення знань. Доступ тут.
- ПлатонЕСГ. вуглець, CleanTech, Енергія, Навколишнє середовище, Сонячна, Поводження з відходами. Доступ тут.
- PlatoHealth. Розвідка про біотехнології та клінічні випробування. Доступ тут.
- джерело: https://physicsworld.com/a/large-language-model-predicts-how-to-make-inorganic-compounds/
- :є
- : ні
- $UP
- 1
- 13
- 160
- 2023
- 750
- a
- Здатний
- МЕНЮ
- доступною
- через
- Додатковий
- просунутий
- після
- AI
- мета
- AIR
- подібний
- дозволяє
- вже
- Також
- хоча
- суми
- an
- та
- з'явився
- додаток
- застосування
- Застосовувати
- Застосування
- ЕСТЬ
- навколо
- штучний
- штучний інтелект
- AS
- At
- Серпня
- автономний
- доступний
- BE
- перед тим
- Берклі
- Brain
- побудований
- by
- званий
- CAN
- можливості
- Каталізатор
- ChatGPT
- хімічний
- Китай
- китайський
- клацання
- пізнання
- колега
- колеги
- збір
- скомпільований
- завершення
- З'єднання
- обчислювальна
- комп'ютер
- конференція
- контекст
- продовжувати
- створювати
- створення
- щодня
- дані
- Database
- продемонстрований
- докладно
- розробників
- розвивається
- do
- справи
- охрестили
- Рано
- ed
- працевлаштований
- дозволяє
- починання
- рівняння
- приклад
- Приклади
- обмін
- існуючий
- розширюється
- експериментальний
- експерт
- Пояснює
- обширний
- Виписки
- подвиг
- поле
- Поля
- Перший
- гнучкий
- для
- форма
- майбутній
- Вперед
- знайдений
- засновник
- чотири
- від
- далі
- генеративний
- GitHub
- є
- було
- траплятися
- Мати
- he
- допомога
- надія
- Як
- How To
- Однак
- HTTP
- HTTPS
- величезний
- людина
- i
- ідея
- IEEE
- зображення
- важливо
- in
- включати
- includes
- інформація
- інформаційна технологія
- неорганічний
- витрати
- натхненний
- Інтеграція
- Intel
- Інтелект
- взаємодіяти
- питання
- IT
- ЙОГО
- JPG
- лабораторія
- мова
- мови
- великий
- провідний
- Led
- як
- літератури
- LLM
- подивитися
- серія
- made
- зробити
- Матеріали
- макс-ширина
- me
- сенс
- значення
- засідання
- може бути
- мільйона
- мінімальний
- змішаний
- модель
- множинний
- повинен
- National
- потреби
- мережу
- Нові
- нічого
- номер
- of
- on
- ONE
- онлайн
- відкрити
- з відкритим вихідним кодом
- or
- Організований
- наші
- над
- власний
- Виконувати
- Вчений ступінь
- Фізика
- Світ фізики
- план
- plato
- Інформація про дані Платона
- PlatoData
- популярний
- передбачати
- прогноз
- Прогнози
- Прогнози
- проект
- протоколи
- забезпечувати
- публікаціям
- питань
- реакція
- рецепт
- посилання
- удосконалювати
- відносний
- щодо
- представляє
- вимагається
- Дослідники
- ресурси
- Реагувати
- відповідь
- Зазначений
- то ж
- say
- говорить
- наука
- НАУКИ
- науковий
- Послідовність
- служити
- аналогічний
- невеликий
- So
- рішення
- що в сім'ї щось
- джерело
- заходи
- студент
- Вивчення
- тема
- такі
- поставляється
- синтез
- синтезувати
- система
- завдання
- команда
- об'єдналися
- Технологія
- розповідає
- текст
- Що
- Команда
- їх
- Ці
- вони
- думати
- це
- слайдами
- час
- до
- інструменти
- теми
- навчений
- Навчання
- трендів
- правда
- тип
- типовий
- кінцевий
- розуміти
- us
- користувачі
- використання
- дуже
- через
- ван
- шлях..
- we
- ДОБРЕ
- добре відомі
- коли
- який
- в той час як
- ВООЗ
- волі
- з
- Work
- світ
- б
- лист
- зефірнет