Исследователи в Китае доработали существующую модель большого языка (LLM), чтобы создать систему, которая может предсказать шаги, необходимые для синтеза неорганического соединения. Хотя новая модель, получившая название MatChat, нуждается в дальнейшей доработке, прежде чем ее можно будет использовать в лаборатории, ее разработчики говорят, что она представляет собой важную раннюю попытку применения генеративного искусственного интеллекта в научном контексте.
LLM — это тип искусственного интеллекта, который извлекает значения из последовательности текста. Для этого их сначала необходимо обучить работе с огромными объемами данных. Однако это обучение может проходить без присмотра, а это означает, что студенты LLM называются самообучающимися. Они также очень гибки и способны выполнять такие задачи, как отвечать на вопросы, писать текст, переводить языки и составлять предложения. Хорошо известные примеры включают модель GPT-3 от Open AI и ее доступный дочерний продукт ChatGPT, который уже может делать прогнозы на основе относительно небольшого количества входных данных или «подсказок».
Чтобы создать LLM, который «понимает» неорганический синтез, исследователи под руководством Мяо Лю, физик из Институт физики Китайской академии наук, Пекин и основателя атомли.нет, предоставила ведущему LLM с открытым исходным кодом под названием LLaMA2-7B дополнительные научные данные. При этом, по словам Лю, они «предоставляют ему возможность мыслить аналогично человеческому познанию, используя минимальный набор данных». Они обучили модель, используя протоколы химического синтеза, извлеченные из 13 878 неорганических соединений, которые они взяли из коллекции, насчитывающей более четырех миллионов научных публикаций, собранной Кристин Седер и коллеги по Национальной лаборатории Лоренса Беркли в США.
«Эти обучающие данные позволяют модели понимать вопросы неорганического синтеза и отвечать на них так же, как это сделал бы знающий эксперт», — объясняет Лю. «Например, когда его спросили о синтезе LiMnO2, MatChat может предоставить подробный ответ, включающий предшественники реакций, уравнения и соответствующие ссылки в литературе».
Типичный обмен мнениями, по его словам, может выглядеть примерно так:
Вопрос: как синтезировать LiMnO2?
Ответ: LiMnO2 можно получить из Li2CO3 и MnO2 твердофазной реакцией. Уравнение химической реакции: (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2). Прекурсоры смешивают, прокаливают при 800.0°С на воздухе в течение 2.0ч, перемешивают, прокаливают при 800.0°С на воздухе в течение 2.0ч. Подробный рецепт можно найти в литературе…
Новая идея проекта
Идея проекта MatChat пришла Лю в августе 2023 года после того, как он посетил конференцию, организованную Intel на тему информационных технологий и искусственного интеллекта. «Хотя встреча не имела ничего общего с наукой, я узнал много нового о актуальных темах в области искусственного интеллекта и его приложений», — говорит Лю. «Это вдохновило меня применить LLM для прогнозирования рецептов синтеза».
Чтобы реализовать проект, Лю объединился с коллегой, Цзунго Вани аспирант, Фанкай Се. Пока Се обучал модель, Ван построил свободно доступная онлайн-платформа что позволяет ему взаимодействовать с пользователями.
«Хотя MatChat, возможно, и не является окончательным решением для такого типа приложений, наша работа представляет собой одну из первых попыток применить LLM в научном контексте», — говорит Лю Мир физики. «Мы надеемся, что наше исследование послужит катализатором для создания аналогичных инструментов искусственного интеллекта в различных областях».
Как ChatGPT может помочь физикам в их повседневной работе
Заглядывая в будущее, исследователи планируют усовершенствовать возможности MatChat, расширив его набор данных и интегрировав расчетные и экспериментальные данные из своей собственной обширной базы данных по материаловедениюatomly.net, а также будущей роботизированной автономной лаборатории для синтеза неорганических материалов. «Используя эти ресурсы, мы стремимся продолжать разработку передовых инструментов искусственного интеллекта для этой области», — говорит Лю.
Новая модель ИИ подробно описана в Китайская физика Б, и появился в виде препринта на ArXiv примерно в то же время, что и препринт от исследователей Microsoft который продемонстрировал аналогичный подвиг, используя популярный ChatGPT4 LLM.
- SEO-контент и PR-распределение. Получите усиление сегодня.
- PlatoData.Network Вертикальный генеративный ИИ. Расширьте возможности себя. Доступ здесь.
- ПлатонАйСтрим. Интеллект Web3. Расширение знаний. Доступ здесь.
- ПлатонЭСГ. Углерод, чистые технологии, Энергия, Окружающая среда, Солнечная, Управление отходами. Доступ здесь.
- ПлатонЗдоровье. Биотехнологии и клинические исследования. Доступ здесь.
- Источник: https://physicsworld.com/a/large-language-model-predicts-how-to-make-inorganic-compounds/
- :является
- :нет
- $UP
- 1
- 13
- 160
- 2023
- 750
- a
- в состоянии
- О нас
- доступной
- через
- дополнительный
- продвинутый
- После
- AI
- цель
- AIR
- родственный
- позволяет
- уже
- причислены
- Несмотря на то, что
- суммы
- an
- и
- появившийся
- Применение
- Приложения
- Применить
- Применение
- МЫ
- около
- искусственный
- искусственный интеллект
- AS
- At
- Август
- автономный
- доступен
- BE
- до
- Беркли
- Мозг
- построенный
- by
- под названием
- CAN
- возможности
- Катализатор
- ChatGPT
- химический
- Китай
- китайский
- нажмите на
- познание
- коллега
- коллеги
- лыжных шлемов
- скомпилированный
- комплектующие
- Соединение
- вычислительный
- компьютер
- Конференция
- контекст
- продолжать
- Создайте
- создание
- ежедневно
- данным
- База данных
- убивают
- подробный
- застройщиков
- развивающийся
- do
- дело
- дублированный
- Рано
- ed
- занятых
- позволяет
- стремится
- уравнения
- пример
- Примеры
- обмена
- существующий
- расширяющийся
- экспериментальный
- эксперту
- Объясняет
- обширный
- Экстракты
- подвиг
- поле
- Поля
- Во-первых,
- гибкого
- Что касается
- форма
- предстоящий
- вперед
- найденный
- основатель
- 4
- от
- далее
- генеративный
- GitHub
- есть
- было
- происходить
- Есть
- he
- помощь
- надежды
- Как
- How To
- Однако
- HTTP
- HTTPS
- огромный
- человек
- i
- идея
- IEEE
- изображение
- важную
- in
- включают
- включает в себя
- информация
- информационная технология
- неорганический
- затраты
- вдохновленный
- Интегрируя
- Intel
- Интеллекта
- взаимодействовать
- вопрос
- IT
- ЕГО
- JPG
- лаборатория
- язык
- Языки
- большой
- ведущий
- привело
- такое как
- литература
- LLM
- посмотреть
- серия
- сделанный
- сделать
- материалы
- макс-ширина
- me
- смысл
- значения
- заседания
- может быть
- миллиона
- минимальный
- смешанный
- модель
- с разными
- должен
- национальный
- потребности
- сеть
- Новые
- ничего
- номер
- of
- on
- ONE
- онлайн
- открытый
- с открытым исходным кодом
- or
- Организованный
- наши
- за
- собственный
- Выполнять
- кандидат наук
- Физика
- Мир физики
- план
- Платон
- Платон Интеллектуальные данные
- ПлатонДанные
- Популярное
- предсказывать
- прогноз
- Predictions
- предсказывает
- Проект
- протоколы
- обеспечивать
- публикациям
- Вопросы
- реакция
- рецепт
- Рекомендации
- совершенствовать
- относительный
- относительно
- представляет
- обязательный
- исследователи
- Полезные ресурсы
- Реагируйте
- ответ
- Сказал
- то же
- сообщили
- говорит
- Наука
- НАУКА
- научный
- Последовательность
- служить
- аналогичный
- небольшой
- So
- Решение
- удалось
- источников
- Шаги
- "Студент"
- Кабинет
- предмет
- такие
- поставляется
- синтез
- синтезировать
- система
- задачи
- команда
- объединился
- Технологии
- говорит
- текст
- который
- Ассоциация
- их
- Эти
- они
- think
- этой
- миниатюрами
- время
- в
- инструменты
- Темы
- специалистов
- Обучение
- трендов
- правда
- напишите
- типичный
- окончательный
- понимать
- us
- пользователей
- через
- очень
- с помощью
- Ван
- Путь..
- we
- ЧТО Ж
- известный
- когда
- , которые
- в то время как
- КТО
- будете
- Работа
- Мир
- бы
- письмо
- зефирнет