大規模言語モデルが無機化合物の作り方を予測

プラトン再発行

フォロワー： 0

チームが新しいモデルをどのようにトレーニングしたかを示す概略図 — チームは、13 万を超える科学出版物のコレクションから入手した 878 の無機化合物から抽出した化学合成プロトコルを使用して、新しいモデルをトレーニングしました。礼儀： *中国物理学B*

中国の研究者らは、既存の大規模言語モデル (LLM) を微調整して、無機化合物の合成に必要な手順を予測できるシステムを作成しました。 MatChatと呼ばれるこの新しいモデルは、実験室で使用する前にさらなる改良が必要だが、開発者らは、これは科学的文脈で生成人工知能を応用する上での重要な初期の取り組みであると述べている。

LLM は、一連のテキストから意味を抽出する人工知能の一種です。これを行うには、まず膨大な量のデータでトレーニングする必要があります。ただし、このトレーニングは教師なしで行うことができ、LLM は自己学習であると言われます。また、非常に柔軟で、質問に答える、文章を書く、言語を翻訳する、文章を完成させるなどのタスクを実行できます。よく知られた例としては、Open AI の GPT-3 モデルと、そのアクセス可能なスピンオフである ChatGPT が挙げられます。ChatGPT は、比較的少数の入力または「プロンプト」からすでに予測を行うことができます。

無機合成を「理解する」LLM を作成するために、研究者らは、ミャオ・リウ、物理学者中国科学院物理研究所、北京と創業者のアトムリーネットは、LLaMA2-7B と呼ばれる主要なオープンソース LLM に追加の科学データを提供しました。そうすることで、彼らは「最小限のデータセットを使用して人間の認知に似た思考を可能にした」とリュー氏は言います。彼らは、13 の無機化合物から抽出した化学合成プロトコルを使用してモデルをトレーニングしました。これらの無機化合物は、米国政府によって編集された 878 万を超える科学出版物のコレクションから入手しました。クリスティン・シーダーとの同僚ローレンス・バークレー国立研究所アメリカ合衆国で。

「このトレーニングデータにより、モデルは知識豊富な専門家と同じ方法で無機合成に関する質問を理解し、回答することができます」と Liu 氏は説明します。「たとえば、LiMnO の合成について質問された場合、₂MatChat は、反応前駆体、方程式、文献内の相対参照を含む詳細な応答を提供できます。」

典型的なやりとりは次のようなものになるだろうと彼は言います。

質問: LiMnO2 を合成するにはどうすればよいですか?

答え: LiMnO₂ Li2CO3 と MnO2 から固相反応によって製造できます。化学反応式は (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2) です。前駆体を混合し、空気中８００．０℃で２．０時間か焼し、混合し、空気中８００．０℃で２．０時間か焼する。詳細なレシピは文献で見つけることができます…

新しいプロジェクトのアイデア

Liu 氏は、情報技術と AI をテーマとする Intel 主催のカンファレンスに出席した後、2023 年 XNUMX 月に MatChat プロジェクトのアイデアを思いつきました。「会議は科学とは何の関係もありませんでしたが、AI とその応用に関するトレンドのトピックについて多くのことを学びました」と Liu 氏は言います。「LLM を合成レシピの予測に適用するきっかけになりました。」

このプロジェクトを実現するために、Liu さんは同僚と協力しました。王宗国、博士課程の学生、ファンカイ・シェ。 Xie がモデルをトレーニングしている間、Wang は無料で利用できるオンラインプラットフォームこれにより、ユーザーと対話できるようになります。

「MatChat はこの種のアプリケーションに対する究極のソリューションではないかもしれませんが、私たちの研究は LLM を科学的文脈に適用する初期の取り組みの 1 つを表しています」と Liu 氏は語ります。 物理学の世界。「私たちの研究が、複数の分野で同様の AI ツールを作成するための触媒となることを願っています。」

ChatGPT が物理学者の日常業務にどのように役立つか

今後に向けて、研究者らは、データセットを拡張し、独自の広範な材料科学データベース atomly.net と、近々登場予定の無機材料合成用ロボット自律実験室からの計算データと実験データを統合することによって、MatChat の機能を改良することを計画しています。「これらのリソースを活用して、この分野向けの高度な AI ツールの開発を継続することを目指しています」と Liu 氏は言います。

新しい AI モデルについては、以下で詳しく説明されています。 中国物理学B, にプレプリント形式で掲載されました。 arXivのとほぼ同じ時期に Microsoft の研究者によるプレプリント彼は、人気のある ChatGPT4 LLM を使用して同様の偉業を実証しました。

SEO を活用したコンテンツと PR 配信。今日増幅されます。
PlatoData.Network 垂直生成 Ai。自分自身に力を与えましょう。こちらからアクセスしてください。
プラトアイストリーム。 Web3 インテリジェンス。知識増幅。こちらからアクセスしてください。
プラトンESG。カーボン、クリーンテック、エネルギー、環境、太陽、廃棄物管理。こちらからアクセスしてください。
プラトンヘルス。バイオテクノロジーと臨床試験のインテリジェンス。こちらからアクセスしてください。
情報源： https://physicsworld.com/a/large-language-model-predicts-how-to-make-inorganic-compounds/

タイムスタンプ： 2024 年 1 月 5 日

タイムスタンプ： 2023 年 10 月 3 日

プラトン再発行

ChatGPT が物理学者の日常業務にどのように役立つか

シリコン光電子増倍管: ガンマ線天文学への応用を準備 – Physics World

市民科学者が連星系で34個の褐色矮星を発見

赤鉄鉱に磁気単極子が現れる – Physics World

「偉大な天文台」 – 次世代の NASA 宇宙望遠鏡と、次世紀の観測天文学への影響

パッシブ光集光器は太陽電池の効率を高める可能性があります

シミュレーションは、陽子線治療中の DNA 損傷のメカニズムに光を当てます

変化の風: ハイテク帆船は世界の海運を環境に優しいものに変えることができるか?

電子の「キック」により 2D 材料から単一原子が除去 – Physics World

ピンク・フロイドの曲は脳の活動から再現され、アートを月に送る – Physics World

Xanaduはクラウドに量子超越性をもたらします

私のお気に入りの量子ビット: 超伝導量子ビットを使用した量子シミュレーションと計算 – Physics World

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

新しいプロジェクトのアイデア

ChatGPT が物理学者の日常業務にどのように役立つか

より多くの 物理学の世界

私たちに関しては

垂直検索とAi

プラットフォーム

フォロー

より多くの物理学の世界