大規模言語モデルは無機化合物の作り方を予測 – Physics World

大規模言語モデルは無機化合物の作り方を予測 – Physics World

チームが新しいモデルをどのようにトレーニングしたかを示す概略図

中国の研究者らは、既存の大規模言語モデル (LLM) を微調整して、無機化合物の合成に必要な手順を予測できるシステムを作成しました。 MatChatと呼ばれるこの新しいモデルは、実験室で使用する前にさらなる改良が必要だが、開発者らは、これは科学的文脈で生成人工知能を応用する上での重要な初期の取り組みであると述べている。

LLM は、一連のテキストから意味を抽出する人工知能の一種です。これを行うには、まず膨大な量のデータでトレーニングする必要があります。ただし、このトレーニングは教師なしで行うことができ、LLM は自己学習であると言われます。また、非常に柔軟で、質問に答える、文章を書く、言語を翻訳する、文章を完成させるなどのタスクを実行できます。よく知られた例としては、Open AI の GPT-3 モデルと、そのアクセス可能なスピンオフである ChatGPT が挙げられます。ChatGPT は、比較的少数の入力または「プロンプト」からすでに予測を行うことができます。

無機合成を「理解する」LLM を作成するために、研究者らは、 ミャオ・リウ、物理学者 中国科学院物理研究所、北京 と創業者の アトムリーネットは、LLaMA2-7B と呼ばれる主要なオープンソース LLM に追加の科学データを提供しました。そうすることで、彼らは「最小限のデータセットを使用して人間の認知に似た思考を可能にした」とリュー氏は言います。彼らは、13 の無機化合物から抽出した化学合成プロトコルを使用してモデルをトレーニングしました。これらの無機化合物は、米国政府によって編集された 878 万を超える科学出版物のコレクションから入手しました。 クリスティン・シーダー との同僚 ローレンス・バークレー国立研究所 アメリカ合衆国で。

「このトレーニング データにより、モデルは知識豊富な専門家と同じ方法で無機合成に関する質問を理解し、回答することができます」と Liu 氏は説明します。 「たとえば、LiMnO の合成について質問された場合、2MatChat は、反応前駆体、方程式、文献内の相対参照を含む詳細な応答を提供できます。」

典型的なやりとりは次のようなものになるだろうと彼は言います。

質問: LiMnO2 を合成するにはどうすればよいですか?

答え: LiMnO2 Li2CO3 と MnO2 から固相反応によって製造できます。化学反応式は (0.5 Li2CO3 + 1 MnO2 == 1 LiMnO2 + 0.5 CO2) です。前駆体を混合し、空気中800.0℃で2.0時間か焼し、混合し、空気中800.0℃で2.0時間か焼する。詳細なレシピは文献で見つけることができます…

新しいプロジェクトのアイデア

Liu 氏は、情報技術と AI をテーマとする Intel 主催のカンファレンスに出席した後、2023 年 XNUMX 月に MatChat プロジェクトのアイデアを思いつきました。 「会議は科学とは何の関係もありませんでしたが、AI とその応用に関するトレンドのトピックについて多くのことを学びました」と Liu 氏は言います。 「LLM を合成レシピの予測に適用するきっかけになりました。」

このプロジェクトを実現するために、Liu さんは同僚と協力しました。 王宗国、博士課程の学生、 ファンカイ・シェ。 Xie がモデルをトレーニングしている間、Wang は 無料で利用できるオンラインプラットフォーム これにより、ユーザーと対話できるようになります。

「MatChat はこの種のアプリケーションに対する究極のソリューションではないかもしれませんが、私たちの研究は LLM を科学的文脈に適用する初期の取り組みの 1 つを表しています」と Liu 氏は語ります。 物理学の世界。 「私たちの研究が、複数の分野で同様の AI ツールを作成するための触媒となることを願っています。」

今後に向けて、研究者らは、データセットを拡張し、独自の広範な材料科学データベース atomly.net と、近々登場予定の無機材料合成用ロボット自律実験室からの計算データと実験データを統合することによって、MatChat の機能を改良することを計画しています。 「これらのリソースを活用して、この分野向けの高度な AI ツールの開発を継続することを目指しています」と Liu 氏は言います。

新しい AI モデルについては、以下で詳しく説明されています。 中国物理学B, にプレプリント形式で掲載されました。 arXivの とほぼ同じ時期に Microsoft の研究者によるプレプリント 彼は、人気のある ChatGPT4 LLM を使用して同様の偉業を実証しました。

タイムスタンプ:

より多くの 物理学の世界