どの分子が最良の薬を作るかについて AI に「直感」を与える方法

どの分子が最良の薬を作るかについて AI に「直感」を与える方法

どの分子が最良の薬を作るかについて AI に「直感」を与える方法 PlatoBlockchain データ インテリジェンス。垂直検索。あい。

直感とAIが奇妙なカップルを作ります。

直感を説明するのは難しいです。 たとえ理由がわからなくても、あなたを苦しめるのはその直感です。 私たちは経験を通じて自然に直感を築きます。 直感は常に正しいとは限りません。 しかし、それらは多くの場合、意思決定を行う際の論理と推論を補うために私たちの潜在意識に忍び込みます。

対照的に、AI は、何百万ものコールドでハードなデータ ポイントを消化することで迅速に学習し、入力に基づいて、必ずしも合理的ではないにしても、純粋に分析的な結果を生成します。

今、 新しい研究 in ネイチャー·コミュニケーションズ この奇妙なペアを結婚させると、化学者の創薬直感を捉える機械学習システムが誕生します。

スイスに本拠を置く製薬会社、ノバルティスの化学者 35 名からのフィードバックを分析することにより、チームは、医薬品開発の悪名高い困難な段階、つまり生物学に適合する有望な化学物質を見つけるという、人間の専門知識から学習する AI モデルを開発しました。

まず、化学者たちは直感を使って、5,000 の化学ペアのうち、有用な薬になる可能性がより高いものを選択しました。 このフィードバックから、単純な人工ニューラル ネットワークが彼らの好みを学習しました。 新しい化学物質に挑戦すると、AI モデルはそれぞれの化学物質に、医薬品としてさらなる開発に値するかどうかをランク付けするスコアを与えました。

化学構造そのものについては詳細が一切なく、AI は既存の医薬品によく含まれる特定の構造成分を「直感的に」他のものよりも高くスコア付けしました。 驚くべきことに、これまでのコンピュータモデリングの試みでは明示的にプログラムされていなかった曖昧な特性も捕らえられました。 DALL-E のような生成 AI モデルと組み合わせて、ロボ化学者は潜在的なリードとして多数の新しい分子を設計しました。

多くの有望な新薬候補は「共同ノウハウ」に基づいていると研究チームは書いている。

この研究は、ノバルティスと英国に拠点を置く Microsoft Research AI4Science との共同研究によるものです。

ケミカルウサギの穴を下って

私たちが日常的に使用する薬のほとんどは、痛みのためのタイレノール、糖尿病管理のためのメトホルミン、細菌感染と戦うための抗生物質など、小分子から作られています。

しかし、これらの分子を見つけるのは大変です。

まず、科学者はこの病気がどのように作用するかを理解する必要があります。 たとえば、ズキンズキンとした頭痛を引き起こす生化学反応の連鎖を解読します。 次に、鎖内の最も弱い部分 (多くの場合タンパク質) を見つけて、その形状をモデル化します。 構造を把握し、タンパク質の機能を妨害するために分子が入り込む可能性のある隅々を正確に特定し、それによって生物学的プロセスを停止させます。これで、もう頭痛はなくなります。

おかげ タンパク質予測AIAlphaFold、RoseTTAFold、およびその派生製品など、標的タンパク質の構造をモデル化することが容易になりました。 それに適合する分子を見つけることは別の問題です。 薬は標的の活動を変えるだけではありません。 また、容易に吸収され、標的の臓器や組織に広がり、安全に代謝されて体外に排出されなければなりません。

ここで医薬品化学者が登場します。これらの科学者は コンピュータモデリング導入の先駆者です。 XNUMX 年以上前、この分野ではソフトウェアを使用して、化学物質の膨大なデータベースを選別して有望なリードを探し始めました。 それぞれの潜在的なリードは、さらなる開発の前に化学者のチームによって評価されます。

このプロセスを通じて、医薬品化学者は次のような直観を構築します。 効率的に意思決定を行うことができます 有望な薬剤候補を検討するとき。 彼らのトレーニングの一部は、 ルールにまとめられた たとえば、この構造は脳には伝わらないでしょう。 肝臓を損傷する可能性があります。 これらの専門家ルールは、初期スクリーニングに役立ちます。 しかし、化学者自身がそれを説明できないこともあり、これまでのところ、どのプログラムも彼らの意思決定の機微や複雑さを捉えることができていない。

アイヴ・ガッタ・フィーリング

新しい研究では、AI モデルで説明不可能なものを捉えようとしました。

チームは、世界中のさまざまなノバルティス センターで、それぞれ異なる専門知識を持つ 35 人の専門化学者を採用しました。 たとえば、細胞や組織を扱うものもあれば、コンピューターモデリングを扱うものもあります。

直感は測定するのが難しいです。 それも正確には信頼できるものではありません。 ベースラインとして、チームは、各化学者の選択が一貫しているかどうか、および自分の選択が他の化学者の選択と一致するかどうかを評価するマルチプレイヤー ゲームを設計しました。 各化学者は 220 対の分子を見せられ、意図的に曖昧な質問をしました。 たとえば、初期の仮想スクリーニング キャンペーンに参加していて、錠剤として服用できる薬が必要だと想像してください。どの分子を好みますか?

目標は、過剰な考えを減らし、どの化学物質が残り、どれが消えるかを化学者が直観に頼るよう促すことでした。 この設定は、化学者が予測モデル、つまりハードデータを使用して特定の分子特性をチェックする通常の評価とは異なります。

化学者たちはそれぞれの判断に一貫性を持っていましたが、必ずしもお互いに同意するわけではありませんでした。これはおそらく個人的な経験の違いによるものと思われます。 しかし、AI モデルが学習できる基礎的なパターンを形成するには十分な重複があったとチームは説明しました。

次に彼らは、5,000 分子ペアのデータセットを構築しました。 それぞれの分子には構造やその他の特徴に関する情報がラベル付けされており、単純な人工ニューラル ネットワークのトレーニングに使用されました。 トレーニングにより、AI ネットワークは化学者からのフィードバックに基づいて内部動作をさらに調整し、最終的に各分子にスコアを与えました。

健全性チェックとして、チームはトレーニング データセットとは異なる化学ペアでモデルをテストしました。 トレーニング サンプルの数が増えるにつれて、パフォーマンスが急上昇しました。

以前のコンピュータープログラムは、分子構造に基づいて有望な薬を作るためのルールに依存していましたが、新しいモデルのスコアはこれらのルールを直接反映していませんでした。 AI は、化学物質のより全体的な視点を捉えました。これは、化学物質に対するまったく異なるアプローチです。 創薬 古典的なロボ化学ソフトウェアで使用されるものよりも。

AI を使用して、チームは化学データバンクから数百の FDA 承認薬と数千の分子をスクリーニングしました。 明示的なトレーニングがなくても、モデルは医薬品としてのさらなる開発に適した「フラグメント」と呼ばれる化学構造を抽出しました。 AI のスコア付けの好みは既存の薬物のような分子の好みと一致しており、潜在的なリードを形成するものの要点を AI が把握していたことを示唆しています。

化学的ロマンス

ノバルティスは人間とロボットの化学ロマンスを探求する最初の企業ではない。

以前は製薬会社メルク社が もタップされました 社内の専門知識を活用して、化学物質を望ましい特性にランク付けします。 業界以外では、 チーム グラスゴー大学の研究者らは、無機化学実験に直感ベースのロボットを使用することを研究しました。

これはまだ小規模な研究であり、著者らは人間の誤った考えを排除することはできません。 化学者の中には、完全に避けるのが難しい個人的な偏見に基づいて分子を選択する人もいます。 ただし、このセットアップは、実験的に完了するには費用がかかる創薬の他のステップを研究するために使用できます。 また、モデルは直感に基づいていますが、その結果はルールベースのフィルターによって強化され、パフォーマンスをさらに向上させることができます。

私たちは機械学習で数万の分子を設計できる時代に入っている、とチームは説明した。 直感力を備えたアシスタント AI 化学者は、創薬の重要な初期段階で候補を絞り込むのに役立ち、ひいてはプロセス全体を加速できる可能性があります。

画像のクレジット: ユージニア・コジル / Unsplash

タイムスタンプ:

より多くの 特異点ハブ