タンパク質設計AIは医薬品への扉を開きます人間はPlatoBlockchainデータインテリジェンスを夢見ることができませんでした。 垂直検索。 愛。

タンパク質設計AIは、人間が夢見ることができなかった医薬品への扉を開きます

画像

タンパク質の設計は、キャビネットの作成に少し似ています。 最初のステップは、タンパク質を一緒に保持するバックボーンを構築することです。 しかし、次に難しい部分があります。足場のどこにヒンジを取り付けるか、つまり、最終的にキャビネットを完全に機能させるドア、棚、その他のアタッチメントを取り付けるのに最適な「ホットスポット」を見つけることです。

ある意味で、タンパク質にはその構造に埋め込まれたホットスポットもあります。 その名の通り、「機能部位」、これらの興味をそそる隅や隙間は、他のタンパク質や薬をつかむための複雑なドックを形成します。 これらのサイトは、基本的な生物学的プロセスのほとんどを実行する上で中心的な役割を果たします。 彼らはまた、新しい治療法や医薬品を設計するための巨大な金鉱でもあります。

問題? 機能サイトをマッピングするのは困難です。 科学者は伝統的に、タンパク質の疑わしい領域をXNUMXつずつ変異させ、あるアミノ酸を別のアミノ酸に切り替えて、正確な結合スポットを特定する必要がありました。 何百人もの容疑者をスクリーニングする探偵のように、その中には多くの人がいる可能性がありますが、それは非常に面倒です。

A 新しい研究 in 科学 ゲームブック全体を倒した。 ワシントン大学のDavidBaker博士が率いるチームは、AIの「想像力」を利用して、無数の機能的なサイトをゼロから夢見ました。 これは、最高の状態での機械マインドの「創造性」です。これは、タンパク質の機能部位の一般的な領域を予測するが、構造をさらに彫刻するディープラーニングアルゴリズムです。

現実のチェックとして、チームは新しいソフトウェアを使用して、癌と闘う薬を生成し、一般的な、時には致命的なウイルスに対するワクチンを設計しました。 あるケースでは、デジタルマインドは、分離された細胞でテストしたときに、一般的なウイルスに対する既存の抗体と完全に一致する解決策を思いつきました。 言い換えれば、アルゴリズムはウイルスタンパク質からホットスポットを「想像」し、新しい治療法を設計するためのターゲットとして脆弱にします。

このアルゴリズムは、機能の周りにタンパク質を構築するためのディープラーニングの最初の取り組みであり、以前は想像もできなかった治療への扉を開きます。 しかし、ソフトウェアは天然タンパク質のホットスポットに限定されていません。 「私たちが自然界で見つけたタンパク質は驚くべき分子ですが、設計されたタンパク質はそれだけではありません」とベイカー氏はプレスリリースで述べています。 アルゴリズムは「私たちの誰もがそれが可能だとは思わなかったことをする」ことです。

プロテインホットスポット

ベイカーのチームは、人工的な心でタンパク質を予測することを知らない人ではありません。 数年前、彼らは、アミノ酸配列のみに基づいてタンパク質の3D構造を予測できるソフトウェア、Rosettaをリリースすることで、構造生物学の分野を揺るがしました。 彼らはさらにタンパク質複合体をマッピングし、タンパク質の「スクリュードライバー」をゼロから設計して、望ましくないタンパク質相互作用をこじ開けました。 昨年末、彼らは ディープラーニングネットワーク アミノ酸のストリングがナノスケールで複雑な構造にどのように配置されるかを一般化するAI「アーキテクト」であるtrRosettaと呼ばれます。

バックアップしましょう。

この文を入力するときに噛んでいる肉付きの良い手羽先としてタンパク質を描くのは簡単です。 しかし、分子レベルでは、それらははるかにエレガントです。 ひもでつながれた複数のレゴブロック(アミノ酸)を想像してみてください。 次に、いくつかのブロックが互いにスナップするまでチェーンをねじりながら、それを回転させます。 これは、らせんやしわくちゃのベッドシーツによく似た繊細な構造を形成します。 一部のタンパク質では、これらのビルディングブロックがさらに集合して複合体になります。たとえば、パトロールされた州間高速道路のように、細胞の保護膜を通り抜けるチャネルを作成します。

タンパク質は、多くの場合、他のタンパク質や薬物との相互作用のカスケードを通じて、すべての生物学的プロセスに電力を供給します。これは、パートナーによっては、まったく異なる結果を引き起こす可能性があります。細胞は生きるか死ぬか。 潜在的な侵入者を攻撃しますか、それとも立ち下がりますか? 言い換えれば、タンパク質は生命の構成要素であり、それらの構造を解析することは、私たちが生命にハッキングする方法です。

タンパク質のすべての部分が同じように作られているわけではありません。 タンパク質が人体である場合、機能部位はその「手」であり、別のタンパク質や薬物をつかんだり、酵素反応を引き起こしたり、侵入した病原体を撃退したりします。 これらの部位はタンパク質の構造に直接埋め込まれているため、特定するのが難しく、再現するのがさらに困難です。

新しい研究は、ロゼッタのバージョンで問題に取り組みました:いくつかの以前の知識で、コンピューターが機能的な部位に自然に折りたたまれるアミノ酸の鎖を夢見ることは可能ですか?

ドリーマーとリアリスト

問題はエキゾチックに見えるかもしれませんが、別の分野での前の例があります。 ニューラルネットワークを使用して、OpenAIはテキストキャプションだけから幅広い画像を作成しました。 ロックスターAIテキストジェネレーターのスピンオフ GPT-3、DALL・Eアルゴリズムは、トレーニングからパターンを検出することにより、単純なテキストプロンプトに基づいて、幻想的でありながらリアルに見える画像を生成しました。 「それはあなたの想像力の最も深く、最も暗い窪みを取り、それを不気味に適切なものにレンダリングします。」 ツールの最初のリリース後のカリフォルニア大学バークレー校のハニー・ファリド博士。

タンパク質機能部位の構築も同様です。 ここで、アミノ酸は文字であり、タンパク質の機能部位は画像です。 「考え方は同じです。ニューラルネットワークは、データのパターンを確認するようにトレーニングできます。 トレーニングが済んだら、プロンプトを表示して、エレガントなソリューションを生成できるかどうかを確認できます」と、新作の筆頭著者であるジョセフワトソン博士は述べています。 小説を書くのではなく、アルゴリズムは人生を書き直すのに役立つ可能性があります。

チームは前作のtrRosettaから始めました。 これは元々、アミノ酸配列に基づいて新しいタンパク質を考案し、その構造を予測できるように設計されたニューラルネットワークです。一部は天然のものとは非常に異質であるため、チームはディープラーニングの内部動作を「幻覚」と呼んでいます。 アルゴリズムは完璧に見えました。タンパク質のアミノ酸配列とその構造の両方を予測できました。

しゃっくり? それは実際には機能しませんでした。 対照的に、 OG タンパク質構造予測の ローズTTAフォールド、チャンピオンのように実行されます。 アルゴリズムの力は、その設計に由来します。つまり、各アミノ酸をナノスケールでモデル化し、各原子に座標を提供します。 Googleマップを使用して地理的なサイトを固定するのと同様に、これはAIがさらにリフできる構造のグラウンドトゥルースのレベルを提供します。これは一種の「制約された幻覚」です。

翻訳? RoseTTAFoldは、目前の問題に固有の機能構造を予測し、最終的な設計として大まかなスケッチを考え出すことができます。

次に、「修復」と呼ばれる別の巧妙なトリックが登場しました。 ここで、チームはタンパク質の配列または構造の一部を隠しました。 ソフトウェアは、本質的にノイズの多い無線傍受から情報を解読する方法を学習する必要がありました。最初の数語しか聞こえませんが、空白を埋めてその意味を理解しようとします。 RoseTTAFoldは、アミノ酸配列と構造の両方を自動補完して、忠実度の高い特定の機能領域を構築することで、「情報不足の回復の問題」に積極的に取り組みました。

RoseTTAFoldは、アミノ酸配列の構築とサイトのバックボーンの生成の問題に同時に取り組むことができます。 紙に単語を書くようなものです。ライターは、文法と意味が​​理にかなっていることを確認しながら、各文字が正しい場所にあることを確認します。

現実の本質を問う

彼らの新しい創造物をテストすることで、チームはウイルスや癌と戦うか、低鉄の健康問題を助ける可能性のあるいくつかの薬とワクチンのデザインを生み出しました。

筆頭著者のJueWang博士にとって、アルゴリズムは予想外に適切になりました。 プロジェクトに取り組んでいる間、彼のXNUMX歳の息子は、RSV(呼吸器合胞体ウイルス)による肺感染症のために緊急ユニットに入院しました。RSV(呼吸器合胞体ウイルス)は、通常は風邪のような症状を示しますが、若者やお年寄り。

当時、Wangはこのアルゴリズムを使用して新しい治療法を設計していました。これには、ワクチンや薬をさらにテストするためのRSV上の潜在的な部位が含まれていました。 それは比較的よくマッピングされた構造です。 ソフトウェアは、ワクチンが潜在的に結合するためのXNUMXつのサイトを要約したデザインを幻覚させました。 バクテリアで再構築された幻覚タンパク質を使用したテストは、既存の抗体をすばやくつかみました。これは、それらが機能しており、深層学習アプローチが機能していることを示しています。

この事件は、「私たちが取り組んでいる「テスト」問題でさえ、実際には非常に意味のあるものであることに気づきました」とWang氏は述べています。

いくつかの追加のテストで、チームは酵素、タンパク質結合タンパク質、および金属イオンをつかむタンパク質の機能部位を設計しました。基本的には、鉄やその他の重要な金属をどのように吸収するかです。

強力ですが、成長の余地があります。 この方法は、天然タンパク質の謎を解き明かすだけでなく、合成生物学のための新しいタンパク質を設計する可能性も秘めています。 「これらは非常に強力な新しいアプローチですが、まだ改善の余地があります」とベイカー氏は述べています。

全体として、これはディープラーニングのもうXNUMXつの勝利であり、AIと生物学がどのように相乗効果を発揮できるかについての魅力的なショーケースです。 「過去XNUMX年間のディープラーニングによるタンパク質構造予測の変革は、現在、タンパク質設計の同様の変革の真っ只中にあります」とベイカー氏は述べています。

画像クレジット:Ian C. Haydon /UWタンパク質設計研究所。 タンパク質構造で訓練された新しい人工知能ソフトウェアは、呼吸器ウイルスRSVのこれらの候補ワクチンを含む機能性タンパク質を数秒で生成できます。

タイムスタンプ:

より多くの 特異点ハブ