あなたのゲノムのジャンクプラトンブロックチェーンデータインテリジェンスのきらめく宝物。垂直検索。あい。

あなたのゲノムのがらくたの中のきらびやかな宝物

リック・ヤング MITの生物学の教授であり、非コードDNAとして知られるタンパク質をコードしないゲノムの部分から転写されるRNAを研究しています。 ゲノムのこの部分は、かつて「ジャンクDNA」と呼ばれていました。これにより、多くの人がその価値についてどのように考えているかがわかります。 科学者たちは、それがヒトゲノムの98%を占めていることを発見して驚いた。それがその機能を見つけるための探求のきっかけとなった。

この会話では、リック・ヤングはとチャットします ハンネ・ウィナルスキー BioEatsWorldおよびa16zゼネラルパートナーから ホルヘ・コンデ、生物学、コンピュータサイエンス、エンジニアリングの交差点で投資を主導しています。 a16zに参加する前は、コンデはSyros Pharmaceuticalsの最高戦略責任者であり、ゲノミクス解釈会社Knomeを共同設立しました。 

会話は、私たちがジャンクだと思ったゲノムの98%について私たちが学んだことをカバーしています。 結局のところ、古代のウイルス感染の証拠を隠すことから、すべての顔をユニークに見せることまで、さまざまな仕事があります。 彼らはまた、病気におけるその大規模であるがまだ十分に理解されていない役割、およびジャンクDNAの研究がどのように誰も予想していなかった遺伝子のオン/オフスイッチの発見につながったかについて議論します。 

注:この会話は元々、のエピソードとして公開されました バイオイーツワールド。 あなたはそのエピソードを聞くことができます こちら


HANNE WINARSKY:今日は、ジャンクDNAと呼ばれるものについてお話します。 簡単な定義から始められますか?

リック・ヤング:それは約半世紀前の用語です。 科学者は、タンパク質をコードしないゲノムの部分について知っていました、そして彼らは 理論化された これはがらくたでした。 私たちは、それのいくつかがゲノムへの古代のウイルス侵入の残骸にすぎないことを知っていました。 しかし、そのフレーズ、ジャンクDNAは、私たちを悩ませてきました。

HANNE:では、代わりに使用しようとしている用語は何ですか? 私たちが毎日もっと理解しているDNAの暗黒物質?

リック:非コードDNA。

HANNE:なぜ彼らはそれをデトリタスだと思ったのですか? あなたはそれのいくつかが残った古いウイルスビットであったと言いました。 しかし、なぜそれは最初から単なる謎ではなかったのでしょうか?

リック:生物学の歴史を通して、遺伝物質とは何かについてこの議論があり、当初はタンパク質であると考えられていたからです。 しかし、タンパク質が機械であり、DNAが機械の青写真であることが明らかになると、機械の欠陥が病気を引き起こすため、人々は機械で忙しくなりました。 しかし、その後、ゲノムの2%だけがタンパク質のアミノ酸をコードしていることが判明しました。 大多数、98%はそうではありません。 そして2000年に、ヒトゲノムプロジェクトの科学者が PLM platform. ヒトゲノム配列では、そのデータにより、98億塩基の3.2%がタンパク質をコードしていないことが確認されました。

各遺伝子には、それがコード化するタンパク質の断片を取り込んで配置するという驚くべき能力があり、ある細胞で得られる製品が少し速く機能するように、または別の細胞で実際に別の細胞に入る可能性があります別の仕事をするためのコンパートメント。

JORGE CONDE:3.2億塩基対でコード化される遺伝子の数の最初の見積もりは何でしたか?

リック:私たちは約100,000万人に落ち着きました。 複雑になるほど、ゲノムが大きくなり、遺伝子の数が増えると仮定しました。 私たちと昆虫がほぼ同じ数の遺伝子を持っていることに気づいたとき、少しショックがありました。

ホルヘ:信じられないほど複雑な生物であると私たちが考えるものをコード化することを私たちが予想したよりも少ない遺伝子でしょ? 

HANNE:それはちょっとショックです。

同じソースコード、異なるプログラム

ホルヘ:高校で私たち全員が学んだことは、RNAのDNAコード、アミノ酸のRNAコード、そしてアミノ酸が私たちにタンパク質を与えるということですよね? それが現代生物学の中心的な教義です。

リック:うん。 人々が「ジャンクDNA」というタイトルをタンパク質をコードしないゲノムの98%にすばやく帰属させた大きな理由のひとつは、ゲノムのビジネス上の目的がタンパク質。

ホルヘ:では、遺伝学者がジャンクDNAがジャンク以上のものである可能性があると気づき始めたのはいつですか?

リック:[それは]途方もない量の選択的スプライシングによって、人間と昆虫のさらなる複雑さを説明できるという認識から始まりました。 ここに、単一の遺伝子に対して作成された大きなRNAがありますが、ある細胞と別の細胞では異なる方法でスプライスされます。 言い換えれば、遺伝子のさまざまな部分が、タンパク質を特定するRNA分子になります。 したがって、タンパク質は少し異なります。

ウィキメディアコモンズ経由の国立ヒトゲノム研究所、パブリックドメイン

HANNE:それは、光が異なる方法で当たる万華鏡のように聞こえます。異なる色、異なる角度が得られます。

リック:そうですね、それは興味深い例えです。 これらのレゴを持っていて、機械を作ることができる場合、より良い例えだと思いますが、非常に多くの異なる方法、非常に多くの異なる構造、色でそれを作ることができます。 各遺伝子には、それがコード化するタンパク質の断片を取り込んで配置するという驚くべき能力があり、ある細胞で得られる製品が少し速く機能するように、または別の細胞で実際に別の細胞に入る可能性があります別の仕事をするためのコンパートメント。

ホルヘ:与えられた人間のすべての細胞はほぼ同じゲノムを持っています。 しかし、その同じゲノムは、信じられないほど多様な異なる細胞型の配列を生み出します。 したがって、類推する限り、各セルタイプは同じソースコードから異なるプログラムを実行しています。

リック:そうです。

98%の機能

ホルヘ:さまざまな細胞型を調べて、それらがどれほど多様であるかを確認するのに専門家である必要はありませんよね? ニューロンは、たとえば筋細胞とは非常に、非常に、非常に異なって見え、非常に、非常に異なって機能します。 プログラム、細胞が実行することを選択する遺伝子プログラムを決定するものは何ですか? 何が筋細胞を筋細胞にし、何がニューロンをニューロンにするのか?

リック:それで、私たちはDNAがRNAを作り、[RNA]がタンパク質を作ることから始めました。 それがセントラルドグマです。 しかし、約半世紀前、科学者たちは、実際にはRNAがすべて独自にさまざまな種類の機能を生み出し始めたという議論を始めました。 そして、RNAは実際には発達の初期段階でいくつかの活性を持っていることがわかりました。 

精子が卵子と出会うと、母親がその卵子に入れるのは母親のRNAです。 これを行っているRNA分子があります。 私たちが日常的に使用している抗生物質はRNAに結合することがわかりました。 したがって、RNAにはかなり重要な役割があります。 それは人々の考え方を変えました。 それから、ジャンクDNAについて考え始めたとき、それはタンパク質をコードしていないDNAの一部です。 ええと、もし世界がタンパク質ではなくRNAに基づいているとしたら、少なくとも 初め? そして今、私たちは、私たちがジャンクDNAと呼んでいるもの、または私たちがジャンクDNAと呼んでいたものの大部分がジャンクではないことを理解しています。 それは非常に機能的です。 そしてそれのほとんどはRNAを作ります。

したがって、任意のXNUMXつのセルをプログラミングする際の目標は、特定のシーケンスセットを使用して、その一般的な遺伝子セットのそれぞれを必要なレベルに調整することです。 。 。 。私たちの問題は、実際にプログラムを知らないことです。

HANNE:うわー。 DNAの非コード部分を理解している場所について少し説明していただけますか? あなたが知っている、そこにあるすべての異なる可能性についての私たちの現在の理解は何ですか?

リック:私たちのゲノムのわずか2%が、タンパク質に含まれるこれらのアミノ酸配列をコードしています。 それで、残りが何をするかについて、私たちの会計士の元帳には何がありますか? 

私たちのゲノムの約半分は、私たちがヘテロクロマチンと呼んでいるものです。 それはあなたが古代のウイルスの侵入の産物を手に入れるところです。 古代のレトロウイルスが侵入し、その後DNAに変換され、ゲノムに挿入されました。 つまり、これは、進化の歴史を通じて、扱いたくないシーケンスを隠すために私たちが持ってきた手段です。 そして、それは重要な例外を除いて、私たちのゲノムでは沈黙しています。 

残りの半分は、すべてのアクティブなタンパク質コーディング遺伝子があり、すべてのアクティブな非コーディング遺伝子がある場所です。 それで、それは何をしますか? 規制機能のリストは長いですが、XNUMXつに簡略化します。 

その機能の2つは染色体の維持です。 つまり、これらはDNA複製が発生する場所です。 それはXNUMXメートルの長さのポリマーであるため、それらは私たちのゲノムの中でそれを折りたたむ役割を果たしているサイトです。 それは直径数ミクロンの核に折りたたまれる必要があります。 

XNUMX番目の調節領域は、遺伝子調節に関与するこれらすべてのものです。 おそらく、ゲノムの多くは、遺伝子自体を指定するよりも、遺伝子発現の調節機能を指定しています。 そしてそれは、各細胞が遺伝子ごとに異なる調節領域を使用しているためです。

HANNE:とてもおもしろいです。少しの間、クローゼットに入れる必要のあるものの棚が付いたクローゼットがあるように聞こえます。次に、インフラストラクチャクローゼットがあります。

なぜこれに集中することが重要なのでしょうか。 それは、すべての疾患関連の遺伝的変異の75%以上が発生する場所だからです。

リック:はい。 基本的に、あなたが持っているのは、コーディングと非コーディングの両方で、すべてのセルに共通の遺伝子セットです。 また、要素があり、特定のセルタイプでのみ動作する実際のシーケンスがあります。 したがって、任意の20,000つのセルをプログラミングする際の目標は、特定のシーケンスセットを使用して、その一般的な遺伝子セットのそれぞれを必要なレベルに調整することです。 つまり、XNUMXのタンパク質コーディング遺伝子と、ほぼ同じ数の非コーディング遺伝子の素晴らしい楽器を演奏していることになります。 あなたは特定のシーケンスを通してそれをやっています。 私たちの問題は、実際にプログラムを知らないことです。

規制プログラムをからかう

HANNE:では、どうやってそれを議論し始めるのですか? このプログラムを理解しようとし始めたときにあなたがフォローしているヒントは何ですか?

リック:ヒントは、細胞内の各遺伝子の調節領域がそれ自体を表示するということです。 彼らはあなたに言います。 そして、あなたは使用することができます さまざまな技術sゲノム全体、特定の細胞型、たとえば運動ニューロンでは、その細胞内にあるすべての調節領域をすばやく知ることができます。 これらの各遺伝子のレオスタットがどこに設定されているかを確認することもできます。 そこで、迅速なシーケンシングにより、特定の細胞型のゲノムのコーディングと非コーディングの両方で、遺伝子のすべてのアクティブな要素を同時に推定するこれらの機能が提供されました。 

現時点での私たちの問題は、一度にこれをほぼXNUMXつの細胞型で行う必要があることです。また、何百もの細胞型があります。 私たちの組織はすべて実際には複数の細胞タイプの組み合わせであるため、他の細胞に汚染されることなく特定の細胞を実際に見るのは難しい場合があります。

ホルヘ:すべての細胞がゲノム全体を持ち、すべての細胞が歌集全体を持ち、特定の細胞型が特定の交響曲を演奏することを選択し、ゲノムの調節を助ける機械が本質的にオーケストラ? その機械は、どの曲を演奏するか、どの音符を叩くか、どの音量で叩くか、どのテンポで演奏するかなどを決定する指揮者です。これは、ゲノムの調節機能を理解するための合理的なアナロジーですか?

リック:それは、出力がどうなるかを簡単に確認できるという意味です。 しかし、もっと難しいのは、誰がすべてのメモを書くのかということです。 それらすべてのメモをそこに入れて、それを大丈夫にした作曲家は誰ですか? 作曲家は、私たちのほとんどの細胞とほとんどの遺伝子にとって、転写因子と呼ばれるこれらのタンパク質分子であり、その仕事は遺伝子の調節要素に結合し、それらにレオスタット設定を与えることです。 

さて、これには興味深いしわがあります。なぜなら、これらの転写因子が結合する部位では、それらをエンハンサーと呼んでいるからです。 それらのエンハンサー部位には、それらが結合しているその部位から作られているRNAも常にあります。 RNAが調節において重要な役割を果たしていることを私たちは最近理解するようになりました。 それを増幅するだけです。iPhoneがあなたの顔を認識する方法は、頭蓋の顔の構造遺伝子を制御するエンハンサーが人間ごとに異なるためです。 

あなたが今ここに持っているのはこの三頭政治です。 あなたはDNA配列を持っています。 それは、転写因子である構成分子によって特異的に認識されますが、この75番目の部分であるこのRNA分子が必要です。 したがって、DNA、RNA、およびタンパク質は、実際にはこれらの調節領域で連携して機能します。 そして、なぜこれにそれほど集中することが重要なのでしょうか? それは、すべての疾患関連の遺伝的変異のXNUMX%以上が発生する場所だからです。

HANNE:音楽的にオタクになりすぎないように。でも、和音のように聞こえますよね? XNUMXつの音符の構造がすべて一緒に演奏されて、より大きなものを作成します。

リック:そうです。

プログラマー

ホルヘ:生物学の最も最先端の分野のXNUMXつは、細胞プログラムがどのように決定されるか、細胞の運命がどのように決定されるかについての支配法のいくつかを理解しようとする私たちの能力の向上です。 私にとって、私たちの理解における魅力的な飛躍のXNUMXつは、山中が行った仕事から来ました。 ノーベル賞、細胞をごく少数の特定の転写因子にさらすだけで細胞型を再プログラムできることを示しています。

HANNE:なぜそれがこの分野の画期的な出来事だったのか説明できますか?

リック:私はその映画でちょっとした役割を果たしました。 それは非常に多数ですが、少数の転写因子がその細胞のアイデンティティに不可欠なすべての調節要素を識別できることがわかりました。 そして山中は、これらの要因のうちXNUMXつだけが、任意のヒト細胞または任意の男性細胞を胚性幹細胞に相当するものにプログラムするために使用できることを示して、これを証明しました。

これについて考える一つの方法は、歌があまりにも悪い場合、生物は生きていないということです。 しかし、それが少しずれていると、あなたは成長し、大人になり、そして私たちが年をとるにつれて、これらのさまざまな病気をすべて獲得します。

ホルヘ:それはすごいですね。 それは、システムがどういうわけか、単純さのように聞こえるものから信じられないほどの複雑さが引き出されるように設計されていることを示唆しているからです。 さまざまな細胞型を支配するイベントのすべての複雑なカスケードを決定するXNUMXつの転写因子。 

あなたが行った研究のいくつかは、これらのマスター転写因子が、細胞がその状態を確立して維持するために必要な遺伝子を制御する回路と同等のものを本質的に設定することを示しています。 遺伝子制御回路の意味を教えてください。

リック:遺伝子制御回路にはXNUMXつのクールな要素があります。 XNUMXつは、マスターレギュレーターがこれらのエンハンサーを見つけて、その標的遺伝子の発現を引き起こす場合、それは回路の一部であり、それが出力です。 とてもクールな他の要素は、マスター転写因子もそれら自身の発現を調節することです。 したがって、フィードバックループがあります。 同様に、マスターが自分の遺伝子から自分の発現を制御し、次にターゲットの遺伝子セットに結合してその発現を制御する電気回路図があります。

ホルヘ:それはかなりワイルドです。 これは、転写因子がタンパク質であり、そのタンパク質がDNAから作られ、遺伝子にコード化されている循環参照のようなものです。 転写因子は、遺伝子の転写における発現を助ける機構の一部です。 したがって、転写因子(タンパク質)は、転写因子を作る遺伝子の発現を調節するのに役立つと言っています。

ハンネ:うん。 これらすべての小さな細胞のこの交響曲全体の精神的なイメージがあります、あなたが知っている、これらすべての異なるテクスチャーを歌っています。 

調節ゲノムと病気

HANNE:これがどのように機能するかを理解し始めると、何が変わりますか? この知識で何ができるでしょうか?

リック:これらのマスター転写因子が各細胞のアイデンティティを推進しているこれらの部位は、人間の多様性のほとんどが病気を引き起こす場所です。 疾患に関連する変異の75%以上は、重要な遺伝子を駆動しているこれらのエンハンサー要素で発生します。

ホルヘ:わかりました。 ワイルドですね。 病気の原因や原因となる突然変異について考えるとき、私たちは通常、タンパク質に影響を及ぼし、何らかの形でタンパク質を破壊し、病気を引き起こす遺伝子内で発生する突然変異について考えます。

ハンネ:そうですね。

ホルヘ:しかし、あなたが言っているのは、75%のケースで、その突然変異は実際には遺伝子の外で起こっており、ゲノムのこの非コード領域で起こっているということです。 遺伝子が曲である場合、それは曲が誤って再生されているということではなく、再生が大きすぎる、小さすぎる、遅すぎる、または速すぎる可能性があるということですが、それが多くの病気を引き起こします。

リック:実際、これについて考えるXNUMXつの方法は、歌が悪すぎると、生物は生きていないということです。 しかし、それが少しずれていると、あなたは成長し、大人になり、そして私たちが年をとるにつれて、これらのさまざまな病気をすべて獲得します。

初めて、装置のセットアップ方法と動作方法について、これらすべてのモデルを用意しました。

ホルヘ:遺伝子の間違ったバージョンを作っているのではなく、遺伝子の間違った投与量を得ています。 多すぎるか少なすぎる。

リック:その通りです。 これに対処する治療法をどのように見つけますか? どのようにして遺伝子を選択的に調整または調整しますか? 原則として、私たちは多くの方法でそれを行うことができます、そして私たちは遺伝子治療でそれを行うことができます。 CRISPR遺伝子編集でそれを行うことができます。 しかし、ここ数年で私たちが発見した最も重要なことは、これらの遺伝子調節要素のそれぞれがRNAを持っているということです。 RNAは機能的です。 これは、その遺伝子の出力を調整するのに役立つレオスタットです。 今、あなたができる多くの方法があります 薬物RNA。 私たちは持っている ASO (アンチセンスオリゴヌクレオチド)、脊髄性筋萎縮症のスピンラザなど。 RNA干渉があります。 私たちは、いくつかの新しい小分子薬を間近に控えています。 調節RNA、調節RNAを調節するために、現在、薬物、合成RNAをプログラミングする方法を考えることができれば、その細胞がその薬物にアクセスできる任意の細胞内の任意のXNUMXつの遺伝子を調整する主要な方法があります。

HANNE:それは、病気がどのように発生するかについてのまったく異なる理解だけではありません。 しかし、それは私たちが潜在的に病気を治療する方法についての全く異なる理解です。

リック:その通りです。 原則として、現在、関心のある任意のXNUMXつの遺伝子を調整する薬剤を開発するプログラム可能な方法があります。 現時点では、人々はこのパンデミックのワクチンを製造するために合成RNA分子をプログラムしているだけです。 あなたがワクチンに期待できるのと同じくらい良い結果であるもの。

ホルヘ:私たちがのアプリケーションについて考えるとき 生物学の技術、私たちは通常、XNUMXつのことのいずれかを実行しようとしています。 私たちは生物学を非常に深く調査し、それを理解してその複雑さのレベルを上げようとしているのか、あるいは介入しようとしているのです。 私たちはますます非常に深いレベルで生物学を調べることができるようになっているので、細胞がどのように規制されているかによって準拠法や規則を理解しています。 そして、私たちはそれを持っています、私たちはこれらのようなますます洗練されたツールを持っています 医学のプログラム可能なモダリティ、RNAを非常に具体的にターゲットにできます。 これは、生物学を調査する能力と、ますます洗練された方法で介入する能力との間のこの好循環のようなものです。 そして、それは私たちが今日この分野で自分自身を見つける最もエキサイティングな側面のXNUMXつだと思います。

リック:私はあなたに同意します。 私たちは今、複雑さの複数の層についての深い理解を深めているので、これまでに見たことのない治療上の仮説を思いつくことができます。 ほんの数年前には想像もできなかったスピードでそれらを行うことができます。 基本的な発見と10年前に人々に導入された治療との間のその時間的距離は平均して14年でした。 今では、基礎科学に基づいた治療仮説と、XNUMXヶ月で患者さんに届く治療法を考え出すことが考えられます。 そうだった それを見て この新しいワクチンで。

HANNE:それで、私たちが病気の出現を理解する方法、それを治療する方法だけでなく、科学自体をどのように行うか、そして科学がどれほど速く起こり、患者の臨床的現実に変わるかを変えるのです。

コンパートメント化因子としてのRNA

リック:その通りです。 しかし、古典的に、薬理学についてXNUMXつの方法で考えてきたため、今ではケーキにアイシングがあります。 XNUMXつは個人に対する薬の効果でした。 もうXNUMXつは、薬物に対する個人の影響でした。 そして、この後者のセグメントでは、あなたは薬の配布、それがどの組織に行くのか、どの組織にそれが利用できないのかについて心配しています。 薬が細胞に入ると、それが細胞内を拡散して標的を見つけると仮定しているだけです。 膜に結合したコンパートメントがあり、これはXNUMX世紀前から知られています。

ホルヘ:細胞の透過性の問題は常にどちらでしたか? それは膜を越えることができますか?

リック:はい。 それは膜を通過できますか、そしてそれは核に入りますか? しかし、私たちは過去XNUMX年間で、細胞内に非膜体と呼ばれるものもたくさんあることを理解するようになりました。 生体分子凝縮体 これらの物体が形成される理由の5つは、水が凝縮して露滴になるように凝縮するためだと考えられているためです。 しかし、この理解について非常に深いのは、これらの凝縮物が特定の機能のためにタンパク質、DNA、RNAを区画化することです。 そして今、私たちは、細胞内の10〜XNUMX億のタンパク質とRNA分子を、仲間と一緒に機能するさまざまな区画に分離できることを理解するようになりました。

ハンネ:ええと。

ホルヘ:私たちは生物学の領域を離れ、物理学の領域に入りますか?

リック:相分離が推進力であると考えられているので、まさにそれを実行しました。 それは数学で表現された物理現象です。

HANNE:うわー。

リック:今、私たちは最も効果的な化学療法薬が 集中する ターゲットが住んでいるコンパートメント内。 それらは細胞の残りの部分の600倍に集中しているので、私たちが期待したものの600倍の癌遺伝子に対する標的活性を持っています。 これは、将来の創薬と開発に重要なまったく新しい洞察があることを私たちに伝えるだけでなく、これらの凝縮物が何をするのかをよりよく理解したいと思うようになります。

これが私がケーキの上のアイシングによって意味するものです。 私たちが気付いたのは、このような重要な方法で細胞を機能させているこれらの凝縮液コンパートメントは、RNAによって制御されているということです。 それらの形成はRNAによって刺激することができます。 RNAの生成量が多すぎる場合は、レオスタットを11まで上げると、凝縮液が溶解します。 そのため、突然、細胞内の任意の部位でのRNA出力が、その機能が発生している凝縮液を強化または溶解することにより、あらゆる機能を調整できることに気付きました。 つまり、機能不全になった細胞の機能を調整するために、プログラム可能なRNA、合成RNA分子を使用することができるもうXNUMXつの方法であるため、私は深いと思います。 初めて、装置のセットアップ方法と動作方法について、これらすべてのモデルを用意しました。

HANNE:ダイヤルするもうXNUMXつのノブ。

リック:では、どうやってそれをオフにするのですか? その長いRNAを作ると、それは負の電荷の大きな列に過ぎず、凝縮液を溶解して遺伝子をシャットダウンすることがわかります。 それが遺伝子が調節される方法です。 凝縮液をRNAで調整し、遺伝子が完全に転写されたときに生成されるRNA製品でシャットダウンします。

HANNE:すごい。 つまり、オフとオンのスイッチです。

リック:それは誰も予想していなかったオフ/オンスイッチです。 そして、これもまた、プログラム可能な薬を持っている場合、機能不全の細胞機能を標的とする新しい方法、治療上の問題の新しい解決策があることを意味します。

ホルヘ:ある人のジャンクDNAは、別の人の洗練されたゲノム調節機構です。

HANNE:またはすべての人の。 

15年2022月XNUMX日に投稿

テクノロジー、イノベーション、そして未来。

ご登録いただきありがとうございます。

受信トレイでウェルカムノートを確認してください。

タイムスタンプ:

より多くの アンドレッセン・ホロウィッツ