단백질 설계 AI는 인간이 PlatoBlockchain 데이터 인텔리전스를 꿈꿀 수 없는 의약품의 문을 엽니다. 수직 검색. 일체 포함.

단백질 설계 AI는 인간이 꿈꿀 수 없는 의약품의 문을 엽니다

영상

단백질을 디자인하는 것은 캐비닛을 만드는 것과 비슷합니다. 첫 번째 단계는 단백질을 함께 유지하는 백본을 구축하는 것입니다. 그러나 어려운 부분이 있습니다. 비계에 경첩을 설치할 위치를 파악하는 것, 즉 최고의 "핫스팟"을 찾아 궁극적으로 캐비닛을 완벽하게 작동시키는 문, 선반 및 기타 부착물을 놓을 위치를 찾는 것입니다.

어떤 면에서, 단백질은 또한 그들의 구조에 내장된 핫스팟을 가지고 있습니다. "기능적 부위"라는 이름에 걸맞게 이 흥미로운 구석은 다른 단백질이나 약물이 붙잡을 수 있는 복잡한 부두를 형성합니다. 사이트는 우리의 기본적인 생물학적 과정의 대부분을 수행하는 중심입니다. 그들은 또한 새로운 치료법과 의약품을 설계하기 위한 거대한 금광입니다.

문제? 기능적인 사이트는 매핑하기 어렵습니다. 과학자들은 전통적으로 정확한 결합 지점을 찾기 위해 단백질의 의심되는 영역을 하나씩 돌연변이(한 아미노산을 다른 아미노산으로 전환)해야 했습니다. 탐정이 수백 명의 용의자를 선별하는 것처럼 그 중 많은 수가 있을 수 있으므로 매우 지루합니다.

A 새로운 연구 in 과학 게임북 전체를 뒤집었다. 워싱턴 대학(University of Washington)의 데이비드 베이커(David Baker) 박사가 이끄는 팀은 AI의 "상상력"을 활용하여 무수히 많은 기능적 사이트를 처음부터 꿈꾸었습니다. 그것은 최고의 기계 마인드의 "창의력"입니다. 즉, 단백질 기능 부위의 일반적인 영역을 예측한 다음 구조를 더 조각하는 딥 러닝 알고리즘입니다.

현실을 확인하기 위해 팀은 새로운 소프트웨어를 사용하여 암과 싸우는 약물을 생성하고 때로는 치명적일지라도 일반적인 바이러스에 대한 백신을 설계했습니다. 한 사례에서 디지털 마인드는 분리된 세포에서 테스트했을 때 일반적인 바이러스에 대한 기존 항체와 완벽하게 일치하는 솔루션을 생각해 냈습니다. 다시 말해, 알고리즘은 바이러스 단백질의 핫스팟을 "상상"하여 새로운 치료법을 설계하는 표적으로 취약하게 만듭니다.

이 알고리즘은 기능을 중심으로 단백질을 구축하는 딥 러닝의 첫 번째 시도로, 이전에는 상상할 수 없었던 치료의 문을 엽니다. 그러나 소프트웨어는 천연 단백질 핫스팟에 국한되지 않습니다. Baker는 보도 자료에서 “자연에서 발견한 단백질은 놀라운 분자이지만 설계된 단백질은 훨씬 더 많은 일을 할 수 있습니다. 알고리즘은 "우리 중 누구도 할 수 없다고 생각한 일을 하는 것"입니다.

단백질 핫스팟

Baker의 팀은 인공 정신으로 단백질을 예측하는 데 낯설지 않습니다. 몇 년 전, 그들은 아미노산 서열만으로 단백질의 3차원 구조를 예측할 수 있는 소프트웨어인 Rosetta를 출시하여 구조 생물학 분야를 뒤흔들었습니다. 그들은 단백질 복합체를 추가로 매핑하고 바람직하지 않은 단백질 상호 작용을 제거하기 위해 처음부터 단백질 "스크류 드라이버"를 설계했습니다. 지난해 말 출시한 깊은 학습 네트워크 trRosetta라고 불리는 AI "건축가"는 아미노산 문자열이 나노 규모에서 복잡한 구조로 배열되는 방식을 일반화합니다.

백업합시다.

단백질을 이 문장을 입력할 때 씹는 고기가 많고 힘줄이 있는 닭 날개로 상상하기 쉽습니다. 그러나 분자 수준에서는 훨씬 더 우아합니다. 여러 개의 레고 블록(아미노산)이 끈으로 묶여 있다고 상상해 보십시오. 이제 일부 블록이 서로 맞물릴 때까지 체인을 비틀면서 주위를 돌립니다. 이것은 종종 나선이나 구겨진 침대 시트와 유사한 섬세한 구조를 형성합니다. 일부 단백질에서 이러한 빌딩 블록은 복합물로 더 조립됩니다. 예를 들어 순찰 중인 주간 고속도로와 같이 세포의 보호막을 관통하는 채널을 제작합니다.

단백질은 파트너에 따라 완전히 다른 결과를 유발할 수 있는 다른 단백질 또는 약물과의 일련의 상호작용을 통해 모든 단일 생물학적 과정에 동력을 제공합니다. 잠재적인 침입자를 공격할 것인가, 아니면 물러날 것인가? 다시 말해, 단백질은 생명의 빌딩 블록이며, 그 구조를 분석하는 것이 우리가 생명을 해킹할 수 있는 방법입니다.

여기 문제가 있습니다. 단백질의 모든 부분이 동일하게 생성되는 것은 아닙니다. 단백질이 인체인 경우 기능적 부위는 "손"입니다. 즉, 다른 단백질이나 약물을 붙잡고 효소 반응을 일으키거나 침입하는 병원체와 싸우는 곳입니다. 단백질 구조에 직접 내장된 이 부위는 정확히 파악하기 어렵고 재현하기가 훨씬 더 어렵습니다.

새로운 연구는 Rosetta 버전으로 문제를 해결했습니다. 일부 사전 지식을 가지고 컴퓨터가 자연적으로 기능 부위로 접히는 아미노산 사슬을 꿈꾸는 것이 가능합니까?

몽상가와 현실주의자

문제가 이상하게 보일 수 있지만 다른 분야에서 이전 예가 있습니다. OpenAI는 신경망을 사용하여 텍스트 캡션만으로 다양한 이미지를 생성했습니다. Rockstar AI 텍스트 생성기의 파생물 GPT-3, DALL·E 알고리즘은 훈련에서 패턴을 감지하여 간단한 텍스트 프롬프트를 기반으로 환상적이지만 사실적인 이미지를 생성했습니다. "그것은 당신의 상상력의 가장 깊고 가장 어두운 움푹 들어간 곳을 취하여 그것을 섬뜩할 정도로 적절한 것으로 만듭니다." 말했다 도구의 초기 릴리스 후 UC 버클리의 Hany Farid 박사.

단백질 기능 부위를 구축하는 것도 유사합니다. 여기서 아미노산은 문자이고 단백질 기능 부위는 이미지입니다. “아이디어는 동일합니다. 신경망은 데이터의 패턴을 보도록 훈련될 수 있습니다. 훈련을 받으면 프롬프트를 주고 우아한 솔루션을 생성할 수 있는지 확인할 수 있습니다.”라고 새 작업의 주 저자인 Dr. Joseph Watson이 말했습니다. 소설을 쓰는 것보다 알고리즘은 삶을 다시 쓰는 데 도움이 될 수 있습니다.

팀은 이전 작품인 trRosetta로 시작했습니다. 그것은 원래 아미노산 서열을 기반으로 새로운 단백질을 꿈꾸면서 그 구조를 예측할 수 있도록 설계된 신경망입니다. 일부는 자연적인 것과는 너무 달라 팀은 딥 러닝의 내부 작동을 "환각"이라고 불렀습니다. 알고리즘은 완벽해 보였습니다. 단백질의 아미노산 서열과 구조를 모두 예측할 수 있었습니다.

딸꾹질? 정말 효과가 없었습니다. 대조적으로, OG 단백질 구조 예측, RoseTTA폴드, 챔피언처럼 수행했습니다. 알고리즘의 힘은 나노스케일에서 각 아미노산을 모델링하고 각 원자에 좌표를 제공하는 설계에서 비롯됩니다. Google 지도를 사용하여 지리적 위치를 고정하는 것과 같이 이것은 AI가 추가로 반복할 수 있는 구조에 대해 일종의 "제약된 환각"에 대한 실제 수준을 제공합니다.

번역? RoseTTAFold는 당면한 문제에 특정한 기능적 구조를 예측하고 최종 설계로 대략적인 스케치를 제시할 수 있습니다.

그런 다음 "그림 그리기"라는 또 다른 영리한 트릭이 나타났습니다. 여기에서 팀은 단백질 서열이나 구조의 일부를 숨겼습니다. 소프트웨어는 기본적으로 잡음이 있는 무선 차단에서 정보를 해독하는 방법을 배워야 했습니다. 여기서 처음 몇 단어만 들을 수 있지만 공백을 채워 의미를 이해하려고 합니다. RoseTTAFold는 아미노산 서열과 구조를 모두 자동 완성하여 주어진 기능 영역을 충실하게 구성함으로써 "정보 누락 복구 문제"를 신속하게 해결했습니다.

RoseTTAFold는 아미노산 서열을 구축하고 사이트에 대한 백본을 생성하는 문제를 동시에 해결할 수 있습니다. 마치 종이에 단어를 적는 것과 같습니다. 작가는 각 글자가 올바른 위치에 있는지 확인하면서 문법과 의미가 맞는지 확인합니다.

현실의 본질에 대한 질문

그들의 새로운 창조물을 시험하기 위해 팀은 잠재적으로 바이러스와 암을 퇴치하거나 저철분 건강 문제에 도움이 될 수 있는 몇 가지 약물 및 백신 디자인을 생성했습니다.

수석 저자인 Jue Wang 박사에게 알고리즘은 예기치 않게 적절하게 되었습니다. 프로젝트를 진행하는 동안 그의 두 살배기 아들은 RSV(호흡기 세포융합 바이러스)에 의한 폐 감염으로 응급실에 입원했습니다. 연세가 드신.

당시 Wang은 백신과 약물을 추가로 테스트하기 위해 RSV에 잠재적인 사이트를 포함하는 새로운 치료법을 설계하기 위해 알고리즘을 사용하고 있었습니다. 비교적 잘 정리된 구조입니다. 소프트웨어는 백신이 잠재적으로 결합할 수 있는 두 사이트를 요약한 디자인을 환각했습니다. 박테리아에서 재구성된 환각 단백질을 사용한 테스트는 기존 항체를 빠르게 포착했습니다. 이는 항체가 기능하고 딥 러닝 접근 방식이 작동한다는 신호입니다.

Wang은 "이 사건을 통해 우리가 작업하고 있던 '테스트' 문제조차도 실제로 상당히 의미 있다는 것을 깨달았습니다."라고 말했습니다.

몇 가지 추가 테스트에서 팀은 기본적으로 철 및 기타 중요한 금속을 흡수하는 방법에 대해 효소, 단백질 결합 단백질 및 금속 이온을 잡는 단백질의 기능적 부위를 설계했습니다.

강력하지만 성장의 여지가 있습니다. 이 방법은 천연 단백질을 이해할 수 있는 가능성을 열어줄 뿐만 아니라 잠재적으로 합성 생물학을 위한 새로운 단백질을 설계할 수도 있습니다. "이것은 매우 강력한 새로운 접근 방식이지만 여전히 개선의 여지가 많습니다."라고 Baker는 말했습니다.

전체적으로 딥 러닝의 또 다른 승리이자 AI와 생물학이 시너지 효과를 낼 수 있는 방법에 대한 흥미진진한 쇼케이스입니다. 베이커는 “딥 러닝은 지난 XNUMX년 동안 단백질 구조 예측을 변형시켰고, 우리는 지금 단백질 디자인의 유사한 변형의 한가운데에 있습니다”라고 말했습니다.

이미지 크레디트: Ian C. Haydon/UW 단백질 디자인 연구소. 단백질 구조에 대해 훈련된 새로운 인공 지능 소프트웨어는 호흡기 바이러스 RSV에 대한 이러한 후보 백신을 포함하여 기능 단백질을 몇 초 만에 생성할 수 있습니다.

타임 스탬프 :

더보기 특이점 허브