Искусственный интеллект, разрабатывающий белки, открывает двери для лекарств, о которых люди не могли даже мечтать Платон. Анализ данных на основе блокчейна. Вертикальный поиск. Ай.

Искусственный интеллект, создающий белки, открывает двери для лекарств, о которых люди и мечтать не могли

изображение

Проектирование белка немного похоже на изготовление шкафа. Первым шагом является построение скелета, который удерживает белок вместе. Но затем наступает трудная часть: выяснить, где установить петли на лесах, то есть найти лучшие «горячие точки» для установки дверей, полок и других приспособлений, которые в конечном итоге сделают шкаф полностью функциональным.

В некотором смысле белки также имеют горячие точки, встроенные в их структуру. Верные своему названию «функциональные участки», эти интригующие уголки и закоулки образуют замысловатые доки, за которые могут зацепиться другие белки или лекарства. Сайты играют центральную роль в выполнении большинства наших основных биологических процессов. Они также являются огромным золотым прииском для разработки новых методов лечения и медицинских препаратов.

Проблема? Функциональные сайты трудно сопоставить. Ученым традиционно приходилось мутировать подозрительные области белка одну за другой, заменяя одну аминокислоту на другую, чтобы определить точные точки связывания. Как детектив, просматривающий сотни подозреваемых, которых может быть много, это чрезвычайно утомительно.

A Новое исследование in Наука перевернул всю книгу игр. Под руководством доктора Дэвида Бейкера из Вашингтонского университета команда воспользовалась «воображением» ИИ, чтобы с нуля придумать множество функциональных сайтов. Это «творчество» машинного разума в лучшем виде — алгоритм глубокого обучения, который предсказывает общую площадь функционального участка белка, а затем дополнительно моделирует структуру.

Чтобы проверить реальность, команда использовала новое программное обеспечение для создания лекарств, которые борются с раком, и разработки вакцин против распространенных, хотя иногда и смертельных, вирусов. В одном случае цифровой разум придумал решение, которое при тестировании в изолированных клетках идеально соответствовало существующему антителу против обычного вируса. Другими словами, алгоритм «вообразил» горячую точку из вирусного белка, сделав ее уязвимой в качестве мишени для разработки новых методов лечения.

Алгоритм является первым шагом глубокого обучения в построении белков вокруг их функций, открывая двери для лечения, которые ранее были невообразимы. Но программное обеспечение не ограничивается горячими точками природного белка. «Белки, которые мы находим в природе, — это удивительные молекулы, но созданные белки могут делать гораздо больше», — сказал Бейкер в пресс-релизе. Алгоритм «делает то, на что никто из нас не думал, что он способен».

Белковая точка доступа

Команда Бейкера не новичок в предсказании белков с помощью искусственного разума. Несколько лет назад они произвели фурор в области структурной биологии, выпустив Rosetta, программное обеспечение, которое может предсказывать трехмерную структуру белка, основываясь только на его аминокислотной последовательности. Далее они нанесли на карту белковые комплексы и разработали белковые «отвертки» с нуля, чтобы разобрать нежелательные белковые взаимодействия. В конце прошлого года они выпустили сеть глубокого обучения назвал trRosetta, «архитектора» искусственного интеллекта, который обобщает, как цепочки аминокислот объединяются в сложные структуры на наноуровне.

Давайте резервную копию.

Белки легко представить в виде мясистых жилистых куриных крылышек, которые я откусываю, пока печатаю это предложение. Но на молекулярном уровне они гораздо элегантнее. Представьте себе несколько блоков Lego — аминокислот, соединенных ниткой. Теперь вращайте его, скручивая цепь, пока несколько блоков не защелкнутся друг с другом. Это образует тонкую структуру, которая часто напоминает спираль или смятые простыни. В некоторых белках эти строительные блоки далее собираются в комплексы — например, создавая канал, который проходит через защитную мембрану клетки, как патрулируемая автомагистраль между штатами.

Белки приводят в действие каждый отдельный биологический процесс, часто через каскад взаимодействий с другими белками или лекарствами, которые — в зависимости от партнера — могут вызывать совершенно разные последствия: должна ли клетка жить или умереть? Напасть на потенциального захватчика или отступить? Другими словами, белок — это строительные блоки жизни, и анализ их структуры — это то, как мы можем взломать жизнь.

Вот в чем дело: не все части белка одинаковы. Если белок — это человеческое тело, функциональные участки — это его «руки», где он цепляется за другой белок или лекарство, запускает ферментативные реакции или борется с вторжением патогенов. Эти участки, встроенные непосредственно в структуру белка, трудно определить и еще труднее воссоздать.

Новое исследование решило проблему с версией Rosetta: с некоторыми предварительными знаниями, может ли компьютер придумать цепочку аминокислот, которые естественным образом складываются в функциональный сайт?

Мечтатель и реалист

Проблема может показаться экзотической, но есть предыдущий пример — в другой области. Используя нейронную сеть, OpenAI создал широкий спектр изображений только из текстовых подписей. Побочный продукт генератора текста с искусственным интеллектом Rockstar GPT-3, алгоритм DALL·E генерировал фантастические, но реалистично выглядящие изображения на основе простых текстовых подсказок, обнаруживая закономерности в ходе обучения. «Он берет самые глубокие, самые темные уголки вашего воображения и превращает их во что-то жутко уместное». — сказал Доктор Хани Фарид из Калифорнийского университета в Беркли после первого выпуска инструмента.

Построение функционального сайта белка аналогично. Здесь аминокислоты — это буквы, а функциональный сайт белка — это изображение. «Идея та же: нейронные сети можно научить видеть закономерности в данных. После обучения вы можете дать ему подсказку и посмотреть, сможет ли он создать элегантное решение», — сказал доктор Джозеф Уотсон, ведущий автор новой работы. Только вместо того, чтобы писать роман, алгоритм может помочь переписать жизнь.

Команда начала с предыдущего творения, trRosetta. Это нейронная сеть, изначально предназначенная для создания новых белков на основе аминокислотных последовательностей, при этом способная предсказывать их структуру — некоторые из них настолько отличаются от естественных, что команда назвала внутреннюю работу глубокого обучения «галлюцинацией». Алгоритм казался совершенным: он мог предсказать как аминокислотную последовательность белка, так и его структуру.

Икота? Это действительно не сработало. Наоборот, ОГ предсказания структуры белка, РозаTTAFold, выступал как чемпион. Сила алгоритма заключается в его конструкции: моделировании каждой аминокислоты в наномасштабе с указанием координат для каждого атома. Подобно закреплению географического объекта с помощью Google Maps, это обеспечивает уровень достоверности структуры, которую ИИ может в дальнейшем воспроизвести — своего рода «вынужденная галлюцинация».

Перевод? RoseTTAFold может предсказать функциональную структуру, специфичную для рассматриваемой проблемы, и предложить грубый набросок в качестве окончательного проекта.

Затем появился еще один хитрый прием, получивший название «раскрашивание». Здесь команда спрятала части последовательности или структуры белка. Программное обеспечение должно было научиться расшифровывать информацию из шумного радиоперехвата, когда вы можете услышать только первые несколько слов, но попытаться понять их значение, заполняя пробелы. RoseTTAFold с энтузиазмом взялся за «проблему восстановления недостающей информации», автодополняя как аминокислотные последовательности, так и структуры для построения данной функциональной области с высокой точностью.

RoseTTAFold может решать проблемы построения аминокислотных последовательностей и создания основы для сайта одновременно. Это как писать слова на бумаге: писатель следит за тем, чтобы каждая буква была на своем месте, одновременно проверяя грамматику и смысл.

Вопрос о природе реальности

Испытав свое новое творение, команда разработала несколько дизайнов лекарств и вакцин, которые потенциально могут бороться с вирусами и раком или помочь с проблемами со здоровьем, связанными с низким содержанием железа.

Для ведущего автора, доктора Цзюэ Вана, алгоритм стал неожиданно актуальным. Во время работы над проектом его двухлетний сын был госпитализирован в отделение неотложной помощи с легочной инфекцией, вызванной RSV (респираторно-синцитиальным вирусом) — вирусом, который обычно проявляет симптомы простуды, но может быть смертельным для детей и подростков. пожилой.

В то время Ван использовал алгоритм для разработки новых методов лечения, которые включали потенциальные участки на РСВ для дальнейшего тестирования вакцин и лекарств. Это относительно хорошо продуманная структура. Программное обеспечение галлюцинировало проекты, которые повторяли два сайта для потенциального связывания вакцин. Тесты с использованием белков-галлюцинаций, реконструированных в бактериях, быстро захватили существующие антитела — признак того, что они функциональны и что подход глубокого обучения работает.

Инцидент «заставил меня понять, что даже «тестовые» задачи, над которыми мы работали, на самом деле имели большое значение», — сказал Ван.

В нескольких дополнительных тестах команда разработала функциональные участки для фермента, белков, связывающих белки, и белков, которые захватывают ионы металлов — в основном, как вы поглощаете железо и другие важные металлы.

Несмотря на мощность, есть куда расти. Этот метод открывает двери для демистификации природных белков, а также для потенциальной разработки новых белков для синтетической биологии. «Это очень мощные новые подходы, но еще многое можно улучшить», — сказал Бейкер.

В целом, это еще одна победа глубокого обучения и захватывающая демонстрация синергии ИИ и биологии. «Глубокое обучение изменило предсказание структуры белка за последние два года, и сейчас мы находимся в процессе аналогичного преобразования структуры белка», — сказал Бейкер.

Кредит изображения: Ян С. Хейдон/Институт белкового дизайна UW. Новое программное обеспечение искусственного интеллекта, обученное работе с белковыми структурами, может генерировать функциональные белки, в том числе вакцины-кандидаты против респираторного вируса RSV, за считанные секунды.

Отметка времени:

Больше от Singularity Hub