Meta'nın Yeni ChatGPT Benzeri Yapay Zekası Protein Dilinde Akıcı

Meta'nın Yeni ChatGPT Benzeri Yapay Zekası Protein Dilinde Akıcı

Meta'nın Yeni ChatGPT Benzeri Yapay Zekası, Proteinlerin Dilinde Akıcıdır PlatoBlockchain Veri Zekası. Dikey Arama. Ai.

Her protein yapısını çözme yarışı, başka bir teknoloji devini daha yeni karşıladı: Meta AI.

Facebook ve Instagram ile tanınan Meta'nın bir araştırma kolu olan ekip, protein şekli tahmin sahnesine iddialı bir hedefle geldi: protein evreninin "karanlık maddesini" deşifre etmek. Genellikle bakterilerde, virüslerde ve diğer mikroorganizmalarda bulunan bu proteinler, günlük çevremizde bulunur, ancak bilim için tam bir muammadır.

"Hakkında en az bildiğimiz yapılar bunlar. Bunlar inanılmaz derecede gizemli proteinler. Bence biyolojiye dair büyük bir içgörü potansiyeli sunuyorlar.” şuraya kıdemli yazar Dr. Alexander Rives Doğa.

Başka bir deyişle, biyoteknoloji için bir ilham hazinesidirler. Gizli şekillerinde gizli olan tasarım anahtarlarıdır. verimli biyoyakıtlar, antibiyotikler, enzimler, ya da tamamen yeni organizmalar. Buna karşılık, protein tahminlerinden elde edilen veriler, AI modellerini daha fazla eğitebilir.

Meta'nın ESMFold adlı yeni yapay zekasının merkezinde büyük bir dil modeli var. Tanıdık gelebilir. Bu makine öğrenimi algoritmaları, rock yıldızı sohbet robotu ChatGPT ile dünyayı kasıp kavurdu. Basit istemlerle güzel denemeler, şiirler ve şarkı sözleri oluşturma yeteneğiyle tanınan ChatGPT ve yakın zamanda piyasaya sürülen GPT 4— halka açık milyonlarca metinle eğitilirler. Sonunda yapay zeka harfleri, sözcükleri tahmin etmeyi ve hatta tüm paragrafları yazmayı öğrenir ve Bing'in benzer sohbet robotu söz konusu olduğunda, konuşmaları bu bazen biraz sinir bozucu olabiliyor.

Yeni çalışma, yayınlanan Bilim, AI modeli ile biyoloji arasında köprü kurar. Proteinler 20 "harften" yapılmıştır. Evrim sayesinde, harflerin sırası nihai şekillerini oluşturmaya yardımcı olur. Büyük dil modelleri, İngiliz alfabesinin 26 harfini tutarlı mesajlara kolayca yorumlayabiliyorsa, neden proteinler için de işe yaramasınlar?

Spoyler: yaparlar. ESM-2, 600 grafik işlem birimi (GPU) kullanarak sadece iki haftada yaklaşık 2,000 milyon protein yapısı tahmini yaptı. Önceki denemelerle karşılaştırıldığında yapay zeka, süreci 60 kata kadar daha hızlı hale getirdi. Yazarlar, her yapıyı keşfedebileceğiniz ESM Metagenomic Atlas'a koydu. okuyun.

Çalışmaya dahil olmayan Barselona Ulusal Süper Bilgi İşlem Merkezi'nden (BCS) Dr. Alfonso Valencia'ya göre, büyük dil sistemlerini kullanmanın güzelliği bir "kavramsal basitlik” Daha fazla geliştirmeyle yapay zeka, "bilinen evreni evrimsel süreçlerin keşfettiklerinin ötesine genişleterek, doğal olmayan proteinlerin yapısını" tahmin edebilir.

Evrimi Konuşalım

ESMFold basit bir yönergeyi izler: sıra yapıyı tahmin eder.

Geriye dönelim. Proteinler, her biri bir "harf" olan 20 amino asitten yapılır ve bir ipteki dikenli boncuklar gibi dizilir. Hücrelerimiz daha sonra onları hassas özellikler haline getirir: bazıları buruşuk çarşaf gibi görünür, diğerleri ise girdaplı şeker kamışı veya gevşek kurdeleler gibi görünür. Proteinler daha sonra bir multipleks oluşturmak için birbirlerini yakalayabilirler - örneğin, eylemlerini kontrol eden beyin hücre zarını geçen ve karşılığında nasıl düşündüğümüzü ve hatırladığımızı kontrol eden bir tünel.

Bilim adamları, amino asit harflerinin bir proteinin son yapısını şekillendirmeye yardımcı olduğunu uzun zamandır biliyorlar. Bir dildeki harflere veya karakterlere benzer şekilde, yalnızca belirli harfler yan yana dizildiğinde anlamlıdır. Proteinler söz konusu olduğunda, bu diziler onları işlevsel kılar.

Yazarlar, "Bir proteinin biyolojik özellikleri, mutasyonları evrim yoluyla seçilen dizisine sınırlar" dedi.

Alfabedeki farklı harflerin kulağa tam bir anlamsızlık gibi gelmeden kelimeler, cümleler ve paragraflar oluşturmak için bir araya gelmesine benzer şekilde, protein harfleri de aynısını yapar. Amino asitleri vücudun anlayabileceği yapılara dizmeye yardımcı olan bir tür "evrimsel sözlük" vardır.

Valencia, "Bilinen proteinlerdeki amino asitlerin ardışık mantığı, onların belirli bir işlevi yerine getirdikleri belirli bir yapıya sahip olmalarına yol açan evrimsel bir sürecin sonucudur" dedi.

Bay AI, Bana Protein Yap

Hayatın nispeten sınırlı sözlüğü büyük dil modelleri için harika bir haber.

Bu AI modelleri, bir sonraki kelimenin tahminlerini öğrenmek ve oluşturmak için hazır metinleri araştırır. Sonuç, GPT-3 ve ChatGPT'de görüldüğü gibi, çarpıcı biçimde doğal konuşmalar ve fantastik sanatsal görüntülerdir.

Meta AI aynı konsepti kullandı, ancak oyun kitabını protein yapısı tahminleri için yeniden yazdı. Algoritmayı metinlerle beslemek yerine, bilinen proteinlerin program dizilerini verdiler.

Transformatör protein dili modeli olarak adlandırılan AI modeli, 15 milyara kadar "ayar" kullanarak proteinlerin genel mimarisini öğrendi. Genel olarak kabaca 65 milyon farklı protein dizisi gördü.

Bir sonraki adımda ekip yapay zekadan bazı mektupları saklayarak yapay zekadan boşlukları doldurmasını istedi. Program sonunda, farklı amino asitlerin birbirine nasıl bağlandığını (veya ittiğini) otomatik tamamlamayı ne ölçüde öğrendi. Sonunda yapay zeka, evrimsel protein dizileri ve fonksiyonel proteinler yapmak için birlikte nasıl çalıştıkları hakkında sezgisel bir anlayış oluşturdu.

Bilinmeze doğru

Ekip, kavramın bir kanıtı olarak iki iyi bilinen test seti kullanarak ESMFold'u test etti. Biri, CAMEO, yaklaşık 200 yapı içeriyordu; diğeri, CASP14, halka açık 51 protein şekline sahiptir.

Genel olarak, AI "en son teknoloji yapı tahmin doğruluğu sağlar" dedi ekip, "proteinlerin yarısından fazlasında AlphaFold2 performansıyla eşleşir." Aynı zamanda, büyük protein komplekslerini de güvenilir bir şekilde ele aldı; örneğin, nöronlar üzerindeki eylemlerini kontrol eden kanallar.

Ekip daha sonra yapay zekasını bir adım öteye taşıyarak metagenomik dünyasına adım attı.

Metagenomlar kulağa nasıl geliyorsa öyledir: bir DNA materyali karmaşası. Normalde bunlar ayaklarınızın altındaki kir, deniz suyu ve hatta normalde yaşanması zor olan termal bacalar gibi çevresel kaynaklardan gelir. Mikropların çoğu laboratuvarlarda yapay olarak yetiştirilemez, ancak bazılarının volkanik seviyedeki ısıya direnmek gibi süper güçleri vardır ve onları henüz keşfedilmeyi bekleyen biyolojik bir karanlık madde haline getirir.

Makale yayınlandığında, AI bu proteinlerin 600 milyondan fazlasını tahmin etmişti. En son sürümle birlikte sayı şimdi 700 milyonun üzerine çıktı. Tahminler kabaca iki hafta içinde hızlı ve öfkeli geldi. Buna karşılık, önceki modelleme girişimleri yalnızca tek bir protein için 10 dakika kadar sürdü.

Protein tahminlerinin kabaca üçte biri, atomik düzeydeki ölçeğe yakınlaştırmaya yetecek kadar ayrıntıyla, yüksek güvenilirlikteydi. Protein tahminleri yalnızca dizilerine dayandığından, kurulu veritabanlarındaki veya daha önce test edilenlerdeki hiçbir şeye benzemeyen milyonlarca "uzaylı" ortaya çıktı.

Valencia, "Tahminlerin yüzde 10'undan fazlasının bilinen diğer proteinlerle hiçbir benzerliği olmayan proteinler için olması ilginç" dedi. Bunun nedeni, işlevsel proteinleri oluşturan daha önce duyulmamış dizileri keşfetmede ve potansiyel olarak üretmede çok daha esnek olan dil modellerinin büyüsünden kaynaklanıyor olabilir. "Bu, biyoteknoloji ve biyotıp uygulamaları ile yeni dizilimlere ve biyokimyasal özelliklere sahip proteinlerin tasarımı için yeni bir alandır" dedi.

Örnek olarak, ESMFold potansiyel olarak bir proteindeki tek harfli değişikliklerin sonuçlarını ortaya çıkarmaya yardımcı olabilir. Nokta mutasyonları olarak adlandırılan bu görünüşte iyi huylu düzenlemeler vücutta büyük hasara yol açarak yıkıcı metabolik sendromlara, orak hücreli anemiye ve kansere neden olur. Yalın, ortalama ve nispeten basit bir yapay zeka, ortalama biyomedikal araştırma laboratuvarına sonuçlar getirirken, yapay zekanın hızı sayesinde protein şekli tahminlerini ölçeklendirir.

Biyotıp bir yana, başka bir büyüleyici fikir, proteinlerin büyük dil modellerini metinlerin yapamayacağı şekilde eğitmeye yardımcı olabileceğidir. Valencia'nın açıkladığı gibi, "Bir yandan, protein dizileri metinlerden daha bol, daha tanımlanmış boyutlara ve daha yüksek derecede değişkenliğe sahip. Öte yandan, proteinlerin güçlü bir içsel "anlamı" vardır - yani, dizi ve yapı arasında güçlü bir ilişki, metinlerde çok daha yaygın olan bir anlam veya tutarlılık", iki alanı erdemli bir geri bildirim döngüsünde köprüler.

Resim Kredi: meta yapay zeka

Zaman Damgası:

Den fazla Tekillik Merkezi