Yapay Zeka Bilinmeyen Proteinleri Nasıl Keşfediyor ?

Yapay zeka (YZ), proteinlerin 3D yapıya nasıl katlandığını anlamada devrim yarattı ve bu başarı geçen yıl Nobel Kimya Ödülü ile onurlandırıldı. Şimdi ise YZ, protein dizilemeyi dönüştürüyor—yani proteinleri oluşturan amino asit dizilerini belirleyerek tanımlamayı. Yapay zeka, geleneksel yöntemlerden genellikle daha hızlı çalışıyor ve araştırmacıların daha önce hiç görmedikleri proteinleri dizilemelerine olanak tanıyor. Bu, tıbbi teşhisler, çevresel çalışmalar ve arkeoloji gibi alanlarda sıkça karşılaşılan bir zorluktur.

Son gelişmede, Avrupa’daki araştırmacılar Nature Machine Intelligence dergisinde, InstaNova adlı YZ’nin, yaralardaki patojenik proteinleri ve deniz suyu örneklerindeki bilinmeyen mikropların ürettiği proteinleri tanımlayabildiğini bildirdi. InstaNova, bu alandaki tek model değil. Son dört yılda 20’den fazla protein dizileme YZ’si geliştirildi. Washington Üniversitesi’nden bir proteomik YZ geliştiricisi olan William Noble, “Bu alanın gittiği yön artık çok net,” diyor.

Protein Dünyasının Karmaşıklığı

Proteinlerin dünyası, onları kodlayan DNA ve RNA’dan çok daha karmaşıktır. Örneğin, insan genomu yaklaşık 20.000 gen içerirken, bu genler 10 milyon farklı proteine dönüşebilir. Bunun nedeni, DNA’nın RNA’ya kopyalanması ve RNA’nın proteinlere çevrilmesi sırasında gerçekleşen değişiklikler ve proteinlerin ek kimyasal modifikasyonlara uğrayabilmesidir.

Biyologlar genellikle proteinleri, her biri beş ila yirmi amino asitten oluşan peptit adı verilen kısa parçalara ayırarak tanımlar. Daha sonra bu parçalar bir kütle spektrometresi ile tartılır ve kimliklerini belirlemek için bilinen peptitleri içeren veri tabanlarıyla karşılaştırılır. Son olarak, parçalar birleştirilerek tam protein molekülü oluşturulur.

Ancak bu yöntemin ciddi sorunları var. Kütle spektrometrisiyle bulunan peptitlerin %70’i mevcut veri tabanlarında bulunmuyor. Danimarka Teknik Üniversitesi’nden proteomik uzmanı Timothy Patrick Jenkins, “Geleneksel proteomik, biraz Google araması gibidir. Eğer veri tabanında yoksa, bulamazsınız” diyor. Ayrıca, peptit veri tabanları büyüdükçe eşleşmeleri tespit etmek giderek daha fazla bilgisayar süresi gerektiriyor.

Yapay Zeka ile Yeni Protein Dizileme Yöntemleri

Yeni YZ dizileme modelleri, bilinen peptitleri aramak yerine tüm olası peptit parçalarının ağırlıklarını hesaplıyor ve bunları gerçek örnekle eşleşen parçalara göre birleştirerek tam protein dizisini oluşturuyor.

Bu YZ’lerin doğruluğunu artırmak için milyonlarca bilinen peptit ve protein dizisi ile eğitiliyorlar. Böylece, YZ en yaygın amino asit birleşim kurallarını öğrenebiliyor. Jenkins’e göre, bu yöntem ChatGPT gibi büyük dil modellerinin (LLM) dil kurallarını öğrenme şekline benziyor. Nasıl ki bir dil modeli “Çocuk topu sektiriyor” ifadesinin doğru olduğunu ama “Sektiriyor topu çocuk” ifadesinin yanlış olduğunu öğreniyorsa, proteomik algoritmaları da en olası protein dizilimlerini tahmin etmeyi öğreniyor.

2021’de Noble ve ekibi, ChatGPT’ye benzer bir derin sinir ağı kullanan ilk protein dizileme YZ modeli olan Casanovo’yu geliştirdi. 2024’te Nature Communications’da yayımlanan bir makalede, Casanovo’nun eğitim verilerinde bulunmayan yeni peptit dizilerini doğru bir şekilde tanımlayabildiği gösterildi. Ek deneylerde, Casanovo kanser hücrelerine karşı bağışıklık sisteminin hedef aldığı hücre yüzeyi peptitlerini ve deniz suyu örneklerindeki bilinmeyen proteinleri başarıyla belirledi.

Şimdi Jenkins ve ekibi, bu sonuçları daha ileri taşıyarak InstaNova’yı geliştirdi. Bu model de derin öğrenme sinir ağları kullanıyor, ancak önceki modellerden farklı olarak “diffusion” (yayılım) stratejisini içeriyor. Bu yöntem, DALL-E gibi yapay zeka tabanlı görüntü oluşturma sistemlerini ve AlphaFold gibi protein yapı modellerini güçlendiren tekniklerden biri. Yayılım modelleri, girdiye rastgele gürültü (noise) ekleyerek ve bunu kademeli olarak temizleyerek en net çıktıyı elde etmeye çalışıyor.

Nature Machine Intelligence’da yayımlanan çalışmada, Jenkins ve ekibi, InstaNova’yı Casanovo ile karşılaştırdı. InstaNova+ adlı bir geliştirme ile birlikte kullanıldığında, dokuz farklı organizmadan elde edilen protein karışımında %42 daha fazla peptit tespit etti.

Gerçek Dünya Uygulamaları

Araştırma ekibi InstaNova’yı tıbbi ve çevresel örnekler üzerinde test ettiğinde çarpıcı sonuçlar elde etti:

  • İltihaplı bacak yaralarındaki kan proteini albumine ait 1.225 peptit tanımlandı. Bu, geleneksel veri tabanı aramalarına kıyasla 10 kat daha fazla eşleşme demekti.
  • Bu peptitlerden 254 tanesi daha önce bilinmeyen yeni dizilerdi.
  • Araştırmacılar ayrıca 52 bakteri proteinini de haritalayabildi.

Bu araç, arkeoloji gibi alanlarda da devrim yaratıyor. Cambridge Üniversitesi’nden proteomik uzmanı Matthew Collins, arkeolojik örneklerde protein dizileme için çeşitli YZ modellerini test etti. Toprak altında binlerce yıl boyunca kimyasal değişime uğramış proteinler veya soyu tükenmiş canlılardan gelen proteinler genellikle geleneksel veri tabanlarında yer almıyor. Collins, “Bu modeller özellikle kaotik ortamlarda—neyle karşı karşıya olduğunuzu bilmediğiniz durumlarda—çok başarılı” diyor.

Yeni YZ araçları sayesinde ekibi Neandertal sit alanlarında tavşan proteinleri ve eski Brezilya çömleklerinde balık kası proteinlerini tespit edebildi. Collins, “Bu modeller o kadar faydalı ki tüm araştırmalarımızı bunlarla yapmaya karar verdik,” diyor ve ekliyor: “Bana göre bu, devrim niteliğinde bir değişim.”

Yazının orijinal kaynağı için tıklayınız.

Daha Fazla Benzer İçerik İçin Biosscope.

Hey merhaba
Tanıştığımıza memnun oldum.

Gelen kutunuza güncel içerikleri almak için kaydolun.

İstenmeyen posta göndermiyoruz! Daha fazla bilgi için gizlilik politikamızı okuyun.

Bir Cevap Yazın

Scroll to Top