AIMD-Chig: Proteinlerin konformasyonel alanını DFT düzeyinde araştırmak

Moleküler dinamik simülasyonlarının hassasiyeti ıslak laboratuvar deneylerinden neredeyse ayırt edilemez hale geldikçe, yaşam bilimleri araştırmalarının manzarası da değişiyor. Moleküler Dinamik (MD) simülasyonları, kuvvetleri hesaplamak için kullanılan yöntemlere göre farklılık gösterir. Klasik moleküler dinamik, önceden belirlenmiş atomlar arası potansiyel fonksiyonunun uygulanması yoluyla hızlı simülasyonlara olanak tanır. başlangıçta Moleküler dinamik, moleküllerin elektronik yapısından türetilen potansiyeli kullanarak doğru moleküler karakterizasyonlar sağlar ancak büyük sistemler için aşırı hesaplama yükü sorunuyla karşı karşıya kalır. Son zamanlarda, makine öğrenimi kuvvet alanları (MLFF’ler), yüksek kaliteli veriler atomlar arası bir potansiyele uyarlanarak doğruluk ve verimliliğin dengelenmesine ışık tuttu. başlangıçta doğruluk bir önkoşuldur.

Yoğunluk Fonksiyonel Teorisi (DFT) düzeyinde çeşitli MD veri kümeleri oluşturulmuştur. Bununla birlikte, hesaplama maliyeti atom sayısıyla kübik olarak artar; bu veri kümeleri öncelikle küçük organik moleküllere odaklanır ve sınırlı çeşitliliğe sahiptir. Amacımız neredeyse tüm konformasyonel alanı araştıran kapsamlı, tam atomlu bir protein MD veri seti oluşturmaktır. Bu, MLFF’lerin protein dinamiği için uygulanabilirliğini artıracak ve klasik MD simülasyonlarının başaramayacağı protein davranışlarının tespit edilmesini sağlayacaktır.

Bu çalışmada sadece 166 atoma sahip en basit protein olan Chignolin’e odaklanıyoruz. Temel zorluk, proteinlerin konformasyonel alanının DFT seviyesinde tam olarak nasıl keşfedileceğidir. Ön deneylerimize göre Chignolin’i mikrosaniye düzeyinde simüle etmek, kuantum simülasyonuyla 28.000 yıldan fazla zaman alacak. Böylece bir dizi klasik MD simülasyonu ile kuantum MD simülasyonlarını birleştirerek yeni bir teknoloji tasarlıyor ve hesaplama süresini 28.000 yıldan 3 aya düşürüyoruz. Poster görüntüsünde gösterildiği gibi, Chignolin’in konformasyonel alanını kapsamlı bir şekilde keşfetmek için replika değişim MD’si ve geleneksel MD’yi kullanıyoruz. Daha sonra, proteinin “çapaları” olarak devasa simülasyon yörüngelerinden temsili yapıları seçiyoruz. “Çapa” kavramı veri oluşturma teknolojimizin anahtarıdır. Bunlar hızlı klasik MD simülasyonlarından türetilir, proteinin potansiyel enerji yüzeyini temsil eder ve daha sonra doğru enerji ve kuvvet hesaplaması için kuantum simülasyonuna beslenir. Çapalar, her iki tarafın avantajlarından yararlanarak klasik MD ile kuantum MD arasında bağlantı kurar ve görevi kabul edilebilir bir zaman tüketimiyle tamamlar. Sonuç olarak 3 ayda 7 milyondan fazla CPU çekirdek saati kullanılarak 2 milyon örnek üretiliyor.

İlginç bir şey, MLFF’yi eğitmek için veri kümesini kullanmak ve protein dinamikleri hakkında yeni bilgiler edinmek için model tarafından yönlendirilen MD simülasyonlarını çalıştırmaktır. Model eğitimi sırasında, ne kadar çok veri dahil edilirse modelin performansının da o kadar iyi olduğunu gördük. Ayrıca, model tarafından desteklenen MD simülasyonları gerçekleştirilirken, bir nitrojene bağlı bir hidrojenin, başka bir kalıntıdaki bir oksijen atomu tarafından çekildiği ve sabit bir bağ oluşturduğu bir protonasyon süreci tespit edildi. Bu, klasik tıp biliminin yapamadığı olguyu incelemek için bir başlangıç ​​noktası görevi görebilir. Veri kümesini kullanarak (AIMD-Chig: 166 atomlu protein Chignolin’in konformasyonel alanını ab initio moleküler dinamiklerle araştırmak (figshare.com)), protein dinamiklerini incelemek için çok çeşitli araştırmalar yapılabilir. başlangıçta kesinlik.

Bu veri kümesi, yapay zeka destekli olarak bilinen daha büyük bir projenin sonuçlarının bir parçasıdır. Ab Başlangıç Moleküler Dinamik (Yapay Zeka)2BMD) (AI2BMD: protein dinamiklerinin mutlak doğrulukla etkili karakterizasyonu | bioRxiv), yakın moleküler sistemler için hızlı moleküler dinamik simülasyonu yapmak amacıyla yapay zekadan yararlanır. başlangıçta kesinlik. Yakınına ulaşır başlangıçta 10.000’den fazla atom içeren proteinlerin enerji ve kuvvet hesaplamalarının doğruluğu. Protein dinamiklerini simüle etme yeteneği ile başlangıçta Proje, çeşitli biyokimyasal süreçlerin dinamik yönlerinin anlaşılmasında laboratuvar deneylerini etkili bir şekilde tamamlıyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir