Metabolik ağların makine öğrenimine uygun hale getirilmesi

Kısıtlamasız genom ölçeğinde metabolik modelleri kullanırken, metabolik akış tahminlerinin doğruluğunun zayıf olması nedeniyle kendinizi hiç hayal kırıklığına uğrattığınız oldu mu? Belki kapsamlı veriler topladınız ve metabolik akışları tahmin etmek için makine öğrenimi modelleri aracılığıyla bir çözüm aradınız. Bu blog yazısında, bu zorlukların üstesinden gelen yenilikçi bir hibrit model tasarlama yolculuğumuzu derinlemesine inceleyeceğiz ve bu yeni modeli hayata geçirmek için attığımız adımları paylaşacağız.

Genom ölçekli metabolik modeller (GEM’ler), çok çeşitli organizmaların metabolik özelliklerini keşfetmek için güçlü mekanik araçlar olarak hizmet eder. GEM’ler arasında, E. coli modeller bugüne kadar mevcut en doğru ve kapsamlı modeller olarak öne çıkıyor 1. Ancak deneyciler için önemli bir engel, GEM’ler için girdi olarak akı ölçümlerinin gerekliliğidir. Ortam bileşimlerini kontrol edebilseler de, bu bileşimler, kesin niceliksel tahminler elde etmek amacıyla GEM’ler için doğrudan girdi olarak kullanılamaz.

Metabolik mühendisliğinde amacın, ideal ortam bileşimini tanımlayarak belirli bir metabolitin üretimini optimize etmek olduğu bir senaryo düşünün. Simülasyonlar, çeşitli ortam bileşimlerinin metabolit üretim hızı üzerindeki etkisinin bir GEM kullanılarak değerlendirilmesiyle gerçekleştirilebilir. Ancak bu durumda deneyciler, her bir ortam bileşimi için alım akışlarının üst sınırlarını manuel olarak ayarlamak gibi zahmetli bir görevle karşı karşıyadır; bu, yalnızca zaman alıcı değil aynı zamanda öznel bir süreçtir.

Hibrit genom ölçekli modellerin geliştirilmesinin arkasındaki temel itici güç, bu sınırlamanın üstesinden gelmekti.

Modelleme alanının diğer tarafında, görünüşte mekanik modellere karşı olan makine öğrenimi modellerinin, deneylere rehberlik etmede çok yararlı olduğu kanıtlanmıştır. 2. Ayrıca protein katlanması gibi yüksek karmaşıklıktaki sorunları da çözebildikleri kanıtlanmıştır. 3. Bir deneycinin kontrollü deney düzeni ile bir organizmada bulunan metabolik akışlar arasındaki karmaşık ilişki (birçok düzenleyici mekanizmaya dayalı) göz önüne alındığında, bu yeteneklerin yararlı olması gerektiğini değerlendirdik.

GEM (mekanistik) ve ML modellerinin artılarını ve eksilerini gözlemleyerek hibrit modelleme alanını araştırdık. Akı Dengesi Analizi (FBA), GEM’lerle tahminler çıkarmak için kullanılan olağan hesaplama çerçevesidir. Sonuç olarak projenin ilk adımı, sinir ağı modellerine entegre edilebilecek FBA yerine geçen yöntemler oluşturmaktı. Başarılı bir şekilde üç çeşit Amazon Lojistik yerine geçme yöntemini geliştirdik. Tekrarlayan sinyal ağlarına dayalı ilham verici yaklaşımlar bulduk 4Hopfield’ın ağları 5ve Fizik Bilgili Sinir Ağları 6. Bu yaklaşımları kullanarak ve fazla çaba harcamadan, GEM’lerin sinir ağlarıyla entegrasyonunu denemeye karar verdik.

Daha sonra, bu FBA yerine geçen yöntemleri bir sinir ağı mimarisine entegre ederek nihai hibrit model mimarimizi oluşturduk. Doğal olarak performanslarını FBA simülasyonları ve bakteri türlerinden elde edilen deneysel veriler de dahil olmak üzere birçok veri kümesi üzerinde değerlendirdik. Sonuçlarımız, GEM’lerdeki FBA ile hibrit modellerimiz arasındaki büyüme oranındaki regresyon performansının büyük ölçüde arttığını gösterdi. Ayrıca hibrit modellerimizin geleneksel makine öğrenimi yöntemlerine göre çok daha düşük miktarda eğitim verisine ihtiyaç duyduğunu da gözlemledik. Ancak hibrit model tahminlerinin gerçekten anlamlı ve güvenilir olduğuna dair hâlâ bir garantimiz yoktu.

Projenin son adımı bir ‘rezervuar hesaplama’ yaklaşımı oluşturmaktı. Simülasyon verileri üzerine yapılan eğitimden FBA’yı doğru bir şekilde taklit eden hibrit bir model elde edildi. Parametrelerini dondurduktan sonra bu modele ‘rezervuar’ adını verdik. Daha sonra, doğru tahminler yapabilmek için deneysel verilerden bu rezervuar için en iyi girdileri öğreniyoruz. Bu yaklaşım, tüm deney koşulları için besin maddelerinin üst sınır değerlerini çıkarmamızı ve bunları FBA girdisi olarak kullanmamızı sağladı. Bu tür girdilerle çalışan FBA, yalnızca hibrit modellere benzer performans gösterdi ve bu da hibrit modellerimizin gerçekten anlamlı tahminler yapabileceğini gösterdi.

Özetle, çalışmamız genom ölçeğinde metabolik ağ hesaplama çerçevelerinin geliştirilmesine yönelik öncü bir adım olarak hizmet ediyor. GEM’lere yönelik bu hibrit modelleme yolculuğuna çıkarken, topluluğun daha sağlam ve ince ayarlı hibrit GEM modelleri geliştirme yönündeki kolektif çabalarını öngörüyoruz. Sonuçta, metabolik ağ modellemesi için hesaplamalı çerçeve paradigmasında dönüştürücü bir değişim öngörüyoruz.

Referanslar:

  1. Reed, JL & Palsson, B.Ø. Escherichia coli’nin silico modellerinde kısıtlamaya dayalı olarak on üç yıl boyunca inşa edildi. J. Bakteriol. 1852692–2699 (2003).
  2. Borkowski, O. ve ark. İn vitro protein üretimi optimizasyonu için büyük ölçekli aktif öğrenme rehberli araştırma. Nat. İletişim 111872 (2020).
  3. Jumper, J. ve ark. AlphaFold ile son derece doğru protein yapısı tahmini. Doğa 596583–589 (2021).
  4. Nilsson, A., Peters, JM, Meimetis, N., Bryson, B. & Lauffenburger, DA Yapay sinir ağları, hücre içi sinyalleşmenin genom ölçeğinde simülasyonlarına olanak tanır. Nat. İletişim 133069 (2022).
  5. Hopfield, JJ & Tank, DW Optimizasyon problemlerinde kararların ‘sinirsel’ hesaplanması. Biyol. Siber. 52141–152 (1985).
  6. Raissi, M., Perdikaris, P. ve Karniadakis, GE Physics bilgili sinir ağları: Doğrusal olmayan kısmi diferansiyel denklemler içeren ileri ve ters problemleri çözmeye yönelik derin bir öğrenme çerçevesi. J. Bilgisayar. Fizik. 378686–707 (2019).

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir