DNA dizisi verilerine dayalı olarak mikrobiyom metabolizmasının incelenmesi

Bakteriler, insanlarda büyük bir etkiye sahip olan Dünya’daki yaşam için vazgeçilmezdir. Bir mikrobiyolog olarak, mikropların özellikle insan sağlığı ve hastalıklarında oynadıkları farklı roller beni her zaman büyülemiştir ve bakterilerin birbirleriyle ve çevreleriyle nasıl etkileşime girdiğini anlamanın temel olduğuna kesinlikle inanıyorum. Erken aşamalarda, alandaki çoğu çaba insan mikrobiyom kompozisyonunu değerlendirmeye yönelikti. Bu çalışmalar, çeşitli metabolik ve bağışıklık hastalıklarından muzdarip hastaların nasıl disbiyotik mikrobiyal toplulukları barındırdığını gösterdi. Bakteriler, konakçı hücrelerle veya diğer mikroplarla etkileşime giren yüzlerce farklı metabolit üreterek doğrudan veya dolaylı olarak sağlığı veya hastalığı teşvik edebilir. Bu mikrobiyal toplulukların türlerinin zenginliğini kataloglamak ilgili olsa da, nedensellik çıkarımına yardımcı olmak için bu fenotiplerin arkasındaki moleküler mekanizmaları ortaya çıkarmak önemlidir. Yeni çalışmamızla artık insan (veya başka herhangi bir hayvan) mikrobiyomunu farklı bir bakış açısıyla analiz etmek ve ayrıca bu karmaşık ekosistemin bileşimi ve işleyişi üzerinde etkisi olabilecek mekanik düzeyde farklılıkları açıklamak için araçlar sağlıyoruz.

Bağırsaktaki bakteriler, diğer mikropların yanı sıra konakçı üzerinde önemli fizyolojik etkileri olabilecek metabolitlerin birikmesine yol açan çeşitli metabolik dönüşümler gerçekleştirir.

2017’de, özel birincil metabolizma için bağırsak mikrobiyomunun genom madenciliğini kolaylaştıracak bir araç geliştirmek üzere Wageningen Üniversitesi’ndeki Marnix Medema grubunda doktoraya başladım: gutSMASH. Bu ikili bir yolculuk olmayacaktı. İlk günden itibaren Stanford Üniversitesi’nden küçük molekül karakterizasyonu konusunda uzman bir kimyager olan Michael Fishbach’a sahip olduğumuz için şanslıydık. Ekibi bir araya getirdikten sonra, zaten karakterize edilmiş yolların yinelemeli homoloji aramalarıyla bir Metabolik Gen Kümesi (MGC) koleksiyonu oluşturarak başladık. Bu ön analizden, anaerobların metabolik ortamının nasıl göründüğü, hangi tür tespit kurallarına (ve ne kadar esnek) ihtiyaç duyulduğuna dair bir fikir edindik ve anahtar enzimleri ve bunlara karşılık gelen alanları (makalede çekirdek enzimatik alanlar olarak da anılır) kesin olarak belirledik. ). Aracı antiSMASH çerçevesine dayalı olarak tasarladık: Protein aileleri için mevcut profil Gizli Markov Modelleri (pHMM’ler) ve ilgilenilen protein alt aileleri için özelleştirilmiş pHMM’lerin bir kombinasyonunu kullanarak her yol için saptama kuralları oluşturduk, böylece kuralları daha hedefli ve sağlam hale getirdik. Aynı zamanda, MGC koleksiyonunu analiz ederken, ortak olarak çekirdek alanlardan en az birinin varlığına sahip olan ancak ilişkili bir işlevi olmayan (bazıları açıklanmıştır) ilginç gen kümesi mimarileri bulduk. Burada ayrı bir kağıtta). Bunlar, yeni yollar ve/veya metabolitler için yeni bir kaynağı temsil edebileceğinden, bu ilginç MGC’leri de yakalayabilmek için başka bir varsayılan saptama kuralları seti oluşturduk. Tam zamanında, yine Stanford Üniversitesi’nden Dylan Dodd, anaerobik metabolizma konusundaki geniş bilgi birikimiyle ekibe katıldı ve tespit kuralları dizisinin tamamlanmasına ve doğrulanmasına yardımcı oldu.

Bilinen bir dizi metabolik gen kümesine dayanarak, bu gen kümesiyle kodlanmış yollarda spesifik olarak bulunan çekirdek enzim alanlarını belirledik. Bu gen kümelerinde ve aynı zamanda başka bağlamlarda meydana gelen geniş enzim aileleri için, belirli bir gen kümesi tipine özgü kuşakları tanımlamak için, hangi sınıfa özgü pHMM’lerin oluşturulduğuna bağlı olarak protein ailesi filogenileri oluşturulmuştur. Metabolik gen kümelerini spesifik olarak tanımlamak için genel pHMM’lerin ve sınıfa özgü pHMM’lerin kombinasyonları kullanıldı.

Önceki deneyimlere dayanarak, bu tür tahminlerin performansını doğrulamanın zorlu bir görev olduğunu zaten biliyorduk. Her şeyden önce, mikropların metabolik kapasitelerinin derin bir şekilde anlaşılmasını ve ikinci olarak, taksonomik olarak çeşitli bakterilerin geniş bir yelpazesinde bu yolların varlığının/yokluğunun doğrulanması kapasitesi anlamına gelir. Gerçekçi olarak, tahminlerimizi doğrulamak için birden fazla analiz gerçekleştirdik: (1) gutSMASH’ı bir dizi referans genom üzerinde çalıştırdık ve her kural tarafından ayrı ayrı tahmin edilen MGC’leri manuel olarak analiz ettik. (2) Bir sorgu olarak anahtar proteinin dizisini kullanarak bir paperBLAST aramasıyla elde edilen genomu girdi olarak kullanarak belirli bir yolu tahmin edip edemeyeceğimizi kontrol ettik ve (3) bir avuç metabolik olarak karakterize edilmiş ve iyi bilinen gutSMASH’ı çalıştırdık. genomlar ve bildirilen yolların başarılı bir şekilde tahmin edilip edilmediğini (ve tam tersi) kontrol etti.

Tespit kuralları oluşturulduktan ve doğrulandıktan sonra, araç aynı zamanda yeni tahminlerin ihtiyaçlarını karşılayacak şekilde uyarlandı. Bu, yeni veritabanları, yeni gen fonksiyonel ek açıklamaları ve kod yeniden düzenleme oluşturmayı ima etti. Neyse ki, herhangi bir teknik soru için Danimarka Teknik Üniversitesi’nden Simon Shaw ve Kai Blin’e (mevcut antiSMASH destekçileri) ulaşabildik. Buna paralel olarak, insan bağırsağında yaşayan en temsili cinslerin metabolik kapasitelerini keşfetmeye karar verdik. Bu nedenle, bu ekosistemdeki çeşitliliklerini ve temsillerini hesaba katmak için HMP (İnsan Mikrobiyom Projesi) ve CGR (Kültürel Genom Referansı) olmak üzere iki koleksiyonun genomlarını ve ek bir Clostridiales setini derledik. gutSMASH’ı sunmanın yanı sıra, insan bağırsağında “kimin ne yaptığı” açısından tam resmi elde etmek istedik. Bu nedenle, projenin ilerleyen kısımlarında, bağırsakta dolaşan özelleşmiş metabolit havuzuna katkıda bulunduğu bilinen birkaç tek protein yolunun dağıtımını da dahil ettik.

gutSMASH web sunucusu (https://gutsmash.bioinformatics.nl/), kullanıcıların gutSMASH’ı kendi verileri üzerinde çalıştırmasına izin verir ve yorumlamayı kolaylaştıran görselleştirilmiş çıktılar sağlar.

Artık gutSMASH’ı tamamen geliştirdik (artık bir web sunucusu aracılığıyla da mevcut: https://gutsmash.bioinformatics.nl/) ve sistematik olarak bağırsak mikrobiyom metabolizmasının profilini çıkararak 4.240 yüksek kaliteli mikrobiyal genomda 19.890 gen kümesini tanımladık. Yine de, bu yolların bir insan popülasyonundaki temsilini değerlendirmenin ilginç olacağına inandık. Lifelines Deep (LLD) Kohort örneklerinin (metagenomik ve metabolomik) ideal olduğunu düşündüğümüz için bu görev için Groningen Üniversitesi’nden Jingyuan Fu ile birlikte çalıştık. Bu noktada, ortak geliştiren Hannah Augustijn BiG-MAP (mikrobiyomlarda metabolik gen kümesi bolluğunu ve ekspresyonunu profillemek için otomatik bir boru hattı) grubumuzdaki yüksek lisans tezi sırasında ekibe katıldı. Jingyuan Fu grubunun bir üyesi olarak, hem LLD verilerine hem de yöntemlere aşinaydı ve gutSMASH tarafından tahmin edilen yolların her birinin yaygınlığını ve bolluğunu hesaplamakla görevlendirildi.

LifeLines DEEP kohortunda 1135 insan denekte popülasyon düzeyinde yol bolluğu çeşitliliği. Çeşitli yollar için, farklı insanlar arasında 100 kattan fazla fark vardır.

Tamamlayıcı olarak, o sırada Jingyuan Fu’da doktora öğrencisi olan Lianmin Chen, yolların bolluğu ile metabolomik veriler arasındaki ilişkiyi analiz etti. Sonuçlar netti ve MGC bolluğu ile son ürünü arasında çok az veya hiç korelasyon olmadığını gösterdi. Bu korelasyon eksikliğinin, gen transkripsiyonunu etkileyen karmaşık düzenleyici süreçlerden kaynaklanabileceğini varsaydık. Bununla birlikte, metabolitler plazmadan ekstrakte edildiğinden, doğrudan dışkıdan ölçüldüğünde sonuçların farklı olma olasılığını göz ardı edemedik. Makalenin revizyonu sırasında başka bir soru ortaya çıktı: Genomik içerik ile son ürün arasındaki ilişki 1:1 olmasa da, yol ifadesi metabolit konsantrasyonları ile ilişkili midir? Bunu temizlemek için iHMP’yi analiz ettik (eşleştirilmiş metagenomik, metatranskriptomik ve metabolomik içeren bütünleştirici İnsan Mikrobiyom Projesi) veriler aynı şekilde. Metatranskriptomik ve metabolomik veriler arasında daha güçlü korelasyonlar bulabiliriz. Bununla birlikte, yola bağlı olarak çok değiştiği görüldü. Bu sonuçların gösterdiği gibi, tek başına metagenomik veya metatranskriptomik verilerden metabolik çıktıları tahmin etmek çoğu zaman gerçeğin doğru bir temsili olmayabilir.

iHMP projesinden metagenomik (kırmızı, yeşil) ve metatranskriptomik (sarı) veriler genelinde metabolit bolluğu ve gen kümesi transkript seviyeleri arasındaki korelasyon (yokluğu) örnekleri.

Uzun yıllar süren çalışmanın ardından bu projeyi başarılı bir şekilde sonlandıran ortak çabayı nihayet vurgulamak istiyorum. Yolculuk boyunca bize yardımcı olan herkese teşekkür ediyorum ve insan mikrobiyomu ve sağlıktaki rolü gibi karmaşık ve çok disiplinli sorunların üstesinden gelmek için güçlerimizi birleştirmeleri ve uzmanlıkları birleştirmeleri için topluluğa bir çağrı yapma fırsatını değerlendiriyoruz.

gutSMASH için kaynak kodu mevcuttur Burada.

gutSMASH’ı web sunucusu üzerinden çalıştırabilirsiniz. Burada.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir