scMoMaT, tek hücre mozaik entegrasyonunu ve çok modlu biyo-işaretleyici algılamayı ortaklaşa gerçekleştirir

Tek hücreli sıralama teknolojisi, organizmayı tek hücreli bir bakış açısıyla inceleyebilir. Bu tür teknolojinin ilerlemesiyle, araştırmacılar artık doku içindeki hücreleri birden fazla veri yönteminden ölçecek araçlara sahipler. scATAC-seq hücre içindeki kromatin erişilebilirliğini profillerken, scRNA-seq hücre içindeki gen ekspresyonunu profiller. Bir hücreden aynı anda iki veya daha fazla modaliteyi ölçen teknolojiler de vardır: CITE-seq ortaklaşa protein bolluğunu ve gen ifadesini ölçerken, SNARE-seq ortaklaşa gen ifadesini ve kromatin erişilebilirliğini ölçer. Bu tür çok modlu tek hücreli veri kümelerinin bolluğuyla, farklı yöntemleri entegre etmek ve bir doku içindeki hücre popülasyonunun bütünsel bir resmini oluşturmak için hesaplama zorlukları ortaya çıkıyor, bu aynı zamanda tek hücreli veri entegrasyonu zorluğu olarak da adlandırılıyor.

Son yıllarda, tek hücreli veri entegrasyonu toplulukta geniş çapta incelenmiştir. Zorluk, üç temel entegrasyon senaryosuna ayrılmıştır: yatay entegrasyon, dikey entegrasyon ve çapraz entegrasyon. Gerçek dünya entegrasyon senaryoları, mozaik entegrasyon olarak da adlandırılan üç entegrasyon senaryosunun karmaşık bir kombinasyonu olma eğilimindedir. Bununla birlikte, mevcut yöntemler, mozaik entegrasyon görevlerine genelleştirilmiş çok az yöntem ile, temel olarak üç temel durum üzerinde çalışmaktadır. Genelleme sorunundan motive olarak, matris üç faktörizasyonunu kullanan bir mozaik entegrasyon yöntemi olan scMoMaT’yi öneriyoruz. Çok partili çok modlu tek hücreli veri seti göz önüne alındığında, scMoMaT aynı anda birleştirilmiş bir hücre temsilini ve modaliteler arasında hücre tipine özgü biyo-belirteçleri öğrenebilir.

Şekil 1. scMoMaT’nin grafik gösterimi. A. Birden fazla tek hücreli veri matrisi verildiğinde, scMoMaT birleşik hücre faktörlerini ve biyo-belirteç tespiti için kullanılabilecek özellik faktörlerini öğrenir. B. scMoMaT, her veri matrisi için bunu hücre ve özellik faktörlerine, ilişkilendirme matrisine ve hücre ve özellik sapmalarına ayırdı.

Her bir tek hücreli veri matrisi için scMoMaT, bunu bir hücre faktörüne, bir özellik faktörüne ve bir ilişkilendirme matrisine fabrikalar. Birden çok veri matrisi sağlandığında scMoMaT, aynı hücreyi veya özellik kimliğini matrisler arasında aynı faktörü paylaşmaya zorlayarak matrisler arası ilişkiyi kodlar. Öğrenilen hücre faktörü, çapraz modalite bilgisini kodlar ve yığın etkisinden çıkarılır. Öte yandan öğrenilen özellik faktörleri, farklı hücre tipi kimliklerinin biyo-belirteçlerine karşılık gelen yüksek puanlı özellikler verir.

scMoMaT’nin performansını ve genelleştirme yeteneğini doğrulamak için scMoMaT’ı çeşitli gerçek dünya veri entegrasyon senaryolarında test ediyoruz. scMoMaT’yi 3 veri modalitesinden (kromatin erişilebilirliği, gen ekspresyonu ve protein bolluğu) ölçülen 4 grup hücre içeren bir insan PBMC veri setinde test ettik. Hücre faktörünün UMAP görselleştirmesi, scMoMaT’nin yığın etkisini başarıyla kaldırdığını ve hücre tipi kimlik bilgilerini tuttuğunu gösterir. Keşfedilen biyo-belirteç scMoMaT’yi kullanarak hücre türlerini ayrıca yeniden açıklıyoruz ve sonuç, orijinal veri kağıdında elde edilen açıklamaya kıyasla veri matrisleri arasında daha yüksek bir açıklama çözünürlüğü ve daha iyi açıklama tutarlılığı gösteriyor.

Şekil 2. scMoMaT’nin insan PBMC veri seti üzerindeki test sonuçları. A. Veri kümesindeki veri matrislerinin düzeni. M.Ö. Hücrelerin (b) orijinal veri kağıdındaki hücre tipine, (c) gruplara göre renklendirildiği hücre faktörlerinin UMAP görselleştirmesi. D. scMoMaT ek açıklamasının KNN anlaşma puanları, orijinal veri belgesindeki ek açıklamayla karşılaştırıldı. e. scMoMaT hücre tipi notu.

Fare beyin korteks veri seti, insan kemik iliği veri seti ve fare dalak veri seti üzerinde scMoMaT’yi ayrıca doğrularız. Ek olarak, scMoMaT’nin performansını kantitatif olarak ölçüyor ve simüle edilmiş veri kümelerinde diğer temel yöntemlerle karşılaştırıyoruz. Test veri kümeleri, çeşitli entegrasyon senaryolarını kapsar ve sonuç, diğer mevcut yöntemlere kıyasla scMoMaT’nin üstün performansını birlikte gösterir.

Giderek daha fazla çok modlu tek hücreli verinin mevcut olmasıyla, scMoMaT’nin çok modlu bilgiden yararlanmada ve hücre popülasyonunun birleşik bir görünümünü öğrenmede etkili bir araç haline geldiğini öngörüyoruz. Biyo-işaretleyiciyi hücre temsilini öğrenmeyle ortaklaşa tespit etmenin keşfi, aynı zamanda, entegrasyon görevlerinde çapraz modalite ilişkilerini ortaklaşa öğrenme ve hücre düzenleme mekanizmalarını anlama olasılığını da gösterir.

Tam metin şu adreste mevcuttur: https://www.nature.com/articles/s41467-023-36066-2

scMoMaT paketi şu adreste mevcuttur: https://github.com/PeterZZQ/scMoMaT

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir