birden fazla teknik sorunun araştırılması için kapsamlı bir proteomik kaynak

Proteomik verilerindeki çok sayıda teknik sorun

Kütle spektrometresi (MS) tabanlı proteomik, fenotip korelasyonu ve karakterizasyonu alanlarında biyomedikal araştırmalar için önemli uygulamalara sahiptir.1biyobelirteç ve ilaç keşfi2,3ve terapötikler4. Güçlü olmasına rağmen proteomik verilerin üretilmesi, kullanılması ve incelenmesi zordur. Pratikte proteomik tek bir teknoloji değildir, birçok farklı türde ve platformda mevcuttur. Örneğin, proteomikler farklı veri toplama modları, örneğin veriye bağlı edinim (DDA) ve çeşitli sıvı kromatografi (LC) sistemleri ve niceliklendirme stratejileri (örneğin etiketli ve sayısallaştırma stratejileri) ile birleştirilmiş daha yeni veriden bağımsız edinim (DIA) yoluyla takip edilebilir. etiketsiz). Bu çeşitlilik, platformlar arası veri entegrasyonu açısından zorluklar yaratıyor5. Proteinlerin çoğaltılamayan doğası ve cihaz çözünürlük sınırları, özellikle az miktardaki proteinler arasında eksik değerlere yol açar6. Üstelik cihaz çıktısı sorunları, numunelerin sıklıkla çeşitli makineler ve laboratuvarlarda gruplanması gerektiği anlamına geliyor. Bu, “toplu etkiler” olarak bilinen zorlu teknik önyargılara neden olabilir7–9. Son çalışmalar, bu sorunlar arasında, yani eksik değer atama (MVI) ile toplu etki düzeltme (BEC) arasında karşılıklı bağımlılık ve etkileşimler olduğunu göstermiştir.10. Bu sorunlar gerçek biyolojik sinyalleri karıştırabilir, aşağı yönlü istatistiksel analizin güvenilirliğini azaltabilir ve araştırma sonuçlarının tekrarlanamazlığına yol açabilir.5,6,8.

Altın kıyaslama veri kümeleri hayati önem taşıyor ancak kıt

Yukarıdaki sorunlarla başa çıkmak için genel algoritmaları basitçe uygulamak veya benzer alanlardan yerleşik yöntemleri ödünç almak yeterli değildir. Platforma özel algoritmalar geliştirmek daha iyidir. Ancak bunu başarmak için algoritma geliştirme ve değerlendirmeye yönelik uygun kıyaslama veri kümelerine ihtiyacımız var.

Bununla birlikte, halka açık arşivlerde mevcut olan mevcut veri setleri, bu tür araştırmaların derinlemesine incelenmesi için uygun olmayabilir. İlk olarak, halka açık veri kümelerinin çoğu, kıyaslama yerine spesifik araştırma sorusunu yanıtlamak için orijinal olarak tasarlandı veya tasarlandı; bu, bu veri kümelerinin çoğunlukla hastalar veya fareler gibi farklı bireylerden alınan biyolojik kopyalardan oluştuğu ve gerekenden daha yüksek heterojenliğe yol açtığı anlamına geliyor.7,11.

Bir diğer önemli sınırlama, platformlar arası veri kümelerinin eksikliğidir. Çoğu klinik proteomik veri seti yalnızca tek bir platform aracılığıyla elde edilmiştir ve platformun birlikte çalışabilirliğini, veri dönüşümünü ve entegrasyonunu anlamak veya platforma özgü teknik önyargıları modellemek amacıyla proteomik platformlar arasında araştırma yapmak, karşılaştırmak ve entegre etmek için kullanılamaz.

Son olarak, hassasiyet, kapsam ve tekrarlanabilirlik konularında önemli kazanımlar sağlamak üzere geliştirilen PASEF (Paralel Biriktirme-Seri Parçalama) gibi gelecek vaat eden yeni teknolojilerden elde edilen kıyaslama veri kümelerinin eksikliği bulunmaktadır.12.

MultiPro: birden fazla teknik sorunun araştırılması için kapsamlı bir proteomik kaynak

MultiPro’yu (Çok Amaçlı Proteom Kaynağı) sunuyoruz13Kasıtlı tasarıma sahip dört kapsamlı büyük ölçekli proteomik veri kümesinden oluşan bir paketten oluşur. Numuneler DDA-PASEF’te üretildi14 veya diaPASEF15 standart veri işleme iş akışlarını kullanan mod16. MultiPro, iyi karakterize edilmiş hücre hatlarına (A549’a karşı K562 veya HCC1806’ya karşı HS578T) dayanan dengeli iki sınıflı bir tasarım içerir; iki farklı MS cihazı ve her veri setinde toplam 48 veya 36 biyolojik ve teknik kopya kullanılarak oluşturulan kontrollü toplu etkiler (Şekil 1).

Şekil 1: MultiPro’nun deneysel tasarımı. (a) A549/K562 deney tasarımı. (b) HCC1806/HS578T deney tasarımı. Bu rakam orijinal makaleden uyarlanmıştır13 (https://www.nature.com/articles/s41597-023-02779-8).

MultiPro kullanmanın faydaları

Geniş kapsamlı ve hassas proteom tanımlama ve miktarının belirlenmesi

Bilinçli deneysel tasarım ve standart veri oluşturma hattıyla MultiPro, yalnızca örnek başına tanımlama ve miktar belirlemeye yönelik bütünsel ve sağlam bir görünüm sunmakla kalmaz, aynı zamanda teknik kopyalar arasında kararlılık sağlarken örnekler arasındaki önemli farklılıkları da vurgular.

Eksik model, edinme yöntemine, sınıfa ve partiye göre farklılık gösterir

Farklı MS yöntemleri, sınıfları ve gruplarından çeşitli eksik yapılar ve mekanizmalar MultiPro’da oluşturulmuştur; bu, MultiPro’yu eksik değer sorunlarını araştırmak için uygun bir kaynak haline getirir ve özellikle eksik değerler toplu veya sınıf etkileriyle etkileşime girdiğinde MVI yöntemlerinin performansını değerlendirmek için yararlı senaryolar sağlar. (Şekil 2).

Şekil 2: MultiPro’nun çeşitli eksik modelleri. (a) Sınıf ve partiye göre kategorize edilen numunelerin eksik oranlarını temsil eden keman grafikleri. (b) Ortalama log2 yoğunluğuna göre sıralanan eksik protein oranlarını gösteren dağılım grafikleri. (c) Eksik yapıları ve kalıpları gösteren ısı haritaları. Bu rakam orijinal makaleden uyarlanmıştır13 (https://www.nature.com/articles/s41597-023-02779-8).

Sınıf, toplu iş ve satın alma modundan karma efektler

Ayrıca, görsel ve kantitatif biyoenformatik araçları kullanılarak, sınıf, parti ve satın alma yönteminden gelen karma etkiler MultiPro aracılığıyla gösterilebilir ve araştırılabilir; bu, daha güçlü toplu etki düzeltme algoritmalarının geliştirilmesine ve değerlendirilmesine yardımcı olur. (Figür 3).

Şekil 3: MultiPro’nun toplu efekt gösterimi. (a) Örneklerin ortalama yoğunluklarını gösteren dağılım grafikleri. (b) Temel Bileşen Analizi görselleştirmesi. (c) Temel Varyans Bileşen Analizi. Bu rakam orijinal makaleden uyarlanmıştır13 (https://www.nature.com/articles/s41597-023-02779-8).

MultiPro için kullanım örnekleri

  1. MultiPro’nun kapsamlı tasarımı, yalnızca platformlar arası veri entegrasyonu, eksik değer atama, toplu etkilerin düzeltilmesi ve bunların ara bağlantıları dahil olmak üzere çok sayıda teknik sorunun araştırılmasına olanak sağlamakla kalmaz, aynı zamanda biyoinformatik algoritmaların geliştirilmesine ve karşılaştırılmasına da olanak tanır.
  2. Numune başına doğrudan DDA-PASEF ve diaPASEF eşleşmeleri, tahmin edilen eksik proteinlerin/değerlerin anlamlı şekilde doğrulanmasına olanak tanır. Bu eşleştirmeler, verileri bir platform türünden diğerine dönüştürmek için üretken yapay zeka modelini kullanmaya çalışırken doğrulama olarak da faydalıdır; gelişmiş uygulamaların platformlar arası birlikte çalışabilirliği iyileştirmesine ve veri entegrasyonunu kolaylaştırmasına olanak tanır.
  3. Mevcut toplu faktörler göz önüne alındığında, araştırmacılar BEC algoritmalarını geri dönen diferansiyel proteinlerin tutarlılığı veya grup/sınıf çiftleri arasındaki sonuçların tutarlılığı açısından da değerlendirebilirler.
  4. MultiPro yayınlanmış diğer veri kümeleriyle etkileşime girebilir17,18 bu aynı zamanda bizimkiyle aynı hücre dizilerini (A549, K562, HCC1806 ve HS578T) ölçtü ancak farklı türdeki parti etkilerini taklit etmek için çeşitli zaman dilimlerinde farklı veri oluşturma paradigmaları kullandı (örneğin, aynı cihaz ancak farklı günler, farklı laboratuvarlardaki cihazlar, farklı LC sütunları) ve BEC algoritmalarını kapsamlı bir şekilde karşılaştırın.

Referanslar

  1. Jayavelu, AK ve ark. Akut miyeloid löseminin proteogenomik alt tipleri. Kanser hücresi 40301-317.e12 (2022).
  2. Niu, L. ve ark. Alkole bağlı karaciğer hastalığı için invaziv olmayan proteomik biyobelirteçler. Nat. Med. 281277–1287 (2022).
  3. Meissner, F., Geddes-McAlister, J., Mann, M. & Bantscheff, M. İlaç keşfinde kütle spektrometresi bazlı proteomiklerin ortaya çıkan rolü. Nat. Rev. İlaç Keşfi. 21637–654 (2022).
  4. Jiang, Y. ve ark. Proteomik, erken evre hepatoselüler karsinomun yeni terapötik hedeflerini tanımlar. Doğa 567257–261 (2019).
  5. Santos, A. ve ark. Klinik proteomik verilerini yorumlamaya yönelik bir bilgi grafiği. Nat. Biyoteknoloji. 40692–702 (2022).
  6. Kong, W., Hui, HWH, Peng, H. & Goh, WWB Proteomik verilerindeki eksik değerlerle ilgilenmek. PROTEOMİK 222200092 (2022).
  7. Čuklina, J. ve ark. Büyük ölçekli proteomik çalışmalarda toplu etkilerin teşhisi ve düzeltilmesi: bir eğitim. Mol. Sistem Biyol. 17e10240 (2021).
  8. Goh, WWB, Wang, W. ve Wong, L. Omics Verilerinde Toplu Etkiler Neden Önemlidir ve Bunlardan Nasıl Kaçınılır. Trendler Biyoteknoloji. 35498–507 (2017).
  9. Pırasa, JT ve ark. Yüksek verimli verilerde toplu etkilerin yaygın ve kritik etkisinin üstesinden gelinmesi. Nat. Rahip Genet. 11733–739 (2010).
  10. Hui, HWH, Kong, W., Peng, H. & Goh, WWB Eksik değer atamasında toplu duyarlılığın önemi. Bilim. Temsilci 133003 (2023).
  11. Sundararaman, N. ve ark. BIRCH: Aşağıdan Yukarıya Kütle Spektrometresi Tabanlı Proteomik Verilerinde Toplu Etkinin Değerlendirilmesi, Düzeltilmesi ve Görselleştirilmesi için Otomatik Bir İş Akışı. J. Proteome Res. 22471–481 (2023).
  12. Wang, H. ve ark. MultiPro: DDA-PASEF ve diaPASEF, kasıtlı toplu efektlerle hücre hattı proteomik veri kümelerini elde etti. Bilim. Veri 10858 (2023).
  13. Meier, F. ve ark. Yeni Bir Yakalanmış İyon Hareketli Kütle Spektrometresi ile Çevrimiçi Paralel Birikim-Seri Parçalanma (PASEF). Mol. Hücre. Proteomik MCP 172534–2545 (2018).
  14. Meier, F. ve ark. Paralel Biriktirme-Seri Parçalanma (PASEF): Sıkışan İyon Hareketliliği Cihazında Sıralama Hızını ve Hassasiyetini Senkronize Taramalarla Çarpma. J. Proteome Res. 145378–5387 (2015).
  15. Meier, F. ve ark. diaPASEF: veriden bağımsız edinim ile birleştirilmiş paralel birikim-seri parçalanma. Nat. Yöntemler 171229–1236 (2020).
  16. Cai, X. ve ark. Basınç döngüsü teknolojisini kullanarak yüksek verimli proteomik numune hazırlama. Nat. Protokol. 172307–2325 (2022).
  17. Gonçalves, E. ve ark. 949 insan hücre hattının pan-kanser proteomik haritası. Kanser hücresi 40835-849.e8 (2022).
  18. Güneş, R. ve ark. Meme Kanseri Hücre Hatlarının Proteomik Dinamiği Potansiyel Terapötik Protein Hedeflerini Tanımlar. Mol. Hücre. Proteomik 22(2023).

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir