Genetik ve epigenetik bazların eşzamanlı dizilimi için yeni bir yöntem

Hücreler, biyolojik bir sistemin çalışması için protein sentezi için gereken tüm genetik bilgileri içerir ve yüksek verimli DNA dizilemenin geliştirilmesi, hücresel süreçlerin aydınlatılmasında ve varyasyon ve mutasyonların kanser gibi hastalık durumlarında nasıl bir rol oynadığının anlaşılmasında anahtar olmuştur. Ancak, hücresel kaderi ve işlevi kontrol eden sadece genetik diziler değildir – epigenetik modifikasyonlar, davranış veya çevredeki değişikliklere yanıt olarak gen ifadesini düzenler ve hastalık kadar gelişme ve yaşlanma gibi birçok biyolojik süreçte de önemli bir rol oynar. Bir bireyin genetik sekansındaki varyasyon, hastalığa yatkınlığı işlevsel olarak belirleyebilen DNA metilasyonundaki varyasyonla ilişkilendirilecektir. Diğeri bağlamında hem genetik hem de epigenetik varyasyonun ölçülmesi, bu nedenle dinamik biyolojik süreçleri aydınlatmak için önemlidir ve hücresel işlevin daha kapsamlı bir görünümünü sağlar.

Kombine genetik ve epigenetik sıralamanın zorluğu

Bununla birlikte, hem genetik hem de epigenetik bilgiyi aynı anda yakalamak, mevcut sıralama teknolojisinin sınırlamaları nedeniyle önemli zorluklarla birlikte gelir. Yeni nesil dizileme teknolojileri, okumalarında yalnızca dört harfi veya bilgi durumunu yakalar; A, T, C ve G kanonik temelleri. Temel dönüştürme kimyaları, değiştirilmemiş C’yi en yaygın epigenetik varyantlarından, 5mC ve 5hmC’den ayırmak için kullanılabilir, ancak bu bilgi durumlarından birini (tipik olarak T durumu) feda etmek ve önemli genetik dizi bilgisini kaçırmak anlamına gelir.

4 bilgi durumundan daha fazla baz dizilirken belirsizlik geçerli olacaktır

C->T deaminasyonuna sahip protokoller arasında bisülfit sıralaması ve EMseq yer alır

Bu nedenle, bisülfit dizileme gibi baz dönüştürme kimyaları kullanılarak 5mC veya 5hmC’yi tanımlamaya bakıldığında, değiştirilmemiş C bazı U’ya dönüştürülür (ve bu nedenle T olarak okunur), bu nedenle genetik dizideki C-to-T değişikliklerinin saptanmasını tehlikeye atar. C-to-T değişiklikleri, memeli genomlarında ve kanserde açık ara en yaygın mutasyonlardır. 3 harfli okumalar 4 harfli bir genomla eşleştirildiğinden, baz dönüştürme ayrıca genomik hizalamada belirsizliğe neden olur, bu da daha yavaş, daha pahalı ve daha az doğru okuma eşlemesi ile sonuçlanır. Bugüne kadar, tek bir numuneden hem genetik hem de epigenetik bilgilerin sekanslanması, ayrı sekanslama iş akışları, artan numune gereksinimi ve faz bilgisinin kaybolduğu verilerin hatalı entegrasyonunu gerektiren önemli bir zaman ve maliyet yükü getirdi.

Gelişmiş biyolojik karakterizasyon için 5 Harfli sıralama

Kombine genetik ve epigenetik analizin bu zorluklarının üstesinden gelmek için, herhangi bir dizileme platformuyla uyumlu tek bir iş akışında dört kanonik bazın yanı sıra değiştirilmiş C’yi de yakalayabilen tam bir genom metodolojisi olan 5-Letter seq’i geliştirdik. Platformumuz, numuneyi dizilemeye hazırlamak için standart moleküler biyoloji tekniklerini kullanan bir ön dizileme enzimatik iş akışından ve ayrıca ham dizileme verilerini çözmek için kod çözme yazılımından oluşur. Bu çalışmada, bir Illumina NovaSeq NGS cihazı kullandık, ancak diğer dizileme adaptörleri ikame edilebilir, yani iş akışı en az dört genetik bazın kodunu çözebilen herhangi bir dizileme platformuyla kullanılabilir.

Kombinasyon sıralaması için iki tabanlı kodlama sistemi

Standart tek tabanlı dizileme, dört durumlu (veya dört harfli) bir okumayla sonuçlanır – burada, iki bazın kombinasyonunun orijinal DNA bazını gösterdiği ve 16 adede kadar bilgi durumunun kodunun çözülmesini sağlayan iki tabanlı bir kodlama yaklaşımı kullanıyoruz .

(Fiziksel olarak birleştirilmiş) DNA’nın iki şeridi boyunca okuma, 16 bilgi durumuna izin verir. A,C,G,T, mC, hmC ve hata bastırma için yeterli

Bunu başarmak için, zaten parçalanmış DNA veya sonikasyona tabi tutulmuş genomik DNA, dizilemeden önce basit bir iş akışında hazırlanır. İş akışı, numune DNA parçalarının her iki uçta da kısa, sentetik saç tokası adaptörlerine bağlanmasıyla başlar. Her iplikçik daha sonra DNA polimeraz tarafından kopyalanarak orijinal örnek iplikçik tamamlayıcı ipliğine sentetik bir saç tokası aracılığıyla bağlanan bir yapı oluşturur. Sekanslama adaptörleri her bir uçtan bağlanır ve modifiye edilmiş C’ler oksidasyon ve ardından glikosilasyon ile enzimatik olarak korunur – modifiye edilmemiş C’ler daha sonra bir APOBEC enzimi tarafından urasile deaminlenir. Bir helikaz, deaminasyon yapan APOBEC enzim aktivitesi için tek sarmallı bir DNA’ya erişim sağlar.

Makalede gösterilen veriler, sıralama öncesi iş akışımız ve sıralama sonrası yazılımımızla uyum içinde bir Illumina Novaseq kullanılarak üretildi.

Baz dönüştürülmüş DNA şablonu, PCR ile amplifiye edilebilir ve daha sonra dizileme için hazırdır. Biyoinformatik kod çözme yazılımımız daha sonra orijinal ve tamamlayıcı şeritlerin ikili hizalamasını gerçekleştirir (bir çiftte 1’i okuyun ve 2’yi okuyun) ve tek bir genetik veya epigenetik harfe karşılık gelen “izin verilen bir baz çifti” üreterek sıralama verilerini hesaplamalı olarak çözer. Sekanslama sırasında numune hazırlığı, amplifikasyon veya yanlış baz çağrısından kaynaklanan herhangi bir hata, her iplikçikteki aynı kökenli bazlarda bağımsız olarak meydana gelecek ve bu nedenle, doğal prova okuma yeteneği sağlayan “izin verilmeyen bir baz çifti” ile sonuçlanacaktır. İzin verilmeyen çiftler bir N olarak çözümlenir. Okumanın geri kalanı korunur ve çözümlenen okumaların genomik hizalaması standart 4-tabanlı alanda gerçekleşir. Epigenetik durumlar, SAM etiketlerindeki okumalarla tutulur.

Hem orijinal (okuma1) hem de kopyalama (okuma2) sarmalını okuyan çift uçlu okumalar, 16 durumlu kodu üretmek üzere çözümlenir. Bu kodda A,T=A; T,G=C; G,T=G; T,A=T, C,G=modC ve diğer tüm çiftler, bir N ile bastırılan hatalardır.

Karışık bir B-lenfoblast hücre hattı DNA’sında (şişedeki genom örneklerinden biri NA12878) 5-Harfli dizi gerçekleştirdik ve hem genetik hem de epigenetik verileri tek bir dizide oluşturduk. Okuma dizilerinde dört genetik durumun tümüne sahip olmak, standart genomik hizalamaya izin vererek, WGBS ve EM-seq ile karşılaştırıldığında yürütme sürelerini önemli ölçüde azaltır. Veri kalitesinin WGBS ve EM-seq ile karşılaştırılması, epigenetik işaretlerin tespiti için artan özgüllük ve hassasiyet ve okuma haritalamanın daha yüksek doğruluğunu gösterdi. Hem genetiğin hem de epigenetiğin eş zamanlı tespiti cis’te aynı DNA molekülü üzerinde, aleller arasındaki diferansiyel DNA metilasyonunu tespit etmemize de izin verdi. Allele özgü metilasyon (ASM) ve metilasyon kantitatif özellik lokusları (methQTL’ler), birçok hastalığın temelini oluşturan düzenleyici dizi varyasyonunu tanımlamak için kullanılabilir.

Sıvı biyopsi için düşük girdili numunelerde tespit

Tek bir DNA örneğinde hem genetik hem de epigenetik bilginin kombinasyonu, meydana gelen dinamik etkileşimler hakkında önemli bilgiler sağlayabilir ve hücresel kader çalışmaları, kök hücre farklılaşması, popülasyon genomiği ve kanser biyolojisi gibi birçok araştırma alanında önemli avantajlar sunar. Önemli bir ilgi alanı, tümör teşhisi ve hastalık takibi için likit biyopsidir. DNA metilasyon bilgisinin kandan alınan hücresiz DNA’daki (cfDNA) genetik sekansla birleştirilmesi, tümör DNA’sını saptamak için önemli ölçüde artan hassasiyet göstermiştir. Bir insan kanser hastasından alınan hücresiz bir DNA örneğine 5 Harfli dizi uyguladık ve yalnızca 2ng DNA içeren bir örnekte çok yüksek kaliteli dizileme verileri elde ettik. Bu, yöntemimizin aynı düşük girişli numuneden hem genetik hem de epigenetik verileri tespit edebildiğini ve bu nedenle teşhis için değerli ve düşük hacimli biyolojik numunelerle çalışmanın zorluklarının üstesinden gelebileceğini göstermektedir.

Gelecekteki gelişmeler

5hmC modifikasyonu, erken kanser tespiti dahil olmak üzere hastalık durumlarının bilinen bir belirtecidir. Platformumuzun iki tabanlı kodlama yapısı, platformu 6 Harfli diziyi kolaylaştırmak için daha fazla uyarlayabildiğimiz ve böylece 5mC ile 5hmC arasında ayrım yapabildiğimiz anlamına gelir. Sistemimiz ayrıca formilsitozin, metiladenin veya karboksisitozin gibi ek epigenetik modifikasyonları ölçme potansiyeline sahiptir.

5 Harfli dizinin, bisülfit dizileme veya EM-seq’ten daha hızlı ve daha doğru olan tek bir iş akışında doğru, aşamalı genetik ve epigenetik diziler sağlayabildiğini gösterdik. İş akışımız, hem genetiğin hem de epigenetiğin diğeri bağlamında çalışılmasına izin vererek, kullanım kolaylığı ve azaltılmış ek yük ile kapsamlı biyolojik içgörü sunar. 5 Harfli seq platformu, erken kanserin saptanması için cfDNA analizini ve likit biyopsiyi fizibil bir şekilde dönüştürebilen değerli, düşük girdili biyolojik numunelerden veya hücresiz DNA’dan doğru veriler üretmek için de kullanılabilir.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir