NGS Verilerinden Transposable Eleman Eklemelerini Algılama

Genellikle “sıçrayan genler” olarak adlandırılan yer değiştirebilen elementler, dizilerinin kopyalarını genom içindeki farklı konumlara yerleştirme konusunda dikkate değer bir yeteneğe sahiptir.

Yeni nesil dizileme (NGS) ile bir organizmanın tam genomik dizisinin elde edilmesi rutin hale geldi. Bu, aynı zamanda, bu dizi verilerini kullanarak, yeri değiştirilebilen öğelerin genom içinde nasıl hareket ettiğini izleyebilmemiz gerektiği anlamına gelir.

Ancak NGS, her biri yalnızca birkaç yüz baz uzunluğunda, devasa bir yapboz gibi milyonlarca ila milyarlarca kısa okuma üretir. Bu parçalardan sürekli kromozom dizilerinin yeniden oluşturulması kapsamlı hesaplama gerektirir.

Yeri değiştirilebilen elemanların varlığı bu süreci karmaşıklaştırır. Okuma uzunluğundan daha uzun öğeler genom boyunca dağıldığında, birleştirme algoritmaları sıklıkla birden fazla olası çözüm üretir ve bu da doğru çözümün belirlenmesini zorlaştırır.

Uzun süreli okuma sıralama teknolojileri bu sorunu çözebilir, ancak yalnızca kısa süreli okuma verileriyle bu sorun olmaya devam ediyor. Üstelik hedef transpozonun özdeş kopyaları genom boyunca dağılmış olduğundan, basit benzerlik araştırmaları, elementin nereye ve nasıl hareket ettiğini güvenilir bir şekilde ortaya çıkaramaz.

Bu sorun üzerinde günlerce düşündükten sonra, aktarım sırasında oluşturulan hedef site çoğaltmasının (TSD) önemli bir gösterge olabileceğini fark ettim.

Schematic presentation of insertion of Tos17 and TSD and principal of TIF algorithm — **Şekil 1. Yerleştirmenin şematik gösterimi** ***Tos17*** **ve TSD ve TIF algoritmasının prensibi**

Şekil 1A, aşağıdakilerle ilişkili TSD'yi göstermektedir: Tos17 O zamanlar odak noktam olan retrotranspozon. Ne zaman Tos17 ekler, yukarı ve aşağı uçlarının yanında 5 bazlı bir kopya belirir.

5' ve 3' uçlarını içeren kısa okumaları çıkararak Tos17 ve kaldırılması Tos17 dizinin kendisi, bitişik dizileri topladım (Şekil 1B). İki dizi uçlarında aynı 5 bazlı motifi paylaştığında, bir çift oluştururlar; Tos17.

Bir referans genomu mevcutsa, bu eşleştirilmiş diziler, yerleştirme bölgelerini tanımlamak için doğrudan haritalandırılabilir. Bir referans olmasa bile, eşleştirilmiş dizilerin kendileri, Tos17 ve işaretleyici olarak kullanılabilir.

Yaklaşım basittir: transpozon terminalleri için kısa okumaları arayın ve bitişik dizileri eşleştirin. Bu hafif bir programla uygulanabilir.

Perl'de 50'den az satır kod içeren bir prototip geliştirdim. Yalnızca temel aramalara ve az sayıda diziyi eşleştirmeye dayandığından, bunun NGS verilerini analiz etmek için en küçük ve en hızlı programlardan biri olduğuna inanıyorum.

İndirip denemekten çekinmeyin:
https://github.com/akiomiyao/tif

Referans
Nakagome, M., Solovieva, E., Takahashi, A. ve diğerleri. Transposon Insertion Finder (TIF): yeri değiştirilebilen elemanların de novo transpozisyonlarının tespiti için yeni bir program. BMC Biyoinformatik 15, 71 (2014). https://doi.org/10.1186/1471-2105-15-71

NGS Verilerinden Transposable Eleman Eklemelerini Algılama

Yorumlar

Bir yanıt yazın Yanıtı iptal et