Mutasyondan peptide: Mopepgen ile proteom karmaşıklığının çözülmesi

Proteogenomik, gen ekspresyonunu incelememizi değiştiriyor. DNA ve RNA'dan bilgiyi hücrelerde üretilen proteinlere bağlar. Genomik, transkriptomik ve proteomikleri entegre ederek, araştırmacılar artık gen ekspresyonunu iki farklı seviyede araştırabilirler: üretilen proteinlerin miktarı ve genomik ve transkriptomik varyasyon ile şekillendirilen bu proteinlerin dizi çeşitliliği. Bu son boyut, gen ekspresyonunun mutasyonlar, alternatif ekleme, füzyon olayları ve çok çeşitli RNA seviyesi değişiklikleri ile çarpıtıldığı kanserde özellikle önemlidir. Proteogenomik, yeni kanser alt tiplerinin belirlenmesine, hasta tabakalaşmasını iyileştirmeye ve terapötik hedefleri keşfetmeye zaten yardımcı olmuştur. Ancak başarılarıyla bile, insan proteomunun çoğu gizli kalır.

Birincil neden, kütle spektrometri bazlı proteomiklerin veritabanı arama stratejilerine güvenmesinde yatmaktadır. Çoğu iş akışı, numuneye özgü genomik ve transkriptomik varyantları hariç tutan referans protein veritabanlarına karşı spektral verileri sorgular. Sonuç olarak, somatik mutasyonlar, anormal birleştirme, kanonik olmayan açık okuma çerçeveleri ve diğer transkriptomik değişikliklerden kaynaklanan peptitler sıklıkla kaçırılır.

Doğal bir çözüm, numuneye özgü varyantları arama alanına dahil etmek olacaktır. Bununla birlikte, bu hesaplama ve biyolojik bir zorluk sunar: bir gen içindeki tüm olası varyant kombinasyonlarının kapsamlı bir şekilde numaralandırılması, potansiyel dizilerin üstel patlaması nedeniyle hızla mümkün değildir. Mevcut araçların çoğu, odağını tek varyant tipleriyle sınırlar veya birden fazla varyantın aynı transkript üzerinde birlikte ortaya çıkmadığını varsayar. Bu varsayım biyolojik olarak gerçekçi değildir. Uygulamada, transkriptler genellikle SNV'ler, indeller, ekleme varyantları ve diğer transkriptomik varyasyonların kombinasyonlarını taşır. Bu kombinasyonları göz ardı etmek, kanonik olmayan peptitleri tespit etme yeteneğimizi ciddi şekilde sınırlar ve proteom hakkındaki anlayışımızı kısıtlar.

Bu şekil, Mopepgen'in SNV'ler, indeller, RNA düzenleme, alternatif ekleme, gen füzyonları, dairesel RNA'lar dahil olmak üzere çeşitli genomik ve transkriptomik varyant tiplerini tam gen ekspresyon çeşitliliğini modellemek için bir grafik gösterimine nasıl entegre ettiğini göstermektedir. Mopepgen, varyant kombinasyonlarını amino asit sekanslarına çevirerek, kütle spektrometri verilerinden kanonik olmayan peptitlerin aşağı akış tanımlanmasını ve nicelleştirilmesini sağlar.

Varyanttan peptide: Mopepgen kapsamlı ve ölçeklenebilir proteogenomik analiz sağlar.

Bu boşluğu ele almak için, bireysel bir numunede gözlenen varyant kombinasyonlarının tam spektrumunu yansıtan kapsamlı peptit veritabanları oluşturan grafik tabanlı bir algoritma olan Mopepgen'i geliştirdik. Mopepgen transkript merkezli bir yaklaşım alır: Tespit edilen tüm genomik ve transkriptomik varyantlar, transkript başına tek yönlü bir asiklik grafiğe entegre edilir. Çeviri ve Silico'da Sindirim daha sonra doğrudan grafik üzerinde gerçekleştirilir.

Bu strateji önemli hesaplama ve biyolojik avantajlar sunar. Grafik temsili fazlalığı azaltır, birlikte ortaya çıkan varyantların bağlamını korur ve varyant sayısına doğrusal çalışma zamanı ölçeklenebilirliğini destekler. Mopepgen, ikameler, indeller, alternatif birleştirme, gen füzyonları, RNA düzenleme ve dairesel RNA'lar gibi çok çeşitli değişiklikleri sistematik olarak modeller. Benchmarking, mopepanın yaklaşık dört kat daha fazla kanonik olmayan peptitleri öngördüğünü ve önceki yöntemlere kıyasla yaklaşık iki kat daha fazla tanımladığını göstermektedir.

Farklı veri kümeleri ve biyolojik sistemlerde mopepgen gösterdik. İnsan kanseri hücre dizilerinde ve primer tümörlerde, geleneksel yöntemlerle yakalanmayan binlerce kanonik olmayan peptitin saptanmasını sağladı. Fare proteomunda, not edilmemiş yeni çeviri ürünlerini başarıyla kurtardı. MOPEPGEN, hem veriye bağlı (DDA) hem de veriye bağlı (DIA) edinim ile uyumludur ve genomik, transkriptomik ve proteomik verileri birleştiren çok omik boru hatlarına sorunsuz bir şekilde entegre edilebilir.

Bu araç pratik kullanım için tasarlanmıştır. Çıktı dosyaları için doğrudan yukarı akış varyant çağırma algoritmalarından yerel desteğe sahiptir ve kanonik olmayan veritabanları hızla üretir. Modüler mimarisi, varyant tiplerinde ve bunları tespit etmek için kullanılan algoritmalarda esnekliği sağlar. Mopepgen tamamen açık kaynaklıdır, iyice belgelenmiştir ve varyant peptit çağrısının doğruluğunu ve sağlamlığını sağlayan kapsamlı bir birim testleri ve Fuzz testleri ile desteklenir.

Mopepgen, proteogenomikte kritik bir boşluğu kapatmak için geliştirilmiştir. Biyolojik karmaşıklığı hesaplamalı kısıtlamaları karşılamak için basitleştirmek yerine, biyolojik gerçekliği barındıran bir algoritma oluşturduk. Mopepgen'in araştırmacıları proteomun gizli katmanlarını daha fazla çözünürlük ve biyolojik sadakatle keşfetmelerini sağlayacağını öngörüyoruz.


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir