Otázka:
Poměry sestřihu vs. neřezané transkripty v datech RNA-seq
Jessime Kirk
2017-06-09 21:40:08 UTC
view on stackexchange narkive permalink

Existuje výpočetní nástroj pro měření, jaké procento RNA je spojeno v experimentu RNAseq?

Nezajímám se zvlášť o komplikované analýzy, které poskytují poměry pro všechny možné alternativní varianty sestřihu. Raději bych měl binární klasifikaci. Například: (RNA1 = 35% sestřih, 65% nesestříhaný)

Upravit: (Další informace)

Jsme velmi brzy v průzkumné fázi , takže se stále vytváří konkrétní hypotéza. Ale zajímá nás obsah sekvence lncRNA, z nichž mnohé jsou špatně spojeny. Chceme tedy získat představu o tom, jak převládající verze těchto transkriptů je bez rozložení.

Protože se jedná o předběžný průzkum, odhady a hluk jsou celkem přijatelné. Velmi základním přístupem může být výpočet poměru čtení, která mapují křižovatky exon-exon, oproti těm, které mapují z křižovatek exon-intro.

Pokročilejší přístup, o kterém také uvažuji, je losos.

Už jste se s něčím dohodli? Mám stejnou otázku jako vy.
Nakonec jsme použili zarovnání s STAR a poté kvantifikaci s lososem. Lososovi jsme dali všechny známé varianty spojení, včetně nekomplikované anotace. Poté jsme shrnuli všechny sestříhané izoformy, abychom získali „sestříhané vs. nesestříhané“. Tento kanál byl snadný, přesný a s výsledkem jsme byli opravdu spokojeni.
Dva odpovědi:
Ian Sudbery
2017-06-14 00:14:44 UTC
view on stackexchange narkive permalink

Nevím o nástrojích, ale použil jsem následující kód pythonu k výpočtu poměru čtení, která překrývají 5 'nebo 3' konce intronů nebo jsou spojeny. Shrneme je napříč všemi introny v genové sadě (toto skutečně použijeme pro analýzu iCLIP, abychom zjistili, zda proteiny vázající RNA váží pre-mRNA nebo sestříhanou RNA).

  import pysamfrom kolekce import Counterfrom CGAT import GTF, IOToolsdef countSplicingIndex (bamfile, gtffile, outfile): bamfile = pysam.AlignmentFile (bamfile) countts = Counter () pro přepis v GTF.transcript_iterator (GTF.iterator (IOTool.iterator (IOToolsdef)) gtffile))): introns = GTF.toIntronIntervals (přepis) pro intron v intronech: reads = bamfile.fetch (reference = transcript [0] .contig, start = intron [0], end = intron [1]) pro načtení čte: pokud 'N' v read.cigarstring: bloky = read.get_blocks () začíná, končí = zip (* bloky), pokud intron [0] končí a intron [1] začíná: počítá ["Exon_Exon"] + = 1 el e: count ["spliced_uncountted"] + = 1 elif (read.reference_start < = intron [0] - 3 a read.reference_end > = intron [0] + 3): pokud přepis [0] .strand == "+" : countts ["Exon_Intron"] + = 1 else: countts ["Intron_Exon"] + = 1 elif (read.reference_start < = intron [1] - 3 a read.reference_end > = intron [1] + 3): pokud přepis [0] .strand == "+": counts ["Intron_Exon"] + = 1 else: countts ["Exon_Intron"] + = 1 else: counts ["unspliced_uncountted"] + = 1 záhlaví = ["Exon_Exon", " Exon_Intron ",
"Intron_Exon", "spliced_uncounted", "unspliced_uncounted"] s IOTools.openFile (outfile, "w") jako outf: outf.write ("\ t" .join (záhlaví) + "\ n") outf.write (" \ t ".join (map (str, [počítá [col] pro sloupec v záhlaví])) +" \ n ")  

Bohužel toto používá spoustu knihoven, které můžete nebo můžete nemají, včetně CGAT (pro analyzátor GTF a balíček IOTools) a pysam.

Jakmile získáte tyto statistiky, můžete vypočítat „index sestřihu“ jako poměr log2, který je dvojnásobkem počtu sestřižených čtení děleno počtem čtení překrývajících 3 'a 5' konce intronů.

Daniel Standage
2017-06-09 21:48:34 UTC
view on stackexchange narkive permalink

Vezměte tento první komentář s rezervou, protože to není oblast, ve které jsem hodně pracoval, ale: je možná binární klasifikace? Pokud má gen 3 introny a 2 jsou spojeny, ale 1 je zachován, je to „spojeno“ nebo „nespojeno“. Můj první dojem je, že analýza by byla trochu jemnější než binární klasifikace.

To znamená, že vím o nástroji Keep Me Around pro analýzu retence intronů ( preprint, kód). Tento software jsem nikdy nepoužíval, ale vypadá to, že je aktivně udržován a byl vytvořen výzkumnou skupinou se spoustou zkušeností a vlivem v této oblasti, ať už stojí za to. :-)

UPDATE : Vypadá to, že původní příspěvek byl od odeslání odpovědi upraven, ale text o binární klasifikaci nechám pro potomky. :-)



Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 3.0, pod kterou je distribuován.
Loading...