Otázka:
Přepíná Picard markduplicate duplikát PCR samflag
svural
2017-10-27 19:49:30 UTC
view on stackexchange narkive permalink

Mám bam soubor RNA-seq a existuje jen málo čtení, které mě zaráží.

Podle záhlaví bam je tento bam soubor seřazen podle souřadnic, vytvořen pomocí tophat a krok markduplicate není Hotovo. Ale některá čtení jsou označena jako duplicitní v samflag. Horší je, když spustím picard markduplicate, přepne se tento příznak duplikátu PCR těchto značek, což je ne duplikát. Také jsem ručně našel duplikát tohoto čtení (identické čtení se stejnými počátečními pozicemi a počátečními kamarády), takže počáteční označení vypadá pravdivě.

Takže moje otázky jsou:

Nějaký nápad, proč by to se stalo?

Znamená to, že značka Tophat je duplicitní? (Nemyslím si) A přepíná picard markduplicate duplicitní příznak, pokud jsou čtení již označena jako duplikáty?

Zde je způsob, jak čtení vypadá před a po značce duplicitní krok.

Před:

  C0RTF 1187 17 7579880 255 61M10754N40M = 7579927 10902 CTC ... 0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC .. . 

Po Markduplicate:

  C0RTF 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC ... 0UNP1 163 17 7579880 255 61M10754N40M = 7579927 10902 CTC .. .  
> A picard markduplicate přepíná duplicitní příznak, pokud jsou čtení již označena jako duplikáty? ano: https://github.com/broadinstitute/picard/blob/master/src/main/java/picard/sam/markduplicates/MarkDuplicates.java#L342
@Pierre Neznám žádnou Javu, ale vypadá to, že zruší duplicitní příznak, pokud je hodnota `isDuplicate` falešná. Ne, pokud je to již pravda. Uniká mi něco?
@terdon:, pokud je to duplikát, je nastaven příznak https://github.com/broadinstitute/picard/blob/master/src/main/java/picard/sam/markduplicates/MarkDuplicates.java#L330, jinak je nenastaveno https: // github.com/broadinstitute/picard/blob/master/src/main/java/picard/sam/markduplicates/MarkDuplicates.java#L342
@Pierre ano, přesně tak. Pokud správně rozumím, OP má soubor s již nastavenými duplicitními příznaky, ale při průchodu markDuplicates jsou nyní nastavené příznaky přepnuty: nejsou nastaveny, takže již nejsou označeny jako duplikáty. Zobrazený kód by naznačoval, že pokud je příznak již nastaven, nic se nezmění. Pokud program Picard nečte příznaky a pouze provede vlastní výpočty k určení dupů a v tomto případě nesouhlasí s tím, co produkovalo původní označení.
Jeden odpovědět:
Devon Ryan
2017-10-31 01:15:42 UTC
view on stackexchange narkive permalink

Ano, pokud MarkDuplicates narazí na pár, který je označen jako duplikát, který považuje (z jakéhokoli důvodu) za duplikát, deaktivuje duplicitní značku. Můžete to otestovat sami vytvořením malého souboru BAM s duplicitními položkami nebo bez nich, ale některé jsou označeny bez ohledu na to. V případě skutečných duplikátů bude zachován duplicitní příznak. V případě, že neexistují žádné skutečné duplikáty, bude příznak odstraněn. Alespoň tak je tomu ve verzi 2.14.



Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 3.0, pod kterou je distribuován.
Loading...