Pro počítání přečtení používám mpileup, např. samtools mpileup --reference hg38.fa -r Chr10: 18000-45500 input.bam
, které poskytnou pokrytí základního rozlišení pro soubor BAM.
Napsal jsem můj vlastní skript pro zpracování výstupu mpileup a pro snazší pochopení. Ve výchozím nastavení hlásí pokrytí čtení jako podíl na celkovém pokrytí, ale toto lze upravit pomocí argumentu příkazového řádku -counts
:
$ samtools mpileup -r tig00018708_tig00000379 : 210665-240664: 2107-2130 --reference trimMmerged_tig00018708_other.fasta local_Sampled_50M_vs_trimMmerged_tig00018708_other.bam | /bioinf/scripts/readstomper.pl -counts
[mpileup] 1 vzorků v 1 vstupních souborech<mpileup> Nastavit maximální hloubku na soubor na 8000Assembly, Position, Coverage, ref, cR, pR, A, C, G, T, d, i, InsModetig00018708_tig00000379: 210665-240664,2107,10, C, 10,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2108,11, G, 11,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2109,11, T, 11,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2110, 11, T, 11,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2111,12, G, 12,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664, 2112,14, G, 14,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2113,13, C, 13,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665- 240664,2114,13, G, 13,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2115,13, C, 2,0,15,0,0,0,11,0,0tig00018708_tig00000379: 210665-240664,2116,15, T, 14,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2117,15, G, 14,1,00,0,0,0,0,0, 0tig00018708_tig00000379: 210665-240664,2118,18, A, 1 7,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2119,19, T, 18,1,00,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2120,19, C, 18,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2121,18, A, 7,0,41,0,0,10,0,0,0tig00018708_tig00000379: 210665-240664,2122, 18, G, 18,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2123,18, T, 18,1,00,0,0,0,0,0,0
tig00018708_tig00000379: 210665-240664,2124,18, C, 18,1,00,0,0,0,0,0,0tig00018708_tig00000379: 210665-240664,2125,18, C, 9,0,50,0,0,0,9, 0,0tig00018708_tig00000379: 210665-240664,2126,18, C, 14,0,78,2,0,1,1,0,0tig00018708_tig00000379: 210665-240664,2127,18, C, 18,1,00,0,0,0, 0,0,0tig00018708_tig00000379: 210665-240664,2128,18, T, 15,0,83,0,0,3,0,0tig00018708_tig00000379: 210665-240664,2129,17, A, 13,0,76,0,0, 4,0,0,0tig00018708_tig00000379: 210665-240664,2130,16, A, 9,0,56,0,6,1,0,0,0
Upozorňujeme, že pouze nereferenční pokrytí se uvádí ve sloupcích A / C / G / T / d / i. Zjistil jsem, že to usnadňuje následnou analýzu dat, ale váš počet kilometrů se může lišit.