Příkaz samtools mpileup
má celkem pěknou vlastnost, že je schopen opravit chyby mapování spojené se špatným zarovnáním INDELů. Ve výchozím nastavení nebude příkaz mpileup
fungovat pro čtení, která mají více než 250násobné pokrytí referenčního genomu. I když lze tento limit zvýšit, velmi vysoké pokrytí způsobí, že se program mpileup zastaví, takže by bylo hezké vědět, jestli existuje nějaký snadný způsob, jak to zrychlit.
Chcete-li přidat trochu více V tomto kontextu jsem to dělal s čteními mitochondriálního genomu, které byly extrahovány jak z celogenomového sekvenování Illumina (pokrytí ~ 1000X), tak z cíleného amplikonového sekvenování provedeného na IonTorrent (pokrytí až ~ 4000X).
Vidím, že @rightskewed zmínil schopnost převzorkování samtoolů s samtools view -s <float>
(viz zde), což vypadá, že by to mohlo fungovat jako řešení pokud je použit před operací mpileup.