Všechny platformy pro dlouhé čtení sekvencí jsou založeny na sekvenování jedné molekuly, což způsobuje vyšší míru chyb na bázi. Z tohoto důvodu byl do potrubí shromáždění genomu přidán krok leštění - mapování raw čte zpět na shromáždění a opravu podrobností shromáždění.
Mám slušný soubor dat PacBio RSII jediného individuálního genomu silně heterozygotních nemodelských druhů . Sestavení proběhlo dobře, ale když jsem se pokusil vyleštit sestavu pomocí toulce, nemohlo se to sblížit během několika iterací a vsadím se, že je to kvůli příliš velké odlišnosti haplotypů. Existuje nějaký jiný způsob, jak vyleštit genom s takovými vlastnostmi? Existuje například způsob, jak oddělit dlouhá čtení podle haplotypu, takže bych mohl vyleštit pouze pomocí jednoho haplotypu?