vytvoření grafu distribuce výbuchových zásahů na sledované sekvenci

bluescholar1212

2017-07-27 03:03:37 UTC

view on stackexchange narkive permalink

Pokouším se vizualizovat výsledky mého vyhledávání BLAST podobným způsobem jako grafické zobrazení distribuce vysokých zásahů z webu BLAST.

Například z mého vyhledávání BLAST:

kromě toho, že bych chtěl, aby graf obsahoval informace včetně informací o distribuci všech 6139 přístupů napříč mou sekvencí dotazu.

Jelikož se jedná o velké množství sekvencí pro vizualizaci distribuce, zvažuji použití skóre počtu zásahů v určité oblasti a mít výstup podobnější:

Pokud bych měl spustit svůj výbuch pomocí nástroje příkazového řádku BLAST + a načíst výsledky do R, které části výstupu bych měl vykreslit, abych znovu vytvořil grafické zobrazení distribuce? V ideálním případě bych chtěl vytvořit opakovaně použitelný objekt, který dokáže vytvořit ekvivalentní graf pro jakýkoli vstup BLAST.

Díky.

Jak získáte skóre počtu zásahů v regionech? Myslím, že byste měli nejprve získat skóre a vykreslit skóre a region v R. Pokud chcete vizualizaci aliginmentu, možná tento [link] (https://en.wikipedia.org/wiki/List_of_alignment_visualization_software) nápověda

Jaký formát byste použili pro výstup výbuchu? Jeden ze standardních, nebo jste otevřeni definovat svůj vlastní? A bylo by to vynesením počtu zásahů na každé pozici vašeho dotazu nebo jejich skóre? Nebo možná jejich celková identita? Co přesně je „Zachování“ na vaší ukázkové ose?

@terdon Nejsem závislý na žádném konkrétním typu vysokopecního výstupu a jsem otevřený definovat svůj vlastní pro tento problém. Myslím, že místo skóre bych zvolil vykreslení počtu zásahů na každé pozici. tento [odkaz] (https://bcbio.wordpress.com/2009/02/07/automated-protein-conservation-display-from-blast-alignments/) poskytuje popis metody použité k vytvoření ochranného pozemku v mém zveřejnit podrobně.

Počet zásahů na dané pozici je však zbytečná informace, pokud nezohledníte kvalitu příslušných HSP. Zdá se, že chcete vytvořit plán ochrany, pokud ano, je to špatný způsob, jak to udělat. Například byste mohli mít stovky zásahů na pozici 12, ale pokud jsou tyto stovky malé a velmi špatně konzervované, jsou irelevantní.

Nechci koncipovat ochranu. Chci vědět, které oblasti daného lidského proteinu jsou nejvíce podobné bakteriálním sekvencím. Pokud je to moje otázka, záleží na velikosti / zachování nutně?