Otázka:
vytvoření grafu distribuce výbuchových zásahů na sledované sekvenci
bluescholar1212
2017-07-27 03:03:37 UTC
view on stackexchange narkive permalink

Pokouším se vizualizovat výsledky mého vyhledávání BLAST podobným způsobem jako grafické zobrazení distribuce vysokých zásahů z webu BLAST.

Například z mého vyhledávání BLAST:

enter image description here

kromě toho, že bych chtěl, aby graf obsahoval informace včetně informací o distribuci všech 6139 přístupů napříč mou sekvencí dotazu.

Jelikož se jedná o velké množství sekvencí pro vizualizaci distribuce, zvažuji použití skóre počtu zásahů v určité oblasti a mít výstup podobnější:

enter image description here

Pokud bych měl spustit svůj výbuch pomocí nástroje příkazového řádku BLAST + a načíst výsledky do R, které části výstupu bych měl vykreslit, abych znovu vytvořil grafické zobrazení distribuce? V ideálním případě bych chtěl vytvořit opakovaně použitelný objekt, který dokáže vytvořit ekvivalentní graf pro jakýkoli vstup BLAST.

Díky.

Jak získáte skóre počtu zásahů v regionech? Myslím, že byste měli nejprve získat skóre a vykreslit skóre a region v R. Pokud chcete vizualizaci aliginmentu, možná tento [link] (https://en.wikipedia.org/wiki/List_of_alignment_visualization_software) nápověda
Jaký formát byste použili pro výstup výbuchu? Jeden ze standardních, nebo jste otevřeni definovat svůj vlastní? A bylo by to vynesením počtu zásahů na každé pozici vašeho dotazu nebo jejich skóre? Nebo možná jejich celková identita? Co přesně je „Zachování“ na vaší ukázkové ose?
@terdon Nejsem závislý na žádném konkrétním typu vysokopecního výstupu a jsem otevřený definovat svůj vlastní pro tento problém. Myslím, že místo skóre bych zvolil vykreslení počtu zásahů na každé pozici. tento [odkaz] (https://bcbio.wordpress.com/2009/02/07/automated-protein-conservation-display-from-blast-alignments/) poskytuje popis metody použité k vytvoření ochranného pozemku v mém zveřejnit podrobně.
Počet zásahů na dané pozici je však zbytečná informace, pokud nezohledníte kvalitu příslušných HSP. Zdá se, že chcete vytvořit plán ochrany, pokud ano, je to špatný způsob, jak to udělat. Například byste mohli mít stovky zásahů na pozici 12, ale pokud jsou tyto stovky malé a velmi špatně konzervované, jsou irelevantní.
Nechci koncipovat ochranu. Chci vědět, které oblasti daného lidského proteinu jsou nejvíce podobné bakteriálním sekvencím. Pokud je to moje otázka, záleží na velikosti / zachování nutně?
Jeden odpovědět:
benn
2017-07-27 13:55:10 UTC
view on stackexchange narkive permalink

Pravděpodobně budete chtít do výstupu výbuchu zahrnout začátek dotazu (qstart) a konec dotazu (qend).

Něco jako toto:

  blastn -query your. fasta -out blast.out.txt -db your.db -outfmt '6 qseqid sseqid qstart qend length evalue'  

V R si můžete vzít „qstart: qend“ z každého řádku pro graf hustoty.

Existuje mnoho způsobů, jak v R vykreslit hustoty těchto počátečních a koncových aminokyselin.

Dovolte mi ukázat příklad s malým datovým rámcem:

  qstart <- c (200, 300, 250, 400, 500) qend <- c (300, 450, 400, 600, 650) df <- as.data.frame (cbind (qstart, qend) )) aa <- vector () i = 1 for (i in 1: 5) {aa <- append (aa, c (df [i, 1]: df [i, 2])) i + 1} hist (aa ) dens < - hustota (aa) plot (dens)  
Díky @b.nota právě teď to dávám a uvidím, jak to dopadne. To může být přesně to, co hledám.
V současné době pracuji na vytvoření grafu hustoty a na některých problémech. Mám nový sloupec s „qstart: end“ pro každý řádek v mém datovém rámci, ale když se pokusím vytvořit graf hustoty s tímto sloupcem, R vyvolá chybu. Jak to mohu obejít?
Skvělý muž! Existuje mnoho způsobů, jak v R získat data a vytvořit z nich graf. Dám vám malý příklad v úpravě mé odpovědi. Hodně štěstí!


Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 3.0, pod kterou je distribuován.
Loading...