Otázka:
Jak najít soubory dat GEO pomocí ID Drug Bank a bioDBnet
hhoomn
2017-06-15 18:09:16 UTC
view on stackexchange narkive permalink

Chci najít všechny experimenty v GEO, které jsou spojeny s drogou (například tolvaptan). Existuje k tomu nějaký rychlý a škálovatelný způsob? Chci dotazovat více než 100 léků.

Zkoušel jsem použít bioDBnet k mapování ID Drug Bank k vyhledání datových sad, ale nevím, jaký výstupní formát bych měl vybrat.

Řekl bych, že nejrychlejší způsob je jednoduše prohledat datové soubory GEO v NCBI s názvem drogy. Měli jste na mysli nějaký druh programového kanálu?
existuje více než 100 léků, takže by pomohla rychlejší metoda.
Pak bych navrhl programové vyhledávání GEO pomocí API EUtils. Na základě toho rádi zveřejníte odpověď, pokud by to pomohlo? (bude však muset počkat několik hodin)
@hhoomn Vítejte v naší komunitě. Pokusil jsem se k otázce přidat požadavek na škálovatelnost. Neváhejte to vylepšit. Obecně se snažíme, aby všechny otázky byly přesné, proto neváhejte přidat další specifikace přímo do otázky místo komentářů.
Bylo by také užitečné vidět nějaký příklad vstupu (pravděpodobně seznam ID DrugBank?) A nějakou představu o požadovaném výstupu (ID datové sady GEO nebo souhrny?)
Tři odpovědi:
pedrostrusso
2018-09-24 20:51:35 UTC
view on stackexchange narkive permalink

Můžete se podívat na balíček rentrez pro R. Pomocí funkce entrez_search můžete získat ID GEO pro studie související s vaším dotazem a poté funkce entrez_summary pro výsledky. Například:

  x <- rentrez :: entrez_search (db = "gds", term = paste0 ("tolvaptan AND gse [ETYP]"), use_history = T) res <- rentrez :: entrez_summary (db = "gds", id = x $ ids) str (res)  

Kde res bude seznam obsahující objekty esummary třída. Poté můžete pomocí následujícího řádku získat přístupová čísla GSE související s tolvaptanem:

  lapply (res, `[['," gse ")  

Tuto funkci byste tedy mohli dát do smyčky, která nahradí „tolvaptan“ vašimi léky:

  drogy <- c („drugA“, „drugB“, „drugC“) pro (droga v léky) {x <- rentrez :: entrez_search (db = "gds", term = paste0 (lék, "AND gse [ETYP]")) res <- rentrez :: entrez_summary (db = "gds", id = x $ ids) lapply (res, `[[`, "gse")}} 

Další informace najdete v rentrez dokumentaci podrobnosti.

jaslibra
2017-06-16 00:10:23 UTC
view on stackexchange narkive permalink

Jedním z problémů, které jsem našel u GEO a dokonce i ArrayExpress, je to, že se zdá, že se při hledání objeví spousta falešných poplachů. Navíc vám může chybět spousta výsledků, protože jste neuvedli synonymum drogy.

Abyste se ujistili, že mám všechny informace týkající se jména atd., můžete napsat skript, který stáhne výsledek vyhledávání v PubChem (myslím, že to lze provést i v Drugbank) a poté analyzujte výsledek hledání a extrahujte důležité informace, jako jsou synonyma názvu drogy.

Nakonec vezměte tato synonyma a použijte je při hledání experimentů Entrez (EUtils). Pak zkuste filtrovat výsledky, aby zůstalo jen to, co skutečně hledáte. Jedním špatným způsobem, jak toho dosáhnout, je zajistit, aby souhrn experimentu obsahoval hledaný výraz. Dalším způsobem, jak to potenciálně udělat, například pokud existuje velký experiment, který testuje různé faktory serveru, je programově prohledávat přidružené soubory a zajistit, aby obsahovaly požadované klíčové slovo.

Získáte různé typy experimentů, takže soubory spojené s výsledky budou záviset na typu experimentu ve výsledku vyhledávání.

Když získáte seznam ID experimenty, které chcete, můžete je přenést do GEOquery v Bioconductor.

Breck
2018-09-22 05:39:03 UTC
view on stackexchange narkive permalink

Doporučil bych použít GEOmetadb od Bioconductor. GEOmetadb je jednoduchá obálka, která stáhne aktuální databázi SQLite s metadaty pro všechny entity v GEO. Potom můžete použít svého oblíbeného klienta SQL k rychlému dotazování na databázi, protože je offline, a průběžně vylepšovat vyhledávání.

Vítejte na stránkách. Přestože je doporučení užitečné, jak lze GEOmetadb použít ke stažení dat GEO souvisejících s drogou?
GEOmetadb vám umožní provádět rychlá fulltextová vyhledávací vyhledávání, abyste mohli ve všech GSE vyhledávat konkrétní názvy drog nebo ID drog.


Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 3.0, pod kterou je distribuován.
Loading...