Jedním z problémů, které jsem našel u GEO a dokonce i ArrayExpress, je to, že se zdá, že se při hledání objeví spousta falešných poplachů. Navíc vám může chybět spousta výsledků, protože jste neuvedli synonymum drogy.
Abyste se ujistili, že mám všechny informace týkající se jména atd., můžete napsat skript, který stáhne výsledek vyhledávání v PubChem (myslím, že to lze provést i v Drugbank) a poté analyzujte výsledek hledání a extrahujte důležité informace, jako jsou synonyma názvu drogy.
Nakonec vezměte tato synonyma a použijte je při hledání experimentů Entrez (EUtils). Pak zkuste filtrovat výsledky, aby zůstalo jen to, co skutečně hledáte. Jedním špatným způsobem, jak toho dosáhnout, je zajistit, aby souhrn experimentu obsahoval hledaný výraz. Dalším způsobem, jak to potenciálně udělat, například pokud existuje velký experiment, který testuje různé faktory serveru, je programově prohledávat přidružené soubory a zajistit, aby obsahovaly požadované klíčové slovo.
Získáte různé typy experimentů, takže soubory spojené s výsledky budou záviset na typu experimentu ve výsledku vyhledávání.
Když získáte seznam ID experimenty, které chcete, můžete je přenést do GEOquery v Bioconductor.