Otázka:
Jak mohu extrahovat názvy genů pro metabolickou cestu z KEGG?
becko
2017-09-24 16:14:22 UTC
view on stackexchange narkive permalink

Poznámka: Tato otázka byla položena také na Biostars

Potřebuji získat seznam názvů genů zapojených do glykolýzy (abych dal příklad). Ne ručně, musím to udělat ve skriptu. Ideálně s Pythonem. Myslím, že KEGG je správná databáze k tomu, ale jakýkoli jiný (bezplatný) návrh by to udělal.

Jak to mohu udělat?

Pokud je vám známo, existují další metabolické cesty, včetně metaCyc, reaktomu, ...
Viděl jsem, že tato otázka je znovu zveřejněna na Biostars. Zde je řešení, [https://www.biostars.org/p/274321/#274326](https://www.biostars.org/p/274321/#274326)
Tři odpovědi:
terdon
2017-09-24 17:39:49 UTC
view on stackexchange narkive permalink

Tento malý skript jsem vybičoval pomocí KEGG API:

  #! / usr / bin / env python3import urllib.requestimport reimport syspathway = 'hsa00010' # glycolysisurl = "http://rest.kegg.jp/get/" + cesta s urllib.request.urlopen (url) jako f: lines = f.read (). decode (' utf-8 '). splitlines () want = 0 pro řádek v řádcích: fields = line.split () ## Seznam genů začíná zde, pokud pole [0] ==' GENE ': want = 1 ## Řádek s GENE je jiný tisk (pole [2] .rstrip (';')) ## Došli jsme k další části souboru elif want == 1 a re.match ('^ \ S', řádek): sys.exit (); ## Jsme stále v seznamu genů, pokud chceme == 1 a len (pole) >1: print (pole [1] .rstrip (';'))  
Pierre
2017-09-24 19:20:25 UTC
view on stackexchange narkive permalink

Pomocí rozhraní REST API togows: lze načíst strukturu JSON genů přidružených keggové cestě. např .: http://togows.org/entry/kegg-pathway/hsa00010/genes.json

  [{"3101": "HK3; hexokinase 3 [ KO: K00844] [EC: 2.7.1.1] "," 3098 ":" HK1; hexokináza 1 [KO: K00844] [EC: 2.7.1.1] "," 3099 ":" HK2; hexokináza 2 [KO: K00844] [EC: 2.7.1.1] "," 80201 ":" HKDC1; doména hexokinázy obsahující 1 [KO: K00844] [EC: 2.7.1.1] "," 2645 ":" GCK; glukokináza [KO: K12407] [EC: 2.7.1.2] "," 2821 ":" GPI; glukóza-6-fosfát izomeráza [KO: K01810] [EC: 5.3.1.9] "," 5213 ":" PFKM; fosfofruktokináza, sval [KO: K00850] [EC : 2.7.1.11] "," 5214 ":" PFKP; fosfofruktokináza, destička [KO: K00850] [EC: 2.7.1.11] "," 5211 ":" PFKL; fosfofruktokináza, jaterní typ [KO: K00850] [ES: 2.7.1.11] "," 2203 ":" FBP1; fruktóza-bisfosfatáza 1 [KO: K03841] [ES: 3.1.3.11] "," 8789 ":" FBP2; fruktóza-bisfosfatáza 2 [KO: K03841] [ES: 3.1.3.11] "," 230 ":" ALDOC; aldoláza, fruktóza-bisfosfát C [KO: K01623] [ES: 4.1.2.13] "," 226 ":" ALDOA; aldoláza, fruktóza-bisfosfát A [KO: K01623 ] [EK: 4.1.2.13] ", "229": "ALDOB; aldoláza, fruktóza-bisfosfát B [KO: K01623] [EC: 4.1.2.13] "," 7167 ":" TPI1; triosefosfát izomeráza 1 [KO: K01803] [EC: 5.3.1.1] "," 2597 ":" GAPDH; glyceraldehyd-3-fosfátdehydrogenáza [KO: K00134] [EC: 1.2.1.12] "," 26330 ":" GAPDHS; glyceraldehyd-3-fosfát dehydrogenáza, spermatogenní [KO: K10705] [EC: 1.2.1.12] "," 5232 ":" PGK2; fosfoglycerátkináza 2 [KO: K00927] [EC: 2.7.2.3] "," 5230 ":" PGK1; fosfoglycerátkináza 1 [KO: K00927] [EC: 2.7.2.3] "," 5223 ":" PGAM1; fosfoglycerát mutáza 1 [KO: K01834] [EC: 5.4.2.11] "," 5224 ":" PGAM2; fosfoglycerát mutáza 2 [KO: K01834] [EC: 5.4.2.11] "," 441531 ":" PGAM4; člen rodiny fosfoglycerát mutázy 4 [KO: K01834] [EC: 5.4.2.11] "," 2027 ":" ENO3; enoláza 3 [KO: K01689] [EC: 4.2.1.11] "," 2026 ":" ENO2; enoláza 2 [KO: K01689] [EC: 4.2.1.11] ",
"2023": "ENO1; enolase 1 [KO: K01689] [EC: 4.2.1.11]", "5315": "PKM; pyruvátkináza, sval [KO: K00873] [EC: 2.7.1.40]", "5313 ":" PKLR; pyruvátkináza, játra a RBC [KO: K12406] [EC: 2.7.1.40] "," 5161 ":" PDHA2; pyruvátdehydrogenáza alfa 2 [KO: K00161] [EC: 1.2.4.1] "," "5160": "PDHA1; pyruvátdehydrogenáza alfa 1 [KO: K00161] [EC: 1.2.4.1]", "5162": "PDHB; pyruvátdehydrogenáza (lipoamid) beta [KO: K00162] [EC: 1.2.4.1] "," 1737 ":" DLAT; dihydrolipoamid S-acetyltransferáza [KO: K00627] [EC: 2.3.1.12] "," 1738 ":" DLD; dihydrolipoamid dehydrogenáza [KO: K00382] [EC: 1.8.1.4] "," "160287": "LDHAL6A; laktátdehydrogenáza A jako 6A [KO: K00016] [EC: 1.1.1.27]", "92483": "LDHAL6B; laktátdehydrogenáza A jako 6B [KO: K00016] [EC: 1.1.1.27] "," 3939 ":" LDHA; laktátdehydrogenáza A [KO: K00016] [EC: 1.1.1.27] "," 3945 ":" LDHB; laktátdehydrogenáza B [KO: K00016] [EC: 1.1.1.27] "," "3948": "LDHC; laktátdehydrogenáza C [KO: K00016] [EC: 1.1.1.27]", "124": "ADH1A; alkohol deh ydrogenáza 1A (třída I), alfa polypeptid [KO: K13951] [EC: 1.1.1.1] "," 125 ":" ADH1B; alkohol dehydrogenáza 1B (třída I), beta polypeptid [KO: K13951] [EC: 1.1.1.1] "," 126 ":" ADH1C; alkohol dehydrogenáza 1C (třída I), gama polypeptid [KO: K13951] [EC: 1.1.1.1] "," 131 ":" ADH7; alkohol dehydrogenáza 7 (třída IV), polypeptid mu nebo sigma [KO: K13951] [EC: 1.1.1.1] "," 127 ":" ADH4; alkohol dehydrogenáza 4 (třída II), polypeptid pí [KO: K13980] [EC: 1.1.1.1] "," 128 ":" ADH5; alkohol dehydrogenáza 5 (třída III), chi polypeptid [KO: K00121] [EC: 1.1.1.1 1.1.1.284] "," 130 ":" ADH6; alkohol dehydrogenáza 6 (třída V) [KO: K13952] [EC: 1.1.1.1] "," 10327 ":" AKR1A1; aldo-keto reduktázová rodina 1 člen Al [KO: K00002] [EC: 1.1.1.2] "," 217 ":" ALDH2; rodina aldehyddehydrogenázy 2 (mitochondriální) [KO: K00128] [EC: 1.2.1.3] "," 224 ":" ALDH3A2; člen rodiny aldehyddehydrogenázy 3 A2 [KO: K00128] [EC: 1.2.1.3] ",
"219": "ALDH1B1; člen rodiny aldehyddehydrogenázy 1 B1 [KO: K00128] [EC: 1.2.1.3]", "501": "ALDH7A1; člen rodiny aldehyddehydrogenázy 7 A1 [KO: K14085] [EC: 1.2. 1.3 1.2.1.8 1.2.1.31] "," 223 ":" ALDH9A1; aldehyddehydrogenáza 9 člen rodiny A1 [KO: K00149] [EC: 1.2.1.3 1.2.1.47] "," 221 ":" ALDH3B1; aldehyddehydrogenáza 3 člen rodiny B1 [KO: K00129] [EC: 1.2.1.5] "," 222 ":" ALDH3B2; člen rodiny aldehyddehydrogenázy 3 B2 [KO: K00129] [EC: 1.2.1.5] "," 220 ":" ALDH1A3 ; člen rodiny aldehyddehydrogenázy 1 A3 [KO: K00129] [EC: 1.2.1.5] "," 218 ":" ALDH3A1; člen rodiny aldehyddehydrogenázy 3 A1 [KO: K00129] [EC: 1.2.1.5] "," 84532 ":" ACSS1; člen rodiny krátkých řetězců acyl-CoA syntetázy 1 [KO: K01895] [EC: 6.2.1.1] "," 55902 ":" ACSS2; člen rodiny krátkých řetězců acyl-CoA syntetázy 2 [KO: K01895] [ EC: 6.2.1.1] "," 130589 ":" GALM; galaktóza mutarotáza [KO: K01785] [EC: 5.1.3.3] "," 5236 ":" PGM1; fosfoglukomutáza 1 [KO: K01835] [EC: 5.4. 2.2] "," 55276 ":" PGM2; fosfogluk omutáza 2 [KO: K15779] [EC: 5.4.2.7 5.4.2.2] "," 2538 ":" G6PC; katalytická podjednotka glukóza-6-fosfatázy [KO: K01084] [EC: 3.1.3.9] "," 57818 ":" G6PC2; katalytická podjednotka glukóza-6-fosfatázy 2 [KO: K01084] [EC: 3.1.3.9] "," 92579 ":" G6PC3; katalytická podjednotka glukóza-6-fosfatázy 3 [KO: K01084] [EC: 3.1.3.9] "," 83440 ":" ADPGK; ADP závislá glukokináza [KO: K08074] [EC: 2.7.1.147] "," 669 ":" BPGM; bisfosfoglycerát mutáza [KO: K01837] [EC: 5.4.2.11 5.4.2.4] "," 9562 ":" MINPP1; mnohonásobná inositol-polyfosfátfosfatáza 1 [KO: K03103] [EC: 3.1.3.80 3.1.3.62] "," 5105 ":" PCK1; fosfoenolpyruvátkarboxykináza 1 [KO: K01596] [EC: 4.1.1.32] "," 5106 ":" PCK2; fosfoenolpyruvátkarboxykináza 2, mitochondriální [KO: K01596] [EC: 4.1.1.32] "}]  
gringer
2018-01-12 08:29:44 UTC
view on stackexchange narkive permalink

Odpovědi od Biostars:

Modul GeneSCF „prepare_database“ extrahuje všechny cesty s odpovídajícími geny jako jednoduchý formát tabulky v souboru prostého textu. Zaškrtněte „Dvoustupňový proces“ (podnadpis) z poskytnutého odkazu (první krok udělá vaši práci).


K extrakci genu můžete použít KEGG REST API. jména z cesty. Knihovnu požadavků Pythonu lze použít k provádění REST volání rozhraní KEGG REST API a informací o dotazech. Pokud jste nováčkem programování v Pythonu a webových služeb REST, postupujte podle tohoto kurzu.



Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 3.0, pod kterou je distribuován.
Loading...