Otázka:
mapování sondy na sondu mezi poli Affymetrix
Prradep
2017-05-18 17:52:23 UTC
view on stackexchange narkive permalink

Mám zájem o identifikaci mapování mezi různými typy polí Affymetrix. Jsem si vědom, že mapování mezi genem a sadou sond lze extrahovat pomocí databáze Biomart společnosti Ensembl.

  Ensembe gen id ENSG00000181019 mapuje na 1. AFFY HG-U133_Plus_2's 210519_s_at2. AFFY HuGene-1_0-st-v1's 8002303  

Existuje nějaký způsob, jak extrahovat mapování ID probeset mezi dvěma poli (např .: HG-U133_Plus_2, HuGene-1_0-st-v1)?

  např .: 210519_s_at a 8002303  
Je vaše otázka, jak najít překrývající se sady sond mezi poli? Nebo jak obecně identifikovat sady sond? Není to jasné.
Přidal jsem příklad. Má to teď smysl?
Takže v zásadě můžete získat dvě mapování genových id z Ensembl's Biomart. Opravit? Co vám brání ve vstupu do těchto dvou tabulek na základě ID genu Ensembl? Můžete použít funkci `merge` v příkazu R nebo` JOIN` v SQL.
@IakovDavydov nebo unixové spojení by také fungovalo
Problém je v tom: Všechna mapování nejsou přesně jedna k jedné. Buď sondy mapování HG-U133_Plus_2 nebo HuGene-1_0-st-v1 na jedno ID genu souboru.
@Prradep, pokud vysvětlíte, v čem spočívá základní problém, který se snažíte vyřešit, můžeme vám nabídnout lepší rady
Nemusíte nutně očekávat, že uvidíte mapování jedna k jedné, viz moje odpověď níže.
Tři odpovědi:
neilfws
2017-05-19 06:18:14 UTC
view on stackexchange narkive permalink

Pokud vaše otázka zní: lze ID sondy z různých platforem navzájem mapovat podobným způsobem jako mapování sad sondy na geny, odpověď zní: Ano. BioMart umožňuje mapovat téměř cokoli, co má ID, na cokoli jiného, ​​co má ID.

BioMart můžete použít buď prostřednictvím webového rozhraní, nebo programově. Stručný průvodce používáním webového rozhraní pro mapování HG U133 Plus 2 na HuGene 1.0:

  1. Přejít na úvodní stránku
  2. Vyberte H . sapiens Ensembl geny pro vaši databázi; Lidské geny (GRCh38.p10) pro vaši datovou sadu
  3. Klikněte na Filtry v levém sloupci
  4. Rozbalte „REGION“, přejděte dolů na GENE a vyberte „Input microarray probes / probesets ID seznam [doporučeno 500]] "
  5. Vyberte ID sondy AFFY HG U133 PLUS 2 a buď zkopírujte / vložte nebo nahrajte seznam, jeden na řádek
  6. Klikněte na atributy vlevo sloupec -hand
  7. Procházejte, zrušte zaškrtnutí toho, co nechcete vidět, a vyberte, co chcete dělat, například Gene Stable ID, AFFY HuGene 1 0 st v1 Probe a AFFY HG U133 Plus 2 Probe
  8. Nakonec klikněte v nabídce v horní části levého sloupce na „Výsledky“

Měli byste vidět takový výsledek (vy Bude nutné kliknout na tlačítko „Výsledky“).

Neměli byste očekávat, že bude existovat individuální mapování, a to ze dvou důvodů:

  • Geny mají na každý přepis je namapováno více přepisů a sad sond
  • Některé přepisy mají více než jednu sadu sond: v tomto případě se HuGene ID 8002301 a 8002303 mapují na přepisy pro tento gen

Nakonec: zde je programový příklad využívající R / BioMart:

  knihovna (biomaRt) mart.hs <- useMart ("ensembl", "hsapiens_gene_ensembl") výsledky <- getBM (atributy = c ("ensembl_gene_id", "affy_hugene_1_0_st_v1", "affy_hg_u133_plus_2"), filtry = "affy_hg_u13 =" affy_hg_u .hs) výsledky ensembl_gene_id affy_hugene_1_0_st_v1 affy_hg_u133_plus_2
1 ENSG00000181019 8002301 210519_s_at2 ENSG00000181019 8002303 210519_s_at  
rmflight
2017-05-19 06:53:56 UTC
view on stackexchange narkive permalink

Místo biomaRt je také možné použít mapovací databáze zabudované do samotného Bioconductor a mapovat od sondy ke genu a poté od genu k sondě ve druhém. Nějaký R kód pro převod mezi hgu133 a hgu95 pomocí stejného ID sondy, jaké je uvedeno v jiném:

  knihovna (hgu133plus2.db) knihovna (hgu95av2.db) query_probe <- "210519_s_at" hgu133_ensembl <- select (hgu133plus2.db, keys = query_probe, columns = "ENSEMBL") ensembl_hgu95 <- select (hgu95av2.db, keys = hgu133_ensembl $ ENSEMBL, keytype = "ENSEMBL", columns = "PROBEID") dplyr :: inner_join , by = "ENSEMBL", přípona = c (". 133", ".95"))  
rmflight
2017-05-19 06:57:32 UTC
view on stackexchange narkive permalink

Další odpovědi vysvětlují, proč mezi sondami nemusí být mapování jeden na jednoho.

AbsID databáze provádí převod na základě mapování sekvencí sondy na sestavení genomu a poté určuje mapování na základě překrývajících se souřadnic zarovnání genomu. To je opravdu užitečné, pokud si chcete být jisti, že dvě sondy skutečně pravděpodobně měří stejný přepis.

Závisí to však na tom, že se obě sondy shodují s genomem.

Zřeknutí se odpovědnosti: Pracoval jsem ve skupině, která poskytuje nástroj pro mapování AbsID.



Tyto otázky a odpovědi byly automaticky přeloženy z anglického jazyka.Původní obsah je k dispozici na webu stackexchange, za který děkujeme za licenci cc by-sa 3.0, pod kterou je distribuován.
Loading...