内容

1概述

igvR包提供简单programmic R的基于web的javascript库的访问igv.js为了创建和显示基因组跟踪在其丰富的交互式web浏览器可视化界面。我感激吉姆•罗宾逊道格拉斯·特纳和他的同事们为他们的好工作。

我们介绍igvR通过一个案例研究与老年痴呆症有关的基因变异所描述在2014年自然遗传学

荟萃分析的74046人确定了11个新的阿尔茨海默病易感性位点1

论文11个位点使易感性位点总数数到20,其中MEF2C就是其中之一。我们专注于1 megabase周围地区MEF2C基因包含208个变异的存在与MEF2C的表达在17008例阿尔茨海默氏症病例和37154例对照。有趣的是,这些变异不发生在编码的基因区域。一些可能的洞察他们的功能——的一种高度投机性,初步提供了这个案例研究。我们追求一个问题:可以通过破坏这些非编码变异改变MEF2C基因调控转录因子结合位点?

我们将进行如下:

结果从运行下面的代码:

库(igvR)库(MotifDb)图书馆(BSgenome.Hsapiens.UCSC.hg19)图书馆(VariantAnnotation)库(AnnotationHub)

创建igvR实例,所有默认参数(portRange,安静,标题)。Javascript和HTML加载到浏览器中,进口。js是初始化,websocket连接之间R过程和构造web页面,在后续的命令和数据将旅行。

igv < - igvR () setBrowserWindowTitle (igv MEF2C) setGenome(进口,“hg19”)

显示MEF2C

“MEF2C showGenomicRegion(进口)

2扩大该地区展出,为后续基因组创建一个农庄组织对象查询

loc < - getGenomicRegion(进口)保证金< - 25000大。与(loc < - loc sprintf (“% s: % d % d”,铬,start-margin,结束+利润))mef2c。地区< - (loc,农庄(seqnames =铬,IRanges(开始=开始+利润,结束=结束+利润)))showGenomicRegion (igv bigger.loc)

这接下来的几个步骤使创建和显示的螺母和螺栓从表格数据跟踪。没有权力和方便Biocondcutor AnnotationHub, rtracklayer和GenomicRanges这里使用——这是在装饰图案。

添加IGAP GWAS跟踪两次,第一次作为一个注释,所以名字是avaialble通过点击,然后定量追踪,使用log10 (pValue)得分,输送强度协会每个SNP与目标基因的表达,MEF2C,每个SNP的追踪元素的高度。

IGAP阿尔茨海默氏症的国际基因组学项目,提供这些数据。看到荟萃分析的74046人确定了11个新的阿尔茨海默病易感性位点2013年12月,自然遗传学。

负载(系统。文件(包=“igvR”、“extdata”、“tbl.mef2cGWAS.variants.RData”)) tbl.mef2cGWAS.variants。< - tbl.mef2cGWAS睡。变异(c(“空空”、“oldPos”,“oldPos”,“国民党”,“P”)] tbl.mef2cGWAS.variants。床上$ P < - log10 (tbl.mef2cGWAS.variants.bed $ P) colnames (tbl.mef2cGWAS.variants.bed) < - c(“铬”、“开始”、“结束”,“名字”,“分数”)。gwas < - DataFrameAnnotationTrack (“IGAP。gwas”, tbl.mef2cGWAS.variants。床上,trackHeight = 20,颜色=“darkBlue”) displayTrack tbl.mef2cGWAS.variants(进口,track.gwas)。bedGraph < - tbl.mef2cGWAS.variants。床track.gwas [4]。数字< - DataFrameQuantitativeTrack (“IGAP.gwas。得分”,tbl.mef2cGWAS.variants。bedGraph,自动定量= TRUE) displayTrack (igv track.gwas.numeric)

3使用bioc AnnotationHub创建一个启动子

位置只计算用于识别基因启动子,而不是更微妙的实验数据,稍后我们将看起来更装饰图案。我们使用默认,保守的参数(2 kb TSS的上游,下游200个基点)。

啊< - AnnotationHub()啊。人类< -子集(物种啊,= =“智人”)# - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - #添加refseq启动子,可以从refseq为每个记录已确认# - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - ah.human。refseq < -查询(啊。人类,“RefSeq”、“hg19”、“RefSeq基因”)#下载第一组人。refseq < - ah.human。refseq [[1]] gr.promoters < -促进剂(人类。refseq,上游= 2000,下游= 200)#摆脱分数,itemRgb,厚,街区mcols中的列,保持记录的名字。#以来跟踪记录这些属性有意义包括utr表示#,内含子和外显子。但启动子是一段DNA的这些差别#不适用mcols (gr.promoters) < - mcols (gr.promoters) [1] colnames (mcols (gr.promoters)) < - ov < findOverlaps (gr“名字”。启动子,gr.mef2c mef2c.region)。启动子< - gr.promoters [queryHits (ov)]。启动子< - UCSCBedAnnotationTrack(“促进者”,gr.mef2c。启动子、颜色= "暗绿色”)displayTrack (igv track.promoters)

4重叠的推动者和变异,创建新的轨道

非编码snp倒在启动子区域是可信的候选人进行进一步的检查。他们可能会扰乱或创建一个转录因子结合位点,从而可能导致疾病的研究。

gr.variants < -农庄组织(tbl.mef2cGWAS.variants.bed) ov < findOverlaps (gr)。变异,gr.promoters) gr.variantsInPromoters < - gr.variants [queryHits (ov)]。gr.variantsInPromoters variantsInPromoters < -GRangesAnnotationTrack (“snpInPromoters”,颜色=“红色”,这个=“扩大”)displayTrack (igv track.variantsInPromoters)

5添加甲基化跟踪

H3K4me3组蛋白甲基化标记往往与启动子的转录起始相关区域。我们将添加三个跟踪H3K4me3 AnnotationHub的甲基化Gm12878(lymphoblastoid)细胞。

组蛋白。< -查询(啊。人类,c (“H3K4me3”、“Gm12878”,“峰”,“窄”)< -组蛋白)# 3跟踪描述。跟踪美元描述标题< -组蛋白。跟踪美元标题颜色< -代表(terrain.colors(6), 4)颜色。(我在seq_len指数< - 0(长度(histone.tracks))){名称< -名称(histone.tracks)(我)的颜色。指数< -颜色。指数+ 1 gr < -组蛋白。跟踪[[名字]]ov < - findOverlaps mef2c (gr, mef2c.region)。组蛋白< - gr (queryHits (ov)]。组蛋白< GRangesQuantitativeTrack(标题[我]mef2c。组蛋白(,“pValue”),颜色=颜色(颜色。指数),trackHeight = 50,自动定量= TRUE) displayTrack (igv track.histones)} #跟踪

6从ADNI VCF,阿尔茨海默病的神经影像学

我们有一个非常小的份额的ADNI全基因组测序数据。349个样本(过滤从一组更大的公元128年,415名轻度认知障碍,267控制,8不确定),所有在~ 4 kb地区包括甲基化标记,和IGAP GWAS snp在启动子区域。

为了说明一些基因组数据探索功能igvR我们因此混合苹果和橘子。我们已经从IGAP GWAS变体(一个非常大的荟萃分析),启动子从RefSeq(保守定义),甲基化标记从lymphoblastoid细胞系,并从ADNI WGS变异。还要注意ADNI变异的VCF跟踪由疾病表型不分层。因此,检查rsid rs80043958与一个chr5:88,179,576 IGAP GWAS pvalue 0.002,我们看到了ADNI杂合性是0.269——这和其他变体是显示在一个弹出信息点击粉红色“地锚”——记住,这个数字会更丰富,如果破碎的表型。

vcfFilename < -系统。文件(包=“igvR”、“extdata”、“mef2c-4kb.vcf”) vcf < - readVcf (vcfFilename,“hg19”)。vcf < - VariantTrack (“AMPAD vcf”、vcf trackHeight = 1000) displayTrack (igv track.vcf) showGenomicRegion(进口,“chr5:88,175,901 - 88181613”)

7引用

  1. 兰伯特,租用,等。74046年“荟萃分析个人确定了11个新的阿尔茨海默病的易感性位点。”45.12自然遗传学(2013):1452
sessionInfo ()' ' ' '