有一个漂亮的小插图snpStats关于链接不平衡(LD)分析,由该软件包中的软件支持。这个包的目的是简化对现有的人口级数据的处理,以便灵活地定义LD块。
的hmld
函数从hapmap的存储库中导入压缩的表格数据。
suppressPackageStartupMessages({图书馆(ldblock)图书馆(GenomeInfoDb)})路径=dir(执行(“人类基因组单体型图”,包=“ldblock”),完整的=真正的)ceu17 =hmld(路径,poptag =“CEU”,铬=“chr17”)
## import /tmp/RtmpFuLaoZ/Rinst12977c5b50ec6/ldblock/hapmap/ld_chr17_CEU.txt.gz
# #。
## ldstruct for population CEU, chrom chr17 ##尺寸:36621 x 36621;统计是Dprime ##对象结构:## ldmat chrom genome allpos poptag statInUse ## "dsCMatrix" "character" "character" "numeric" "character" "character" ## allrs ## "character"
由于某些原因,knitr/render将不能很好地显示此图像。
## ##附件:《黑客帝国》
##下面的对象是从'package:S4Vectors': ## ## expand
这忽略了物理距离和MAF。明亮的条纹可能是由于低MAF的SNP。
我们将使用ceu17
和gwascat
包枚举在LD中具有GWAS命中的SNP。
## gwascat加载。使用makeCurrentGwascat()提取当前图像。
##来自EBI。这个包的data文件夹有一些遗留的摘要。
负载(执行(“遗产/ ebicat37.rda”,包=“gwascat”))#seqlevelsStyle(ebicat37) = "NCBI" # noop?seqlevels(ebicat37) =gsub(“装备”,”“,seqlevels(ebicat37))e17 =ebicat37 [哪一个(as.character(seqnames(ebicat37))==“17”)]
chr17上GWAS命中的一些dbSNP名称如下
“rs11078895”“rs11891”“rs7501939”“rs9905704”“rs4796793”##[6]“rs78378222”
我们将使用expandSnpSet
以获得在HapMap CEU中发现的SNP的名称\(d ' > .9\)这些命中的任何一个。这些名称被添加到输入集中。
## [1] 530
##在ldblock::expandSnpSet(rsh17, ldstruct = ceu17, lb = 0.9): drop ## 149 rsn不匹配在ld矩阵
## [1] 13209
## [1] true
并非所有的GWAS SNP都在HapMap LD资源中。只要格式与HapMap分布的格式一致,就可以使用自己的LD数据。