内容

1注意:如果重新开始,使用gQTLBase / gQTLstats

这个包是发表在《黎明eQTL分析。它使用一些特殊的数据结构。gQTL *包更。

2介绍

GGBase包定义了数据分析基础设施在基因表达的基因。本文档主要是开发人员的关注;2021欧洲杯体育投注开户在基因的表达进行分析的信息,请参阅GGtools包的装饰图案。

3主要类结构和相关方法

是用来表示“SNP矩阵列表”综合表达式加上基因型数据的容器。克莱顿的包中定义的类。

# #加载所需的包:snpStats
# #加载所需的包:生存
# #加载所需的包:矩阵
# #警告:包GGBase是弃用和将被删除从Bioconductor # # 3.13版
# #类“smlSet”(包“GGBase”) # # # #槽:# # # #名称:smlEnv注释有机体# #类:环境角色人物# # # #名称:assayData phenoData featureData # #类:assayData AnnotatedDataFrame AnnotatedDataFrame # # # #名称:experimentData protocolData .__classVersion__ # #类:MIAxE AnnotatedDataFrame版本# # # #延伸:# #阶级分野,直接# #类“VersionedBiobase”,由阶级分野,距离2 # #类“版本”,由阶级分野,距离3
# #功能:[(包基地)# # x =“smlSet”, i =“任何”,j =“任何”=“任何“# # # #功能下降:clipPCs(包GGBase) # # x =“smlSet inds2drop =“数值”,中心=“逻辑”# # x =“smlSet inds2drop =“数值”,中心=“失踪”# # # #功能:结合(包BiocGenerics) # # x =“smlSet”, y =“smlSet”# # # #功能:exprs对象(包Biobase) # # = # # # #“smlSet”功能:nsFilter(包genefilter) # # eset = # # # #“smlSet”功能:permEx(包GGBase) # #短信=“smlSet”# # # #功能:plot_EvG(包GGBase) # # gsym =“genesym rsid =“rsid”,短信= # # gsym“smlSet”=“probeId rsid =“rsid”,短信=“smlSet”# # # #功能:smList(包GGBase) # # x =“smlSet”

基因型数据存储在一个列表中环境减少复制函数称为实例。

4示例数据结构

表达数据发表在2007年由Wellcome Trust GENEVAR项目。从人类基因组单体型图二期基因型数据。

# #加载所需的包:data.table
# #加载所需的包:平行
# #加载所需的包:Homo.sapiens
# #加载所需的包:AnnotationDbi
# #加载所需的包:stats4
# #加载所需的包:BiocGenerics
# # # #附加包:“BiocGenerics”
# #以下对象从包:平行的蒙面:# # # # clusterApply, clusterApplyLB, clusterCall, clusterEvalQ, # # clusterExport, clusterMap, parApply, parCapply, parLapply, # # parLapplyLB, parRapply, parSapply parSapplyLB
# #以下对象是蒙面的包:统计数据:# # # #差,疯了,sd, var, xtabs
# #以下对象从包:基地的蒙面:# # # #过滤器,发现,地图,位置,减少,anyDuplicated,追加,# # as.data.frame, basename, cbind colnames,目录名,做。电话,# #复制,eval, evalq, grep, grepl,相交,是。无序、# #拉普兰人、宾州、匹配mget,秩序,粘贴,pmax, pmax.int, pmin, # # pmin.int,排名,rbind, rownames,酸式焦磷酸钠,setdiff,排序,表,# # tapply,联盟,独特的,不可分割的,。马克斯,which.min
# #加载所需的包:Biobase
# #欢迎Bioconductor # # # #片段包含介绍性的材料;视图与# #“browseVignettes ()”。引用Bioconductor,看# #引文(“Biobase”),和包的引文(“pkgname”)。
# #加载所需的包:IRanges
# #加载所需的包:S4Vectors
# # # #附加包:“S4Vectors”
# #以下对象是蒙面的包:数据。表的:# # # #第一,第二
# #以下对象从包:矩阵的蒙面:# # # #扩张
# #以下对象从包:基地的蒙面:# # # # expand.grid
# # # #附加包:“IRanges”
# #以下对象是蒙面的包:数据。表的:# # # #的转变
# #加载所需的包:OrganismDbi
# #加载所需的包:GenomicFeatures
# #加载所需的包:GenomeInfoDb
# #加载所需的包:GenomicRanges
# #加载所需的包:GO.db
# #
# #加载所需的包:org.Hs.eg.db
# #
# #加载所需的包:TxDb.Hsapiens.UCSC.hg19.knownGene
# #警告:包GGtools是弃用和将被删除从Bioconductor # # 3.13版
# # # #附加包:“GGtools”
# #以下对象是蒙面的包:统计数据:# # # # getCall
# # SnpMatrix-based基因型组:# #的样品数量:90 # #的染色体数量:1 # #注释:illuminaHumanv1。db # #表达数据dim: 47293 x 90 # #的SNP总数:119921 # # Phenodata:一个对象的类“AnnotatedDataFrame”# # sampleNames: NA06985 NA06991……NA12892 (90) # # varLabels: famid persid……男(7)# # varMetadata: labelDescription

5想象一个特定gene-SNP关系

苏格兰民族党rs6060535被张作为CPNE1 eQTL报道2005年自然纸等。

# #

6基因型表达

包的类被用来代表基因型。估算基因型及其不确定性可以表示在这个计划,但是这个例子并不描述。

# # # # rs4814683 rs6076506 rs6139074 rs1418258 rs7274499 NA06985 2 2 2 2 2 # # NA06991 1 2 1 1 2 # # NA06993 0 2 0 0 2 # # NA06994 0 2 0 0 2 # # NA07000 2 2 2 2 2

7减少内存占用的综合数据结构

当数以百万计的基因型被记录,它可以与所有繁琐的工作同时在内存中,这是很少科学相关。因此包装协议建立了结合基因型数据的加载函数允许chromosome-at-a-time结合表达数据。

部署包装协议,使用“一次性”的功能完整的smlSet表示数据,或模仿的行为,这个函数创建一个新的包文件夹结构和填充本月/部分使用rda文件代表一个分区(通常是由染色体)的基因型SnpMatrix实例。