内容

1概述

在家庭维护中,垫片是木材的小楔子,您将其粘在摇摆的实体中,使其更稳定。

我们需要这样的事情来处理基因组学中的不同数据资源。这是一个问题的示例:

## eqtl fp hs ## chrom chr chr chrom ## start snp_pos start start warmstart ## end snp_pos end chromend

该数据框架的隆起是Granges特征的目标注释项:Chrom,Start,End。这些列是不同的测定类型。条目i,j是分析类型j的功能i的符号。因此,对于eqtl数据,可以从源属性“ snp_pos”确定启动和结束,而对于足迹(fp),足迹末端表示为“ end”,对于热点(HS),足迹末端表示为“ Chromend”。

为了将数据留在其原始状态,但简化了下游集成,我们使用了诸如basiccfieldsmap将属性名称映射到一个常见的词汇中。

2应用于破烂的mongoexpt实例

我们用破烂的山戈克斯与远程元号的内容一起使用,该实例具有大量基因组注释。

2.1建造

## class: RaggedMongoExpt ## dim: 2640 2640 ## assays(0): ## rownames: NULL ## colnames(2640): Adipose_Subcutaneous_allpairs_v7_eQTL ## Adipose_Visceral_Omentum_allpairs_v7_eQTL ... ## iPS_19_11_DS15153_hg19_FP vHMEC_DS18406_hg19_FP ## colData names(6): base类型...类型中间

这里RME0持有对MongoDB数据库的引用,与酷塔零件。(该软件包包括一个单位测试,用于TXREGNET数据库中的集合名称与Coldata元素名称之间的对应关系。)

2.2基本动机

我们将退后一会儿,给予基本动机。我们希望使用MongoDB来管理有关EQTL,DNASEI高度敏感区域等的数据,而无需策划相关的文件内容。这是eqtl的基本功能的说明:

## gene_id variant_id tss_distance ma_samples ma_count maf ## 1 ENSG00000272636.1 17_36551_T_C_b37 5124 286 367 0.479112 ## 2 ENSG00000272636.1 17_36718_A_G_b37 5291 246 305 0.398172 ## pval_nominal slope slope_se qvalue chr snp_pos A1 A2 build ## 1 0.000892921 0.176774 0.0527027 0.06317724 17 36551T C B37 ## 2 0.001601720 0.170962 0.0537081 0.09719138 17 36718 A G B37

我们需要不同的用于不同类型的测定的组件,因为用于染色体的内部符号在测定类型之间有所不同。可以出现多元化注释的其他方面,面对这种多样性,SHIM概念有助于将更统一的界面传递给用户。

2.3SBOV功能

目前,从破烂的蒙多克斯实例中检索测定结果的主要主力是SBOV,这是一种方法子集串功能。我们将通过与肺相关的EQTL,DNase热点和数字基因组足迹结果提取的提取来说明这一点。

##。
##。
##。

原则上,我们可以避免seqlevelsstyle通过检查测定类型的操作SBOV,但是目前用户必须承担这一责任。

查看有关如何合作的更多信息SBOV输出,检查主小插图。