1概述

derfinderData是从其中提取信息的小数据包吗BrainSpan(见在这里) (BrainSpan, 2011)用于24个限制在21号染色体上的样本。这个包中的BigWig文件可以被其他包使用,例如derfinder而且derfinderPlot

而你可以从BrainSpan(BrainSpan, 2011),这个包对于您可能遇到一些困难的场景是有帮助的,例如本文所描述的线程

2数据

下面的代码构建包含的表型表derfinderData.随机选取两个结构,选取12个样本,其中6个来自胎儿样本,另外6个来自成年个体。对于胎儿样本,PCW中的年龄转化为年的年龄

age_in_years = (age_in_PCW - 40) / 52

在其他数据集中,如果某些观测数据的PCW高达42,则可能需要减去42而不是40。

# #构造brainspanPheno表brainspanPheno < - data.frame(性别= c(“F”、“M”、“M”,“M”,“F”,“F”,“F”,“M”,“F”,“M”,“M”,“F”,“M”,“M”,“M”,“M”,“F”,“F”,“F”,“M”,“F”,“M”,“M”,“F”),实验室= c(“HSB97。艾米”、“HSB92。艾米", "HSB178.AMY", "HSB159.AMY", "HSB153.AMY", "HSB113.AMY", "HSB130.AMY", "HSB136.AMY", "HSB126.AMY", "HSB145.AMY", "HSB123.AMY", "HSB135.AMY", "HSB114.A1C", "HSB103.A1C", "HSB178.A1C", "HSB154.A1C", "HSB150.A1C", "HSB149.A1C", "HSB130.A1C", "HSB136.A1C", "HSB126.A1C", "HSB145.A1C", "HSB123.A1C", "HSB135.A1C"), Age = c(-0.442307692307693, -0.365384615384615, -0.461538461538461, -0.307692307692308, -0.538461538461539, -0.538461538461539, 21, 23, 30, 36, 37, 40, -0.519230769230769, -0.519230769230769, -0.461538461538461, -0.461538461538461, -0.538461538461539, -0.519230769230769, 21, 23, 30, 36, 37, 40) ) brainspanPheno$structure_acronym <- rep(c("AMY", "A1C"), each = 12) brainspanPheno$structure_name <- rep(c("amygdaloid complex", "primary auditory cortex (core)"), each = 12) brainspanPheno$file <- paste0("http://download.alleninstitute.org/brainspan/MRF_BigWig_Gencode_v10/bigwig/", brainspanPheno$lab, ".bw") brainspanPheno$group <- factor(ifelse(brainspanPheno$Age < 0, "fetal", "adult"), levels = c("fetal", "adult"))

然后我们可以保存表型信息,包括在derfinderData

保存pheno表(brainspanPheno, file = "brainspanPheno. rdata ")

以下是数据的样子:

library("knitr") ##探索pheno p <- brainspanPheno[, -which(colnames(brainspanPheno) %in% c("structure_acronym", "structure_name", "file"))] kable(p, format = "html", row.names = TRUE)
性别 实验室 年龄 集团
1 F HSB97。艾米 -0.4423077 胎儿
2 HSB92。艾米 -0.3653846 胎儿
3. HSB178。艾米 -0.4615385 胎儿
4 HSB159。艾米 -0.3076923 胎儿
5 F HSB153。艾米 -0.5384615 胎儿
6 F HSB113。艾米 -0.5384615 胎儿
7 F HSB130。艾米 21.0000000 成人
8 HSB136。艾米 23.0000000 成人
9 F HSB126。艾米 30.0000000 成人
10 HSB145。艾米 36.0000000 成人
11 HSB123。艾米 37.0000000 成人
12 F HSB135。艾米 40.0000000 成人
13 HSB114。糖化血红蛋白 -0.5192308 胎儿
14 HSB103。糖化血红蛋白 -0.5192308 胎儿
15 HSB178。糖化血红蛋白 -0.4615385 胎儿
16 HSB154。糖化血红蛋白 -0.4615385 胎儿
17 F HSB150。糖化血红蛋白 -0.5384615 胎儿
18 F HSB149。糖化血红蛋白 -0.5192308 胎儿
19 F HSB130。糖化血红蛋白 21.0000000 成人
20. HSB136。糖化血红蛋白 23.0000000 成人
21 F HSB126。糖化血红蛋白 30.0000000 成人
22 HSB145。糖化血红蛋白 36.0000000 成人
23 HSB123。糖化血红蛋白 37.0000000 成人
24 F HSB135。糖化血红蛋白 40.0000000 成人

我们可以证实,这确实是包含的信息derfinderData

##重命名我们新创建的pheno数据newPheno <- brainspanPheno ##加载包含的数据库("derfinderData")
## ##附加包:'derfinderData'
##下面的对象被屏蔽__ `。GlobalEnv': ## ## brainspanPheno
##验证相同(newPheno, brainspanPheno)
##[1]真

利用表现型信息,你可以使用derfinder从这些样本中提取21号染色体的基本覆盖水平信息。然后将数据导出到BigWig文件中。

library("derfinder") ##确定要使用的文件并修复名称文件<- brainspanPheno$file names(files) <- gsub(". amy |. txt ")A1C", "", brainspanPheno$lab) ##加载数据系统。time(fullCovAMY <- fullCoverage(files = files[brainspanPheno$structure_acronym == "AMY"], chrs = "chr21")) #用户系统运行# 4.505 0.178 37.676系统。time(fullCovA1C <- fullCoverage(files = files[brainspanPheno$structure_acronym == "A1C"], chrs = "chr21")) #用户系统运行# 2.968 0.139 27.704 ##写入BigWig文件dir.create("AMY")系统。time(createBw(fullCovAMY, path = "AMY", keepGR = FALSE)) # user system elapsed # 5.749 0.332 6.045 dir.create("A1C") system. time(createBw(fullCovAMY, path = "AMY", keepGR = FALSE))time(createBw(fullCovA1C, path = "A1C", keepGR = FALSE)) #用户系统运行时间# 5.025 0.299 5.323 ##检查每个目录中创建了12个文件all(c(length(dir("AMY")), length(dir("A1C"))) == 12) # TRUE ##保存在Windows上运行的示例数据Save (fullCovAMY, file = "fullCovA1C. rdata ") Save (fullCovA1C, file = "fullCovA1C. rdata ")

这些BigWig文件可以在下面获得extdata如下图所示:

##查找AMY BigWigs目录(系统。file("extdata", "AMY", package = "derfinderData"))
## [1] " hsb113。bw”“HSB123。bw”“HSB126。bw”“HSB130。bw”“HSB135。bw”“HSB136。bw" ## [7] "HSB145。bw”“HSB153。bw”“HSB159。bw”“HSB178。bw”“HSB92。bw HSB97.bw”
##查找A1C BigWigs目录(system。file("extdata", "A1C", package = "derfinderData"))
## [1] " hsb103。bw”“HSB114。bw”“HSB123。bw”“HSB126。bw”“HSB130。bw”“HSB135。bw" ## [7] "HSB136。bw”“HSB145。bw”“HSB149。bw”“HSB150。bw”“HSB154。bw HSB178.bw”

3.再现性

创建小插图的代码

##创建小插图库("rmarkdown") system.time(render("derfinderData. txt ")Rmd", "BiocStyle::html_document")) ## Extract the R code library("knitr") knit("derfinderData.Rmd", tangle = TRUE)

小插图生成的日期。

##[1]“2022-04-28 10:18:49 edt”

生成小插图所花费的挂钟时间。

时差0.557秒

R会话信息。

会话信息# #────────────────────────────────────────────────────────────────# # # #设置值版本R 4.2.0 RC (2022-04-19 r82224) # # os Ubuntu 20.04.4 LTS # #系统x86_64, ui X11 linux-gnu # # # #语言(EN) # #整理C # # ctype en_US。utf - 8 # # tz美国日期/ New_York # # 2022-04-28 # # pandoc 2.5 @ /usr/bin/(通过rmarkdown) # # # #包────────────────────────────────────────────────────────────────────# #包*版本日期(UTC)自由源# # BiocManager 1.30.17 2022-04-22[2]凹口(R 4.2.0) # # BiocStyle * 2.24.0 2022-04-27 [2] Bioconductor # # bookdown 0.26 2022-04-15[2]凹口(R 4.2.0) # # bslib 0.3.1 2021-10-06[2]凹口(R 4.2.0) # # cli 3.3.0 2022-04-25[2]凹口(R 4.2.0) # # derfinderData * 2.14.0 2022-04-28 [1]Bioconductor # #消化0.6.29 2021-12-01[2]凹口(R 4.2.0) # #评估0.15 2022-02-18[2]凹口(R 4.2.0) # # fastmap 1.1.0 2021-01-25[2]凹口(R 4.2.0) # #泛型0.1.2 2022-01-31[2]凹口(R 4.2.0) # # highr 0.9 2021-04-16[2]凹口(R 4.2.0) # # htmltools 0.5.2 2021-08-25[2]凹口(R 4.2.0) # # httr 1.4.2 2020-07-20[2]凹口(R 4.2.0) # # jquerylib 0.1.4 2021-04-26[2]凹口(R 4.2.0) # # jsonlite 1.8.0 2022-02-22[2]凹口(R 4.2.0) # # knitr * 1.39 2022-04-26[2]凹口(R 4.2.0) # # lubridate 1.8.02021-10-07[2]凹口(R 4.2.0) # # magrittr 2.0.3 2022-03-30[2]凹口(R 4.2.0) # # plyr 1.8.7 2022-03-24[2]凹口(R 4.2.0) # # R6 2.5.1 2021-08-19[2]凹口(R 4.2.0) # # Rcpp 1.0.8.3 2022-03-17[2]凹口(R 4.2.0) # # 2020-11-13 [2] 1.3.0 RefManageR *版本凹口(R 4.2.0) # # rlang 1.0.2 2022-03-04[2]凹口(R 4.2.0) # # rmarkdown 2.14 2022-04-25[2]凹口(R 4.2.0) # # sass 0.4.1 2022-03-23[2]凹口(R 4.2.0) # # sessioninfo * 1.2.2 2021-12-06[2]凹口(R 4.2.0) # # stringi 1.7.6 2021-11-29[2]凹口(R 4.2.0)# # stringr 1.4.0 2019-02-10[2]凹口(R 4.2.0) # # xfun 0.30 2022-03-02[2]凹口(R 4.2.0) # # xml2 1.3.3 2021-11-30[2]凹口(R 4.2.0) # # yaml 2.3.5 2022-02-21[2]凹口(R 4.2.0) # # # # [1] / tmp / Rtmpf4wz69 Rinst14c0422e4ff01 # # [2] /home/biocbuild/bbs - 3.15 bioc / R /图书馆# # # #──────────────────────────────────────────────────────────────────────────────

4参考书目

这个小插图是使用BiocStyle(oleovich, 2022)knitr(Xie, 2014)和rmarkdown(Allaire, Xie, McPherson, Luraschi, Ushey, Atkins, Wickham, Cheng, Chang和Iannone, 2022)在幕后运行。

引用由knitcitations

[1]谢永林,谢永林,等。rmarkdown: R动态文档.R包2.14版本。2022.URL:https://github.com/rstudio/rmarkdown

[2]BrainSpan。“发展中的人类大脑图集[互联网]。由ARRA奖励1RC2MH089921-01, 1RC2MH090047-01和1RC2MH089929-01资助。2011。URL:http://developinghumanbrain.org

[3]答:Oleś。BiocStyle:小插图和其他Bioconductor文档的标准样式.R包版本为2.24.0。2022.URL:https://github.com/Bioconductor/BiocStyle

[4]y谢。“编织器:R中可重复研究的综合工具”。:实施可重复计算研究.编著:V. Stodden, F. Leisch和R. D. Peng。ISBN 978 - 1466561595。查普曼和霍尔/CRC, 2014年。URL:http://www.crcpress.com/product/isbn/9781466561595