derfinderData 2.14.0
derfinderData
是从其中提取信息的小数据包吗BrainSpan(见在这里) (BrainSpan, 2011)用于24个限制在21号染色体上的样本。这个包中的BigWig文件可以被其他包使用,例如derfinder
而且derfinderPlot
.
而你可以从BrainSpan(BrainSpan, 2011),这个包对于您可能遇到一些困难的场景是有帮助的,例如本文所描述的线程.
下面的代码构建包含的表型表derfinderData
.随机选取两个结构,选取12个样本,其中6个来自胎儿样本,另外6个来自成年个体。对于胎儿样本,PCW中的年龄转化为年的年龄
age_in_years = (age_in_PCW - 40) / 52
在其他数据集中,如果某些观测数据的PCW高达42,则可能需要减去42而不是40。
# #构造brainspanPheno表brainspanPheno < - data.frame(性别= c(“F”、“M”、“M”,“M”,“F”,“F”,“F”,“M”,“F”,“M”,“M”,“F”,“M”,“M”,“M”,“M”,“F”,“F”,“F”,“M”,“F”,“M”,“M”,“F”),实验室= c(“HSB97。艾米”、“HSB92。艾米", "HSB178.AMY", "HSB159.AMY", "HSB153.AMY", "HSB113.AMY", "HSB130.AMY", "HSB136.AMY", "HSB126.AMY", "HSB145.AMY", "HSB123.AMY", "HSB135.AMY", "HSB114.A1C", "HSB103.A1C", "HSB178.A1C", "HSB154.A1C", "HSB150.A1C", "HSB149.A1C", "HSB130.A1C", "HSB136.A1C", "HSB126.A1C", "HSB145.A1C", "HSB123.A1C", "HSB135.A1C"), Age = c(-0.442307692307693, -0.365384615384615, -0.461538461538461, -0.307692307692308, -0.538461538461539, -0.538461538461539, 21, 23, 30, 36, 37, 40, -0.519230769230769, -0.519230769230769, -0.461538461538461, -0.461538461538461, -0.538461538461539, -0.519230769230769, 21, 23, 30, 36, 37, 40) ) brainspanPheno$structure_acronym <- rep(c("AMY", "A1C"), each = 12) brainspanPheno$structure_name <- rep(c("amygdaloid complex", "primary auditory cortex (core)"), each = 12) brainspanPheno$file <- paste0("http://download.alleninstitute.org/brainspan/MRF_BigWig_Gencode_v10/bigwig/", brainspanPheno$lab, ".bw") brainspanPheno$group <- factor(ifelse(brainspanPheno$Age < 0, "fetal", "adult"), levels = c("fetal", "adult"))
然后我们可以保存表型信息,包括在derfinderData
.
保存pheno表(brainspanPheno, file = "brainspanPheno. rdata ")
以下是数据的样子:
library("knitr") ##探索pheno p <- brainspanPheno[, -which(colnames(brainspanPheno) %in% c("structure_acronym", "structure_name", "file"))] kable(p, format = "html", row.names = TRUE)
性别 | 实验室 | 年龄 | 集团 | |
---|---|---|---|---|
1 | F | HSB97。艾米 | -0.4423077 | 胎儿 |
2 | 米 | HSB92。艾米 | -0.3653846 | 胎儿 |
3. | 米 | HSB178。艾米 | -0.4615385 | 胎儿 |
4 | 米 | HSB159。艾米 | -0.3076923 | 胎儿 |
5 | F | HSB153。艾米 | -0.5384615 | 胎儿 |
6 | F | HSB113。艾米 | -0.5384615 | 胎儿 |
7 | F | HSB130。艾米 | 21.0000000 | 成人 |
8 | 米 | HSB136。艾米 | 23.0000000 | 成人 |
9 | F | HSB126。艾米 | 30.0000000 | 成人 |
10 | 米 | HSB145。艾米 | 36.0000000 | 成人 |
11 | 米 | HSB123。艾米 | 37.0000000 | 成人 |
12 | F | HSB135。艾米 | 40.0000000 | 成人 |
13 | 米 | HSB114。糖化血红蛋白 | -0.5192308 | 胎儿 |
14 | 米 | HSB103。糖化血红蛋白 | -0.5192308 | 胎儿 |
15 | 米 | HSB178。糖化血红蛋白 | -0.4615385 | 胎儿 |
16 | 米 | HSB154。糖化血红蛋白 | -0.4615385 | 胎儿 |
17 | F | HSB150。糖化血红蛋白 | -0.5384615 | 胎儿 |
18 | F | HSB149。糖化血红蛋白 | -0.5192308 | 胎儿 |
19 | F | HSB130。糖化血红蛋白 | 21.0000000 | 成人 |
20. | 米 | HSB136。糖化血红蛋白 | 23.0000000 | 成人 |
21 | F | HSB126。糖化血红蛋白 | 30.0000000 | 成人 |
22 | 米 | HSB145。糖化血红蛋白 | 36.0000000 | 成人 |
23 | 米 | HSB123。糖化血红蛋白 | 37.0000000 | 成人 |
24 | F | HSB135。糖化血红蛋白 | 40.0000000 | 成人 |
我们可以证实,这确实是包含的信息derfinderData
.
##重命名我们新创建的pheno数据newPheno <- brainspanPheno ##加载包含的数据库("derfinderData")
## ##附加包:'derfinderData'
##下面的对象被屏蔽__ `。GlobalEnv': ## ## brainspanPheno
##验证相同(newPheno, brainspanPheno)
##[1]真
利用表现型信息,你可以使用derfinder
从这些样本中提取21号染色体的基本覆盖水平信息。然后将数据导出到BigWig文件中。
library("derfinder") ##确定要使用的文件并修复名称文件<- brainspanPheno$file names(files) <- gsub(". amy |. txt ")A1C", "", brainspanPheno$lab) ##加载数据系统。time(fullCovAMY <- fullCoverage(files = files[brainspanPheno$structure_acronym == "AMY"], chrs = "chr21")) #用户系统运行# 4.505 0.178 37.676系统。time(fullCovA1C <- fullCoverage(files = files[brainspanPheno$structure_acronym == "A1C"], chrs = "chr21")) #用户系统运行# 2.968 0.139 27.704 ##写入BigWig文件dir.create("AMY")系统。time(createBw(fullCovAMY, path = "AMY", keepGR = FALSE)) # user system elapsed # 5.749 0.332 6.045 dir.create("A1C") system. time(createBw(fullCovAMY, path = "AMY", keepGR = FALSE))time(createBw(fullCovA1C, path = "A1C", keepGR = FALSE)) #用户系统运行时间# 5.025 0.299 5.323 ##检查每个目录中创建了12个文件all(c(length(dir("AMY")), length(dir("A1C"))) == 12) # TRUE ##保存在Windows上运行的示例数据Save (fullCovAMY, file = "fullCovA1C. rdata ") Save (fullCovA1C, file = "fullCovA1C. rdata ")
这些BigWig文件可以在下面获得extdata如下图所示:
##查找AMY BigWigs目录(系统。file("extdata", "AMY", package = "derfinderData"))
## [1] " hsb113。bw”“HSB123。bw”“HSB126。bw”“HSB130。bw”“HSB135。bw”“HSB136。bw" ## [7] "HSB145。bw”“HSB153。bw”“HSB159。bw”“HSB178。bw”“HSB92。bw HSB97.bw”
##查找A1C BigWigs目录(system。file("extdata", "A1C", package = "derfinderData"))
## [1] " hsb103。bw”“HSB114。bw”“HSB123。bw”“HSB126。bw”“HSB130。bw”“HSB135。bw" ## [7] "HSB136。bw”“HSB145。bw”“HSB149。bw”“HSB150。bw”“HSB154。bw HSB178.bw”
创建小插图的代码
##创建小插图库("rmarkdown") system.time(render("derfinderData. txt ")Rmd", "BiocStyle::html_document")) ## Extract the R code library("knitr") knit("derfinderData.Rmd", tangle = TRUE)
小插图生成的日期。
##[1]“2022-04-28 10:18:49 edt”
生成小插图所花费的挂钟时间。
时差0.557秒
R
会话信息。
会话信息# #────────────────────────────────────────────────────────────────# # # #设置值版本R 4.2.0 RC (2022-04-19 r82224) # # os Ubuntu 20.04.4 LTS # #系统x86_64, ui X11 linux-gnu # # # #语言(EN) # #整理C # # ctype en_US。utf - 8 # # tz美国日期/ New_York # # 2022-04-28 # # pandoc 2.5 @ /usr/bin/(通过rmarkdown) # # # #包────────────────────────────────────────────────────────────────────# #包*版本日期(UTC)自由源# # BiocManager 1.30.17 2022-04-22[2]凹口(R 4.2.0) # # BiocStyle * 2.24.0 2022-04-27 [2] Bioconductor # # bookdown 0.26 2022-04-15[2]凹口(R 4.2.0) # # bslib 0.3.1 2021-10-06[2]凹口(R 4.2.0) # # cli 3.3.0 2022-04-25[2]凹口(R 4.2.0) # # derfinderData * 2.14.0 2022-04-28 [1]Bioconductor # #消化0.6.29 2021-12-01[2]凹口(R 4.2.0) # #评估0.15 2022-02-18[2]凹口(R 4.2.0) # # fastmap 1.1.0 2021-01-25[2]凹口(R 4.2.0) # #泛型0.1.2 2022-01-31[2]凹口(R 4.2.0) # # highr 0.9 2021-04-16[2]凹口(R 4.2.0) # # htmltools 0.5.2 2021-08-25[2]凹口(R 4.2.0) # # httr 1.4.2 2020-07-20[2]凹口(R 4.2.0) # # jquerylib 0.1.4 2021-04-26[2]凹口(R 4.2.0) # # jsonlite 1.8.0 2022-02-22[2]凹口(R 4.2.0) # # knitr * 1.39 2022-04-26[2]凹口(R 4.2.0) # # lubridate 1.8.02021-10-07[2]凹口(R 4.2.0) # # magrittr 2.0.3 2022-03-30[2]凹口(R 4.2.0) # # plyr 1.8.7 2022-03-24[2]凹口(R 4.2.0) # # R6 2.5.1 2021-08-19[2]凹口(R 4.2.0) # # Rcpp 1.0.8.3 2022-03-17[2]凹口(R 4.2.0) # # 2020-11-13 [2] 1.3.0 RefManageR *版本凹口(R 4.2.0) # # rlang 1.0.2 2022-03-04[2]凹口(R 4.2.0) # # rmarkdown 2.14 2022-04-25[2]凹口(R 4.2.0) # # sass 0.4.1 2022-03-23[2]凹口(R 4.2.0) # # sessioninfo * 1.2.2 2021-12-06[2]凹口(R 4.2.0) # # stringi 1.7.6 2021-11-29[2]凹口(R 4.2.0)# # stringr 1.4.0 2019-02-10[2]凹口(R 4.2.0) # # xfun 0.30 2022-03-02[2]凹口(R 4.2.0) # # xml2 1.3.3 2021-11-30[2]凹口(R 4.2.0) # # yaml 2.3.5 2022-02-21[2]凹口(R 4.2.0) # # # # [1] / tmp / Rtmpf4wz69 Rinst14c0422e4ff01 # # [2] /home/biocbuild/bbs - 3.15 bioc / R /图书馆# # # #──────────────────────────────────────────────────────────────────────────────
这个小插图是使用BiocStyle
(oleovich, 2022)knitr
(Xie, 2014)和rmarkdown
(Allaire, Xie, McPherson, Luraschi, Ushey, Atkins, Wickham, Cheng, Chang和Iannone, 2022)在幕后运行。
引用由knitcitations
.
[1]谢永林,谢永林,等。rmarkdown: R动态文档.R包2.14版本。2022.URL:https://github.com/rstudio/rmarkdown.
[2]BrainSpan。“发展中的人类大脑图集[互联网]。由ARRA奖励1RC2MH089921-01, 1RC2MH090047-01和1RC2MH089929-01资助。2011。URL:http://developinghumanbrain.org.
[3]答:Oleś。BiocStyle:小插图和其他Bioconductor文档的标准样式.R包版本为2.24.0。2022.URL:https://github.com/Bioconductor/BiocStyle.
[4]y谢。“编织器:R中可重复研究的综合工具”。:实施可重复计算研究.编著:V. Stodden, F. Leisch和R. D. Peng。ISBN 978 - 1466561595。查普曼和霍尔/CRC, 2014年。URL:http://www.crcpress.com/product/isbn/9781466561595.