内容

注意:可以找到这个小插图的最新版本在这里还有一个简短的概述幻灯片在这里

1介绍

systemPipeRdata是一个辅助包生成一个单一的命令NGS工作流模板,打算由它的父包使用systemPipeR(Girke 2014)。后者是建筑的环境端到端具有自动报告生成的分析管道,适用于下一代序列(NGS)应用,如RNA-Seq,核糖核酸- seq, ChIP-Seq, VAR-Seq等。使用的工作流模板的目录结构和样例数据systemPipeRdata描述在这里

回到目录

2开始

2.1安装

R软件的使用systemPipeRdata可从凹口。的systemPipeRdatazR ' {R install, eval=FALSE} source("//www.andersvercelli.com/biocLite.R”)#来源生物电池。Rinstallation script biocLite(“tgirke/systemPipeRdata”, build_vignettes=TRUE, dependencies=TRUE) # Installs from github biocLite(“systemPipeRdata”) # Installs from Bioconductor once available there ```
回到目录

2.2加载包和文档

library("systemPipeRdata") #加载包
#列出包信息vignette("systemPipeRdata") #打开vignette
回到目录

2.3生成工作流模板

将一个可用的NGS工作流加载到当前工作目录中。下面的代码为varseq模板。生成的工作流目录的名称可以在mydirname论点。默认的使用所选工作流的名称。如果已经存在相同名称和路径的目录,则会发出错误。

genWorkenvir(工作流="varseq", mydirname=NULL) settwd ("varseq")

在Linux和OS X系统上,可以使用以下命令从终端的命令行实现相同的操作。{.sh generate_workenvir_from_shell, eval=FALSE} $ Rscript -e "systemPipeRdata::genWorkenvir(workflow='varseq', mydirname=NULL)"

生成的工作流模板genWorkenvir包含以下预配置的目录结构:

workflow_name/ # *. rnw /*。限制型心肌病scripts and targets file param/ # parameter files for command-line software data/ # inputs e.g. FASTQ, reference, annotations results/ # analysis result files
回到目录

2.4运行工作流

接下来,通过执行相应的代码,从R中运行所选的示例工作流*。Rnw模板文件。如果您愿意,请使用相应的*。Rmd*。R可以使用版本。或者,可以通过从命令行执行单个命令从头到尾运行整个工作流“让- b”在工作流目录中(这里)“varseq”).关于运行和自定义的更多详细信息systemPipeR工作流在其概述小插图中可用在这里。这个小插图也可以用下面的命令从R中打开。

library("systemPipeR") #从Bioconductor加载需要通过biocLite()安装的systemPipeR
vignette("systemPipeR", package = "systemPipeR")
回到目录

2.5返回示例数据的路径

提供的样例数据的位置systemPipeRdata可以退货吗列表

pathList ()
# # # #美元目标[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata extdata /参数/ targets.txt”targetsPE美元# # # # # #[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata extdata /参数/ targetsPE.txt”annotationdir美元# # # # # #”[1]/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 systemPipeRdata / extdata /注释 /" ## ## $ fastqdir # #[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata / extdata / fastq /" ## ## $ bamdir # #[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata / extdata / bam /" ## ## $ paramdir # # [1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata / extdata /参数 /" ## ## $ 工作流# #[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata / extdata /工作流 /" ## ## $ chipseq # #[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata extdata /工作流/ chipseq /" ## ## $ rnaseq # #[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata extdata /工作流/ rnaseq /" ## ## $ riboseq # #[1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata extdata /工作流/ riboseq /" ## ## $ varseq # # [1]“/ tmp / Rtmpb7VM8D / Rinst35e8255055c9 / systemPipeRdata / extdata /工作流/ varseq /”
回到目录

3.版本信息

sessionInfo ()
## R版本3.4.2(2017-09-28)##平台:x86_64-pc-linux-gnu(64位)##运行在:Ubuntu 16.04.3 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.6-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.6-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC=C LC_TIME=en_US。## [4] LC_COLLATE=C LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME=C LC_ADDRESS=C ## [10] LC_TELEPHONE=C LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats4并行统计图形grDevices utils数据集方法基础## ##其他附加包:## [1] systemPipeRdata_1.6.0 systemPipeR_1.12.0 ShortRead_1.36.0 ## [4] GenomicAlignments_1.14.0 SummarizedExperiment_1.8.0 delayedarray_1 .4.0 ## [7] matrixStats_0.52.2 Biobase_2.38.0 BiocParallel_1.12.0 ## [10] Rsamtools_1.30.0 Biostrings_2.46.0 xvector_1 .18.0 ## [13] GenomicRanges_1.30.0 GenomeInfoDb_1.14.0 IRanges_2.12.0 ## [16] S4Vectors_0.16.0 BiocGenerics_0.24.0 BiocStyle_2.6.0 ## ##通过命名空间加载(未连接):## [1] edgconfig_2 .0.1 xml_3 .98- 1.13 bit64_0.9-7 splines_3.4.2 ## [5] assertthat_0.2.0 latticeExtra_0.6-28 RBGL_1.54.0 blob_1.1.0 ## [9] GenomeInfoDbData_0.99.1 yaml_2.1.14 Category_2.44.0 progress_1.1.2 ## [13] RSQLite_2.0 backports_1.1.1 lattice_0.20-35 limma_3.34.0 ## [13] digest_0.6.12 checkmate_1.8.5 RColorBrewer_1.1-2 colorspace_1.3-2 ## [21] htmltools_0.3.6 matrix_1.2 - 8.4 GSEABase_1.40.0 ## [25] pkgconfig_2.0.1 XML_3.98-1.9 pheatmap_1.0.8 biomaRt_2.34.0 ## [29] genefilter_1.60.0bookdown_0.5 zlibbioc_1.24.0 go . db_4.2 ## [33] xtable_1.8-2 scales_0.5.0 brew_1.0-6 tibble_1.3.4 ## [37] annotate_1.56.0 ggplot2_2.2.1 GenomicFeatures_1.30.0 lazyeval_0.2.1 ## [41] survival_2.41-3 magrittr_1.5 memoise_1.1.0 evaluate_0.10.1 ## [45] fail_1.3 hwriter_1.3.2 GOstats_2.44.0 graph_1.56.0 ## [49] tools_3.4.2 prettyunits_1.0.2 BBmisc_1.11 stringgr_1 .2.0 ## [53] sendmailR_1.2-1 munsell_0.4.3 locfit_1.5-9.1 AnnotationDbi_1.40.0 ## [57] compiler_3.4.2 rlang_0.1.2 grid_3.4.2 RCurl_1.95-4.8## [61] rjson_type .2.15 annotationforge_type .20.0 base64enc_0.1-3 bitops_1.0-6 ## [65] rmarkdown_1.6 codetools_0.2-15 gtable_type .2.0 DBI_0.7 ## [69] r6_type .2.2 knitr_type .17 rtracklayer_1.38.0 bit_1.1-12 ## [73] rprojroot_1.2 rgraphviz_type .22.0 string_type .1.5 BatchJobs_1.6 ## [77] rcpp_type .12.13
回到目录

4资金

该项目由美国国立卫生研究院(NIH)和美国国家科学基金会(NSF)资助。

回到目录

参考文献

托马斯·吉克,2014。systemPipeR: NGS工作流和报表生成环境。加州大学河滨分校。https://github.com/tgirke/systemPipeR