1简介

在各种转录后RNA修饰中,2’-O甲基化常见于rRNA和tRNA。它们促进核糖的内do构象,并通过防止对3’-磷酸的亲核攻击而赋予抗性碱性降解,特别是在高pH条件下被束化的柔性RNA中。可以使用名为RiboMethSeq的方法查询此属性(Birkedal et al. 2015)RNA在碱性条件下处理,RNA片段用于制备测序文库(Marchand et al. 2017)

在含有2 ' -O甲基化的位置,读端频率较低,用于检测和评分2 ' -O甲基化。

ModRiboMethSeq类使用ProtectedEndSequenceData类沿转录本存储和聚合数据。计算的分数遵循的命名(Birkedal et al. 2015;Galvanin et al. 2019)上面有名字scoreRMS(默认),scoreA,scoreB而且scoreMean

## snapshotDate(): 2022-04-28
库(RNAmodR.RiboMethSeq)库(RNAmodR.Data)

2示例工作流

由于原始数据的大小有限,该示例工作流仅限于5.8S rRNA上的两个2 ' -O甲基化位置。对于注释数据,可以使用gff文件或TxDb对象,对于序列数据为fasta文件或BSgenome对象可以使用。数据以bam文件的形式提供。

annotation <- GFF3File(RNAmodR.Data.example.RMS.gff3()) sequences <- RNAmodR.Data.example.RMS.fasta() files <- list("Sample1" = c(processed = RNAmodR.Data.example.RMS.1()), "Sample2" = c(processed = rnamodr . data .example. rff3 . rff3 ()))

3.数据分析

分析是由构造一个ModSetRiboMethSeq对象。内部并行化通过BiocParallel包,这将允许根据输入文件的数量/大小(样本的数量,复制的数量,转录的数量等)进行优化。

msrms <- ModSetRiboMethSeq(files, annotation = annotation, sequences = sequences)
从文件中导入基因组特征作为GRanges对象…准备“元数据”数据帧…##创建TxDb对象…好吧
msrms
## ModSetRiboMethSeq长度为2 ##名称(2):Sample1 Sample2 ## |修改类型(s): Am / Cm / Gm / Um ## Sample1 Sample2 ## |修改发现:no yes(1) ## |设置:## minCoverage minreplication find。mod maxLength minSignal flankingRegion ##       ## Sample1 10 1 TRUE 50 10 6 ## Sample2 10 1 TRUE 50 10 6 ## minScoreA minScoreB minscoerms minScoreMean flankingRegionMean ## <数字> <数字> <数字> <数字> <整数> ## Sample1 0.6 3.6 0.75 0.75 2 ## Sample2 0.6 3.6 0.75 0.75 2 ## weights ##  ## Sample1 0.9,1.0,0.0,…##样本2 0.9,1.0,0.0,…## scoreOperator ## <字符> ##采样1 & ##采样2 &

4可视化结果

为了比较样本,我们需要知道,哪些位置应该是比较的一部分。这可以通过在所有样本上聚合检测并使用联合或交叉或使用发布数据来实现。我们希望利用来自snoRNAdb的信息组装来自后者的GRanges对象(雷斯垂德和韦伯2006)

在这个特定的例子中,只使用了5.8S RNA的信息,否则示例数据会太大。有关父节点和seqname的信息必须与用作注释数据的信息相匹配。的输出是否匹配范围()在一个SequenceData,修饰符奥得河ModifierSet对象。

table <- read.csv2(RNAmodR.Data.snoRNAdb(), stringsAsFactors = FALSE)
RNAmodR。数据和browseVignettes('RNAmodR.Data')用于文档
##从缓存加载
table <- table[table$hgnc_id == "53533",] #子集到rna58 s #只保留当前坐标table <- table[,1L:7L] snoRNAdb <- GRanges(seqnames = "chr1", ranges = IRanges(start =表$position, width = 1), strand = "+", type = "RNAMOD", mod =表$ modify, Parent = "1", #this is transcript id Activity = IRanges::CharacterList(strsplit(表$guide,",")) coord <- split(snoRNAdb,snoRNAdb$Parent)

除了发表的坐标之外,我们还希望包括更有意义的文本名称。为此,我们提供了data.frame有两列,tx_id而且的名字.第一列中的所有值都必须匹配成绩单id。

范围(msrms)
## seqnames ranges strand | exon_id exon_name exon_rank ##    |    ## [1] chr1 1-157 + | 1 ## ------- ## seqinfo: 1个来自未指定基因组的序列;没有seqlengths
alias <- data.frame(tx_id = "1", name = "5.8S rRNA", stringsAsFactors = FALSE)
plotCompareByCoord(msrms[c(2L,1L)], coord, alias = alias)
热图显示5.8S rRNA上2'-O甲基化位置的RiboMethSeq评分。

图1:热图显示5.8S rRNA上2 ' -O甲基化位置的RiboMethSeq评分

通过选择特定的坐标进行比较,还可以在序列级别上比较结果。

singleCoord <- coord[[1L]][1L,] plotDataByCoord(msrms, singleCoord)
RiboMethSeq在5.8S rRNA上的得分在Um(14)左右。

图2:RiboMethSeq在5.8S rRNA上的得分在Um(14)左右

默认情况下,只显示RiboMethSeq分数和ScoreMean。原始序列数据也可以检查

singleCoord <- coord[[1L]][1L,] plotDataByCoord(msrms, singleCoord, showSequenceData = TRUE)
RiboMethSeq在5.8S rRNA上的得分在Um(14)左右。序列数据通过设置“showSequenceData = TRUE”来显示。

图3:RiboMethSeq在5.8S rRNA上的得分在Um(14)左右
序列数据通过设置显示showSequenceData = TRUE

5性能

要结合所使用的样本访问该方法的性能,请使用plotROC函数。

plotROC (msrms coord)
TPR与FPR的对比图。

图4:TPR与FPR的对比图

这里给出的例子应该被视为概念的证明。根据结果,调用修改位置的最小分数可以根据个人需求进行调整。

settings(msrms) <- list(minScoreMean = 0.7) msrms
## ModSetRiboMethSeq长度为2 ##名称(2):Sample1 Sample2 ## |修改类型(s): Am / Cm / Gm / Um ## Sample1 Sample2 ## |修改发现:no yes(1) ## |设置:## minCoverage minreplication find。mod maxLength minSignal flankingRegion ##       ## Sample1 10 1 TRUE 50 10 6 ## Sample2 10 1 TRUE 50 10 6 ## minScoreA minScoreB minscoerms minScoreMean flankingRegionMean ## <数字> <数字> <数字> <数字> <整数> ## Sample1 0.6 3.6 0.75 0.7 2 ## Sample2 0.6 3.6 0.75 0.7 2 ## weights ##  ## Sample1 0.9,1.0,0.0,…##样本2 0.9,1.0,0.0,…## scoreOperator ## <字符> ##采样1 & ##采样2 &
##警告:在数据聚合或修改搜索后,设置被更改。使用modify(x,force = TRUE)重新运行以更新当前设置。

正如警告所建议的,在修改设置之后,应该通过运行来更新结果修改(x,force = TRUE)

msrms <- modify(msrms,force = TRUE)

6会话信息

sessionInfo ()
## R版本4.2.0 RC (2022-04-21 r82226) ##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.4 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.16-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.16-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats4 stats graphics grDevices utils datasets methods ##[8]基础## ##其他附加包:# # # # [1] Rsamtools_2.13.0 RNAmodR.Data_1.11.0 [3] ExperimentHubData_1.23.0 AnnotationHubData_1.27.1 # # [5] futile.logger_1.4.3 ExperimentHub_2.5.0 # # [7] AnnotationHub_3.5.0 BiocFileCache_2.5.0 # # [9] dbplyr_2.1.1 RNAmodR.RiboMethSeq_1.11.0 # # [11] RNAmodR_1.11.0 Modstrings_1.13.0 # # [13] Biostrings_2.65.0 XVector_0.37.0 # # [15] rtracklayer_1.57.0 GenomicRanges_1.49.0 # # [17] GenomeInfoDb_1.33.1 IRanges_2.31.0 # # [19] S4Vectors_0.35.0 BiocGenerics_0.43.0 # # [21] BiocStyle_2.25.0 # # # #通过命名空间(并且没有附加):## [9] ensembldb_2.21.1 htmltools_0.5.2 ## [11] magick_2.7.3 fansi_1.0.3 ## [13] magrittr_2.0.3 checkmate_2.1.0 ## [15] memoise_2.0.1 BSgenome_1.65.0 ## [17] cluster_2.1.3 rocr_1 . 11 ## [19] matrixStats_0.62.0 prettyunits_1.1.1 ## [23] blob_1.2.3 rappdirs_0.3.3 ## [25] xfun_0.30 dplyr_1.0.9 ## [27] crayon_1.5.1rcurl_1.98 - 1.6 # # [29] jsonlite_1.8.0 graph_1.75.0 # # [31] survival_3.3-1 VariantAnnotation_1.43.0 # # [33] glue_1.6.2 gtable_0.3.0 # # [35] zlibbioc_1.43.0 DelayedArray_0.23.0 # # [37] scales_1.2.0 futile.options_1.0.1 # # [39] DBI_1.1.2 Rcpp_1.0.8.3 # # [41] xtable_1.8-4 progress_1.2.2 # # [43] htmlTable_2.4.0 foreign_0.8 - 82 # # [45] bit_4.0.4 OrganismDbi_1.39.0 # # [47] Formula_1.2-4 AnnotationForge_1.39.0 # # [49] htmlwidgets_1.5.4 httr_1.4.2 # # [51] RColorBrewer_1.1-3 ellipsis_0.3.2 # # [53]## [57] nnet_7.3-17 sass_0.4.1 ## [59] utf8_1.2.2 labeling_0.4.2 ## [61] tidyselect_1.1.2 rlang_1.0.2 ## [63] reshape2_1.4.4 later_1.3.0 ## [65] AnnotationDbi_1.59.0 biocViews_1.65.0 ## [67] munsell_0.5.0 BiocVersion_3.16.0 ## [69] tools_4.2.0 cachem_1.0.6 ## [71] cli_3.3.0 generics_0.1.2 ## [73] RSQLite_2.2.13 evaluate_0.15 ## [77] yaml_2.3.5 knitr_1.39 ## [79] bit64_4.0.5 purrr_0.3.4 ## [81] KEGGREST_1.37.0 AnnotationFilter_1.21.0 ## [83] RBGL_1.73.0 mime_0.12 ## [85] formatR_1.12 xml2_1.3.3 ## [87] biomaRt_2.53.0 compiler_4.2.0 ## [89] rstudioapi_0.13 filelock_1.0.2 ## [91] curl_4.3.2 png_0.1-7 ## [93] interactiveDisplayBase_1.35.0 tibble_3.1.6 ## [95] bslib_0.3.1 stringi_1.7.6 ## [97] highr_0.9 GenomicFeatures_1.49.1 ## [99] lattice_0.20-45 ProtGenerics_1.29.0 ## [101] Matrix_1.4-1 vctrs_0.4.1 ## [103] stringdist_0.9.8 BiocCheck_1.33.0 ## [105] pillar_1.7.0 lifecycle_1.0.1 ## [107] RUnit_0.4.32 BiocManager_1.30.17 ## [109] jquerylib_0.1.4 data.table_1.14.2 ## [111] bitops_1.0-7 httpuv_1.6.5 ## [113] colorRamps_2.3 R6_2.5.1 ## [115] BiocIO_1.7.0 latticeExtra_0.6-29 ## [117] bookdown_0.26 promises_1.2.0.1 ## [119] gridExtra_2.3 codetools_0.2-18 ## [121] lambda.r_1.2.4 dichromat_2.0-0 ## [123] assertthat_0.2.1 SummarizedExperiment_1.27.1 ## [125] rjson_0.2.21 withr_2.5.0 ## [127] GenomicAlignments_1.33.0 GenomeInfoDbData_1.2.8 ## [129] parallel_4.2.0 hms_1.1.1 ## [131] grid_4.2.0 rpart_4.1.16 ## [133] rmarkdown_2.14 MatrixGenerics_1.9.0 ## [135] biovizBase_1.45.0 Biobase_2.57.0 ## [137] shiny_1.7.1 base64enc_0.1-3 ## [139] restfulr_0.0.13

参考文献

Birkedal, Ulf, Mikkel Christensen-Dalsgaard, Nicolai Krogh, Radhakrishnan Sabarinathan, Jan Gorodkin和Henrik Nielsen, 2015。高通量测序分析核糖甲基化RnaAngewandte Chemie(英文国际版)54(2): 451-55。https://doi.org/10.1002/anie.201408362

伽凡宁,艾德琳,莉莉娅·阿亚迪,马克·赫尔姆,尤里·莫德林和维吉妮·马钱德。“用Ribomethseq绘制和定量tRNA 2’- o甲基化”纳伦德拉·瓦贾佩耶和罗米·古普塔编辑,273-95页。https://doi.org/10.1007/978-1-4939-8808-2_21

莱斯垂德,劳伦特,米歇尔·j·韦伯,2006。“snoRNA-LBME-db,人类H/ACA和C/D盒snorna的综合数据库。”核酸研究34(1月):D158-D162。https://doi.org/10.1093/nar/gkj002

马钱德,弗吉尼亚,莉莉娅·阿亚迪,阿赛尔·埃尔·哈吉,弗洛伦斯·布洛伊尔-奥罗,马克·赫尔姆和尤里·莫德林,2017。“利用下一代测序技术(Illumina Ribomethseq协议)高通量定位Rna中2’-O-Me残基。”分子生物学方法(克里夫顿,新泽西州)1562: 171 - 87。https://doi.org/10.1007/978-1-4939-6807-7_12