这个包提供了类和方法来执行生存分析使用转录网络推断研制包,包括Kaplan-Meier和多变量生存分析使用考克斯回归模型。
RTNsurvival 1.21.0
转录网络是可视化复杂生物系统的重要工具,这些系统涉及大量基因和多种调控因子。在之前的研究中,我们实现了研制R/Bioconductor包重建转录调控网络(Fletcher et al. 2013).这个包重构了调控因子,由一个调控因子和它的靶基因组成。一个规则可以进一步用于调查,例如,其表达与生存概率的关联。
RTNsurvival方法生成的规则的集成工具研制转录调节网络重建中使用的同一组样本的生存信息包。存在两个主要的生存分析管道:Cox比例风险方法用于建模规则作为生存时间的预测因子(图1),以及显示基于调节活性的队列分层的Kaplan-Meier分析(图2).对于给定的规则,使用双尾GSEA方法来估计每个单独样本的规则活性(差异富集分数- dES)(Castro et al. 2016),然后使用所有样本的dES分布来评估队列的生存统计数据。这些图可以根据用户的规格进行微调。
这个Vignette使用了RTN包中预先计算的规则:
library(RTN) data(stni, package="RTN")
的?
是一个TNI-class
对象中可用的表达式数据的子集创建的Fletcher2013b
包中。的?
对象包含5个规则(PGR, MYB, E2F2, FOXM1和PTTG1)的最小玩具重建。
方法的摘要可以查看有关用于构建玩具规则的参数的更多信息?
对象。
Summary <- tni。Get (stni, what = "summary")
的RTNsurvival包中为样本提供了生存表?
目的,包括METABRIC研究的临床数据(Curtis et al. 2012)表达式数据最初获得的位置。
库(RTNsurvival)数据(survival.data)
为了运行分析管道,输入数据必须由tnsPreprocess
方法来构建TNS-class
对象。请注意,生存表必须提供时间和事件列,还可以指定关键协变量,以便后续在Cox分析中使用。
rtns <- tni2tnsPreprocess(stni, survivalData = survival. rtns <- tni2tnsPreprocess)data, time = 1, event = 2, endpoint = 120, keycovar = c("Grade","Age"))
生存分析管道依赖于双尾GSEA方法,该方法估计队列中所有样本的调控活性(dES)。的tnsGSEA2
函数调用tni.gsea2
方法。
rtns <- tnsGSEA2(rtns)
一旦dES度量被计算出来tnsGSEA2
函数,那么就有可能运行考克斯分析。
的tnsCox
方法运行Cox多元回归分析,并显示每个指定规则和提供的关键协变量的比例风险,表明每个变量对生存的贡献(图1).该方法使用Bioconductor生存包来拟合Cox模型。
rtns <- tnsCox(rtns) tnsPlotCox(rtns)
图1-该图显示了所有关键协变量和规则的风险比。完全在灰色线右边的线,用红色表示,与危险呈正相关。这意味着该基因高表达的样本预后较差。灰色线越向右或向左,关联越显著。
的tnsKM
方法生成一个Kaplan-Meier图,该图由三个面板组成:队列的排序dES图、关键属性状态图(可选)和Kaplan-Meier图,显示低dES和高dES样本的生存曲线(图2).
机< - tnsKM(机,部分= 2)tnsPlotKM(机,海军学校规则=“FOXM1”,鲜明=列表(c(“ER +”,“呃——”),c(“公关+”、“公关”),c (G1, G2,“G3”),“HT”))
图2- FOXM1的Kaplan-Meier图显示,调节活性高的样本(红色和粉红色)预后较差,因为它们的生存概率低于调节活性低的样本(浅蓝色和深蓝色)。
单个样品的差异富集分析可以用tnsPlotGSEA2
函数。这将生成一个双尾GSEA图,用于一个规则的正靶和负靶的差异表达(图3).这一步花费的时间稍长一些,因为GSEA是针对选定的规则重新计算的,并且因为tnsPlotGSEA2
是用于研制函数tna.plot.gsea2
,生成GSEA图。
tnsPlotGSEA2(rtns, "MB-5115", regs = "FOXM1")
图3- MB-5116样本的双尾GSEA图。这表明FOXM1调控因子的阳性靶点正富集,而阴性靶点负富集。
通过绘制带有所有评估样本和规则的热图,可以获得规则活动的概述。首先,我们需要从TNS对象获得dES值的矩阵。然后,我们可以绘制热图使用pheatmap
函数从pheatmap包中。在本例中,我们还说明了如何从生存数据中合并样本特征。
library(pheatmap) mentscores <- tnsGet(rtns, "regulonActivity") survival。data <- tnsGet(rtns, "幸存者数据")annotation_col <-幸存者。data[,c("ER+", "ER-")] pheatmap(t(mentscores $dif), annotation_col = annotation_col, show_colnames = FALSE, annotation_legend = FALSE)
图4-调节单个肿瘤样本的活性。这张热图显示了两个规则集群。PGR和MYB调控在ER-样品中被抑制,在ER+样品中被激活。另一方面,PTTG1、E2F2和FOXM1调控在ER-样本中被激活,在ER+样本中被抑制。
## R版本4.2.0 RC (2022-04-21 r82226) ##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.4 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.16-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.16-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基础包:## [1]stats graphics grDevices utils datasets methods基础## ##其他附加包:## [1]RTNsurvival_1.21.0 RTNduals_1.21.0 RTN_2.21.0 BiocStyle_2.25.0 ## ##通过命名空间加载(且未附加):[3] matrixstats_1.0 -0 RColorBrewer_1.1-3 ## [5] GenomeInfoDb_1.33.0 tools_1.2.2 ## [9] R6_2.5.1 KernSmooth_2.23-20 ## [11] DBI_1.1.2 BiocGenerics_0.43.0 ## [13] colorspace_2.0-3 gridextra2.3 ## [15] tidyselect_1.1.2 compiler_4.2.0 ## [17] cli_3.3.0 Biobase_2.57.0 ## bbbdelayedarray_0.23.0 bookdown_0.26 ## [21] sass_0.4.1 scales_1.2.0 ## [23] proxy_0.4-26 string_1 .4.0 ## [25] digest_0.6.29 mixtools_1.2.0 ## [27]rmarkdown_2.14 XVector_0.37.0 # # [29] pkgconfig_2.0.3 htmltools_0.5.2 # # [31] MatrixGenerics_1.9.0 highr_0.9 # # [33] fastmap_1.1.0 dunn.test_1.3.5 # # [35] limma_3.53.0 pwr_1.3-0 # # [37] rlang_1.0.2 jquerylib_0.1.4 # # [39] generics_0.1.2 jsonlite_1.8.0 # # [41] viper_1.31.0 dplyr_1.0.8 # # [43] car_3.0-12 rcurl_1.98 - 1.6 # # [45] magrittr_2.0.3 GenomeInfoDbData_1.2.8 # # [47] Matrix_1.4-1 Rcpp_1.0.8.3 # # [49] munsell_0.5.0 S4Vectors_0.35.0 # # [51] fansi_1.0.3 abind_1.4-5 # # [53] lifecycle_1.0.1minet_3.55.0 ## [55] stringi_1.7.6 yaml_2.3.5 ## [57] carData_3.0-5 MASS_7.3-57 ## [59] SummarizedExperiment_1.27.0 zlibbioc_1.43.0 ## [61] grid_4.2.0 parallel_2.0 ## [63] crayon_1.5.1 egg_0.4.5 ## [67] magtic_2.7.3 knitr_1.38 ## [69] pillar_1.7.0 igraph_1.3.1 ## [71] GenomicRanges_1.49.0 stats4_4.2.0 ## [73] glue_1.6.2 evaluate_0.15 ## [75] data.table_1.14.2 BiocManager_1.30.17 ## [79] purrr_0.3.4 kernlab_0.9-30 ## [81]assertthat_0.2.1 ggplot2_3.3.5 ## [83] xfun_0.30 e1071_1.7 . 9 ## [85] RedeR_2.1.0 class_7.3-20 ## [87] survivval_3 . 3.3-1 tibble_3.1.6 ## [89] snow_0.4-4 pheatmap_1.0.12 ## [91] IRanges_2.31.0 ellipsis_0.3.2
卡斯特罗,毛罗,伊内斯·德·圣地亚哥,托马斯·坎贝尔,考特尼·沃恩,特蕾莎·希基,伊迪丝·罗斯,韦恩·提利,弗洛里安·马科韦茨,布鲁斯·庞德和克斯汀·梅耶。“通过综合网络分析确定乳腺癌遗传风险的调控因子。”自然遗传学48(1): 12-21。https://doi.org/10.1038/ng.3458.
Curtis, Christina, Sohrab P. Shah, Suet-Feung Chin, Gulisa Turashvili, Oscar M. Rueda, Mark J. Dunning, Doug Speed等,2012。“2000个乳腺肿瘤的基因组和转录组结构揭示了新的亚群。”自然486: 346 - 52。https://doi.org/10.1038/nature10983.
弗莱彻,迈克尔,毛罗·卡斯特罗,陈雪峰,奥斯卡·鲁埃达,王欣,卡洛斯·卡尔达斯,布鲁斯·彭德,弗洛里安·马科维茨和克斯汀·梅耶。2013。“FGFR2信号传导和乳腺癌风险的主要调控因子。”自然通讯4: 2464。https://doi.org/10.1038/ncomms3464.