内容

1概述

生物网络中的循环模式可能反映了多种生物过程中的关键作用(Bracken, Scott,和Goodall 2016)例如,转录因子和microRNAs之间的调控循环(Zhang et al. 2015)RTNduals的生成的监管网络,搜索对监管者之间的监管模式研制方案(详情请参阅研制的文档)(卡斯特罗等,2016).在这样的网络中,每个调控因子都有一组相关联的靶基因(即一个调控因子),当我们评估一对调控因子之间的共享目标时,我们发现三胞胎可能被正向或负向调控,调控因子在调控网络中要么合作,要么竞争。的推理双重调节子需要三个互补的统计量:(1)基于调节器和目标之间的互信息(MI)将目标分配给规则。通过排列和自举分析评估MI统计的显著性。(2)通过相关分析确定任意两个调控之间的共享目标,并评估调控的相似性(即正向或负向)。(3)进行一项测试,以确定共享目标的数量是否偶然高于预期。的示意图图1显示调节器之间形成的两个三联。在(一个)两个调节机构通过向同一方向影响共同目标(共同激活或共同抑制)进行合作,而在(b)它们相互竞争,对相反方向的目标产生影响。对于基因表达数据,典型的调控因子可能包括转录因子、miRNAs、eRNAs和lncRNAs。

标题图1.监管者和预测关联的例子。该图说明了调节器之间形成的四个三元组(一个).调节器R1和R2共同激活或共同抑制共享的目标。(b)监管机构R1和R2相互竞争,对目标产生相反方向的影响。

2快速启动

RTNduals工作流从一个预处理步骤开始,该步骤生成一个TNI-class对象从表达式矩阵和调节器列表中获取。表达矩阵通常从多个样本中获得(例如,来自癌症队列的转录组),而调控因子列表代表一些先前的生物学信息,表明表达矩阵中的哪些基因应该被视为调控因子。输入数据还可以处理不同类型的调节器;例如,基因和microrna。在这种情况下,表达矩阵应该包括mRNA和miRNA的表达值。

2.1加载数据集

此示例提供生成TNI-class对象。数据集tniData可从研制包,包含一个包含6个对象的R列表,其中3个将用于后续的分析:(1)expData,一个包含120个样本的命名基因表达矩阵(基因按行排列,样本按cols排列),(2)rowAnnotation,一个带有Probe-to-ENTREZ注释的data.frame, (3)tfs,一个列出转录因子的字符向量。对这些数据集进行提取、预处理和缩小弗莱彻等人(2013),并应视为仅供示范之用的例子。

##——加载演示库(RTNduals)数据包和数据集("tniData", package = "RTN") gexp <- tniData$expData annot <- tniData$rowAnnotation tfs <- c("IRF8","IRF1","PRDM1","E2F3","STAT4","LMO4","ZNF552")

2.2预处理

肿瘤基因数据矩阵和相应的注释由tni.constructor函数,以检查输入数据的一致性。在这一步之后,生成一个预处理的文件TNI-class对象,其状态被更新为'预处理[x] '。

##——生成一个预处理的tni类对象rtni <- tni。构造函数(gexp, regulatoryElements = tfs, rowAnnotation=annot)

2.3运行排列分析

tni.permutation方法取预处理后的TNI-class对象,并返回一个通过互信息分析(带有多个假设检验修正)推断出的调控网络。

##——计算一个调节网络(set nPermutations>=1000) rtni <- tni。排列(rtni nPermutations = 100, pValueCutoff = 0.05)

2.4运行启动分析

除了置换分析,调节网络的稳定性是通过自举评估使用tni.bootstrap函数。

##——检查管理网络的稳定性(设置nBootstrap>=100) rtni <- tni. ##——检查管理网络的稳定性(设置nBootstrap>=100)引导(rtni nBootstrap = 10)
注:我们建议设置'eps = NA',以便从排列和引导步骤中计算的经验空分布估算阈值。rtni < - tni.dpi。滤波器(rtni, eps = NA)

2.5构造mbr类对象,应用DPI算法

在一个给定的监管网络中,每个目标都可以通过直接和间接的相互作用与多个监管机构相联系。数据处理不等式(DPI)算法(Meyer, Lafitte,和Bontempi 2008)用于去除两个调节器和一个共同目标之间最弱的相互作用。

##——构造一个mbr对象并应用DPI算法rmbr <- tni2mbrPreprocess(rtni)

2.6运行规则之间的关联分析

mbrAssociation方法使用前面步骤计算的转录网络,枚举由两个调控子和一个共享靶体组成的所有三联。该方法检索调控器之间的相互信息,并利用相关分析评估预测下游效应之间的一致性。费雪精确度检验用于评估共享目标的数量是否比预期的概率大。

##——双规则测试协会rmbr <- mbrAssociation(rmbr)

可以从“rmbr”使用mbrGet函数。

##——查看summary mbrGet(rmbr, what="summary")
## $MBR ## $MBR$对偶##测试预测##对偶21 3 ## ## ## $TNI ## $TNI$tnet ##监管者目标边缘## tnet。参考7 2396 6610 ## tnet。dpi 7 2396 3857 ## ## $TNI$regulonSize ##最小第1曲。中值平均第3曲。最大值。# # tnet。Ref 661 866.0 890 944.2857 1084 1159 ## tnet。Dpi 329 432.5 533 551.0000 699 732
##——获取结果重叠<- mbrGet(rmbr, what="dualsOverlap") correlation <- mbrGet(rmbr, what="dualsCorrelation")

此外,当已有证据可用时,该方法可以添加一个关于调节器之间关联的“补充表”。“supplementaryTable”是一个“data.frame”,列出了任意两个调节器之间的唯一关系(有关输入数据格式的详细信息,请参阅文档)。

3.会话信息

## R版本4.2.0 RC (22-04-19 r82224) ##平台:x86_64-pc-linux-gnu(64位)##运行在:Ubuntu 20.04.4 LTS ## ##矩阵产品:default ## BLAS: /home/biocbuild/bbs-3.15-bio /R/lib/libRblas. ##因此## LAPACK: /home/biocbuild/bbs-3.15-bio /R/lib/libRlapack。因此## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# [3] LC_TIME=en_GB LC_COLLATE= c# [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# [9] LC_ADDRESS=C LC_TELEPHONE= c# [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats graphics grDevices utils datasets methods base ## ##其他附加的包:## [1]RTNduals_1.20.0 RTN_2.20.0 BiocStyle_2.24.0 ## ##通过命名空间加载(并没有附加):# [1] lattice_0.20-45 viper_1.30.0 ## [3] class_7.3-20 snow_0.4-4 ## [5] digest_0.6.29 R6_2.5.1 ## b[7] GenomeInfoDb_1.32.0 stats4_4.2.0 ## [9] evaluate_0.15 e1071_1.7-9 ## [11] zlibbioc_1.42.0 rlang_1.0.2 ## [13] data.table_1.14.2 car_3.0-12 ## [15] jquerylib_0.1.4 kernlab_0.9-30 ## [17] S4Vectors_0.34.0 Matrix_1.4-1 ## [19] rmarkdown_2.14 splines_4.2.0 ## [21] pwr_1. 1.3-0 stringgr_1 .4.0 ## [23] mixtools_1.2.0 munsell_0.5.0 ## [25] igraph_1.3.1 pheatmap_1.0.12 ## [27] RCurl_1.98-1.6 proxy_0.4-26 ## [11]# # # # [29] DelayedArray_0.22.0 compiler_4.2.0 [31] xfun_0.30 pkgconfig_2.0.3 # # [33] BiocGenerics_0.42.0 segmented_1.5-0 # # [35] htmltools_0.5.2 SummarizedExperiment_1.26.0 # # [37] GenomeInfoDbData_1.2.8 bookdown_0.26 # # [39] IRanges_2.30.0 matrixStats_0.62.0 # # [41] MASS_7.3-57 bitops_1.0-7 # # [43] grid_4.2.0 lifecycle_1.0.1 # # [45] gtable_0.3.0 jsonlite_1.8.0 # # [47] magrittr_2.0.3 scales_1.2.0 # # [49] minet_3.54.0 KernSmooth_2.23-20 # # [51] cli_3.3.0 stringi_1.7.6 # # [53] carData_3.0-5## [57] RColorBrewer_1.1-3 tools_4.2.0 ## [59] Biobase_2.56.0 MatrixGenerics_1.8.0 ## [61] abind_1.4-5 parallel_4.2.0 ## [63] fastmap_1.1.0 survival val_3.3-1 ## [65] yaml_2.3.5 colorspace_2.0-3 ## [67] RedeR_2.0.0 BiocManager_1.30.17 ## [69] genomics icranges_1 .48.0 knitr_1.38 ## [71] sass_0.4.1

参考文献

布莱肯,卡梅伦P,哈米什S.斯科特,格雷戈里J.古道尔,2016。癌症中microRNA功能和功能障碍的网络生物学视角。Nat牧师麝猫17(12): 719 - 32。http://dx.doi.org/10.1038/nrg.2016.134

卡斯特罗,Mauro, Ines de Santiago, Thomas Campbell, Courtney Vaughn, Theresa Hickey, Edith Ross, Wayne Tilley, Florian Markowetz, Bruce Ponder和Kerstin Meyer, 2016。“通过综合网络分析确定乳腺癌遗传风险的调节者。”自然遗传学(1): 48 12-21。https://doi.org/10.1038/ng.3458

Michael Fletcher, Mauro Castro, Suet-Feung Chin, Oscar Rueda, Wang Xin, Carlos Caldas, Bruce Ponder, Florian Markowetz和Kerstin Meyer. 2013。“掌握FGFR2信号与乳腺癌风险的调控因子。”自然通讯4: 2464。https://doi.org/10.1038/ncomms3464

迈耶,帕特里克,弗雷德里克·拉菲特和吉安卢卡·邦坦皮,2008。Minet:用于使用互信息推断大型转录网络的R/生物导体包。BMC生物信息学9(1): 461。https://doi.org/10.1186/1471-2105-9-461

张红梅,邝淑珍,熊旭深,高天柳云,刘成林,郭安远。2015。转录因子和microRNA协同调控环:生物过程和疾病中的重要调控基序。简报的生物信息学16(1): 45-58。https://doi.org/10.1093/bib/bbt085