多基因表达变化的测量在不同生理条件下有必要揭示基因调控程序,确定细胞表型。
比较基因的表达式的值在给定条件下对参考生物状态通常是用于识别组差异表达基因(度)。这些度指出相关的基因组区域功能在生理条件下的兴趣。
虽然个人全基因组表达研究小信号/噪声比,今天的基因组基因表达数据可用性通常允许结合微分克服这种限制独立研究的结果。
数据库,如地理(https://www.ncbi.nlm.nih.gov/geo/),SRA (https://www.ncbi.nlm.nih.gov/sra)、ArrayExpress (https://www.ebi.ac.uk/arrayexpress/),ENA (https://www.ebi.ac.uk/ena提供系统的访问大量的转录组数据。存在一个以上的基因表达研究对许多生物条件。这可以利用冗余元分析方法揭示基因一致并且在给定条件下差异表达。
MetaVolcanoR旨在识别基因的表达在几项研究一直不安。
MetaVolcanoR R包结合微分基因表达的结果。它实现了三种策略总结基因表达从不同的研究活动。我)随机效应模型(REM)的方法。(二)计票方法,3)假定值combining-approach。MetaVolcano利用火山情节推理可视化基因表达分析结果。
BiocManager::安装(“MetaVolcanoR eval = FALSE)
库(MetaVolcanoR)
用户应提供一个命名的对象列表包含微分基因表达的结果。每个对象的列表
必须包含一个基因名字,一个褶皱变化和一个假定值变量。强烈建议也包括方差或的置信区间褶皱变化变量。
看看演示的数据。它包括结果从五个基因差异表达研究。
数据(diffexplist)类(diffexplist)
# #[1]“列表”
头(diffexplist [[1]])
# #符号Log2FC pvalue CI。L CI。R # # 1 A1BG -0.70126879 0.000140100 -1.0087857 -0.39375189 # # 2 A1BG-AS1 -0.25106351 0.008694757 -0.4304790 -0.07164803 # # 3 A1CF 0.03332573 0.615989488 -0.1036882 0.17033968 # # 4 A2M 0.83504214 0.018550388 0.1568214 1.51326289 # # 5 A2ML1 0.03942552 0.843222358 -0.3728473 0.45169836 # # 6 A4GALT -0.20815882 0.282488068 -0.6025247 0.18620708
长度(diffexplist)
5 # # [1]
的快速眼动MetaVolcano总结了几项研究的基因褶皱变化考虑方差。的快速眼动估计摘要假定值代表的概率摘要叠化不是不同于零。用户可以设置metathr参数突出最不安的最高比例的基因。这个扰动排名后定义topconfects的方法。
meta_degs_rem < rem_mv (diffexp = diffexplist pcriteria =“pvalue foldchangecol = Log2FC, genenamecol =‘象征’,geneidcol = NULL,塌陷= FALSE, llcol = ' CI。L CI, rlcol =。R’, vcol = NULL, cvar = TRUE, metathr = 0.01, jobname =“MetaVolcano outputfolder = "。”=“HTML”, ncores = 1)
# #指数Log2FC_1 CI象征。l1 CI。R_1 vi_1 Log2FC_2 # # 4795 MXRA5 0.8150851 0.3109324 - 1.3192377 0.06616251 - 1.3001104 # # 2 2166 COL6A6 2053 -1.7480348 -2.5780749 -0.9179947 0.17934364 -0.8388366 # # 3 CIDEA不详不详不详不详不详# # 4 7115 SULT1A4 0.9689025 0.5103475 1.4274575 0.05473571 0.7513323 # # 5 130 ACACB -0.8431142 -1.4708480 -0.2153804 0.10257437 -1.1119841 # # 6 6528 SLC27A2 -0.6782948 -0.9931027 -0.3634869 0.02579759 -1.8916655 # # CI。l2 CI。R_2 vi_2 Log2FC_3 CI。L_3 CI。R_3 vi_3 # # 1 0.6603306 1.9398901 0.10654886 1.1895480 0.8401301 1.5389659 0.031781777 # # 2 -1.3578456 -0.3198277 0.07011930 -1.0300519 -1.4730328 -0.5870710 0.051080819 # # 3 NA NA NA -1.0111528 -1.3226326 -0.6996729 0.025255027 # # 4 0.4707021 1.0319624 0.02050012缺缺缺缺# # 5 -1.7417389 -0.4822293 0.10323592 -0.5305046 -0.6957455 -0.3652637 0.007107599 # # 6 -2.6822584 -1.1010726 0.16270229 -1.2126830 -1.6702908 -0.7550753 0.054509799 # # Log2FC_4 CI。L_4 CI。R_4 vi_4 Log2FC_5 CI。L_5 CI。R_5 # # 1 0.2188594 -1.052230 1.4899492 0.4205720 0.8051543 0.1367255 1.4735830 # # 2 -1.3755263 -2.162453 -0.5885999 0.1611967 -0.7213490 -1.5714484 0.1287505 # # 3 -1.7991026 -2.918939 -0.6792665 0.3264351 -0.8738120 -1.6373061 -0.1103179 # # 4 NA NA不详不详不详不详不详# # 5 -0.7991042 -1.457868 -0.1403403 0.1129659 -0.5155929 -0.8606782 -0.1705076 # # 6 -1.3554403 -2.288444 -0.4224370 0.2265970 -1.4905464 -2.5565023 -0.4245905 # # vi_5 signcon ntimes randomSummary randomCi。磅randomCi。乌兰巴托randomP # # 1 0.11630493 - 5 5 1.0333001 0.7882044 1.2783958 0.18811668 1.420312 e-16 # # 2 5 5 -1.0649749 -1.3396138 -0.7903361 0.15173972 2.956522 e-14 # # 3 3 3 -1.0417876 -1.3210774 -0.7624977 2.653168 e-13 # # 4 NA 2 2 0.8106154 0.5712566 1.0499741 0.03099851 3.187477 e-11 # # 5 5 5 -0.5830624 -0.7212245 -0.4449003 1.324963 e-16 # # 6 5 5 -1.2207058 -1.6760435 -0.7653680 1.484852 0.29577833 e-07 # # het_QE het_QEp het_QM het_QMp错误se排名# # 1 0.12504883 4.179945 0.38220032 68.27752 1.420312 e-16假1 # # 2 0.14012185 4.580708 0.33308457 57.76318 2.956522 e-14假2 # # 3 0.14249482 1.980047 0.37156797 53.44957 2.653168 e-13假3 # # 4 0.12212181 0.629179 0.42765661 44.05825 3.187477 e-11假4 # # 5 0.07049086 4.317851 0.36469506 68.41455 1.324963 e-16假5 # # 6 0.23231516 11.099093 0.02547263 27.60901 1.484852 e-07假6
头(meta_degs_rem@metaresult, 3)
# #符号signcon randomSummary randomCi。磅randomCi。乌兰巴托randomP het_QE # # 1 MXRA5 5 1.033300 0.7882044 1.2783958 1.420312 e-16 4.179945 # # 2 COL6A6 5 -1.064975 -1.3396138 -0.7903361 2.956522 4.580708 e-14 # # 3 CIDEA e-13 2.653168 -1.041788 -1.3210774 -0.7624977 1.980047 # # het_QEp het_QM het_QMp错误排名# # 1 0.3822003 68.27752 1.420312 e-16假1 # # 2 0.3330846 57.76318 2.956522 e-14假2 # # 3 0.3715680 53.44957 2.653168 e-13假3
meta_degs_rem@MetaVolcano
draw_forest(记忆= meta_degs_rem基因=“MMP9 genecol =“象征”,foldchangecol =“Log2FC llcol = " CI。L”, rlcol = " CI。R”, jobname = " MetaVolcano ", outputfolder = "。画=“HTML”)
draw_forest(记忆= meta_degs_rem基因=“COL6A6”, genecol =“象征”,foldchangecol =“Log2FC llcol = " CI。L”, rlcol = " CI。R”, jobname = " MetaVolcano ", outputfolder = "。画=“HTML”)
的快速眼动MetaVolcano还允许用户探索森林的一个给定的基因基础上快速眼动结果。
的计票MetaVolcano识别差异表达基因(度)为每一个研究基于用户定义的假定值和褶皱变化阈值。它显示的数量差异表达和镇定的基因研究。此外,它的情节的逆累积分布一致度,这样用户可以识别的基因数量的表达式是摄动至少1或n研究。
meta_degs_vote < votecount_mv (diffexp = diffexplist pcriteria = pvalue, foldchangecol = Log2FC, genenamecol =‘象征’,geneidcol = NULL, pvalue = 0.05, foldchange = 0, metathr = 0.01,塌陷= FALSE, jobname =“MetaVolcano outputfolder = "。”,画=“HTML”)负责人(meta_degs_vote@metaresult, 3)
# #符号deg_1 deg_2 deg_3 deg_4 deg_5 ndeg ddeg idx degvcount # # 1 ABCC3 1 1 1 1 1 5 5 25 2。差异# # 2 ABHD5 1 1 -25年1 1 1 5 5 0。理气# # 3 ACACB 1 1 1 1 1 5 5 -25 0.衰减
meta_degs_vote@degfreq
的计票MetaVolcano可视化基因数量的基础上研究基因被确定为差异表达和基因褶皱改变符号一致性。这意味着一个差异表达基因在五个研究中,从他们三个表达下调,会得到一个信号一致性评分(2 + (3)= 1。基于用户偏好,MetaVolcano能突出顶部metathr比例持续扰动的基因。
meta_degs_vote@MetaVolcano
的combinigMetaVolcano总结了褶皱变化的基因在不同的研究的意思是或中位数根据用户的偏好。此外,combinigMetaVolcano总结了基因差异表达假定值使用费舍尔的方法。的结合MetaVolcano能突出顶部metathr比例持续扰动的基因。
meta_degs_comb < combining_mv (diffexp = diffexplist pcriteria = pvalue, foldchangecol = Log2FC, genenamecol =‘象征’,geneidcol = NULL, metafc =“的意思是”,metathr = 0.01,塌陷= TRUE, jobname =“MetaVolcano outputfolder = "。”,画=“HTML”)负责人(meta_degs_comb@metaresult, 3)
# # 1 # #符号metap metafc idx MMP9 9.002947 e15汽油1.9693517 - 27.66076 # # 2 ACVR1C 3.548802 e-20 -1.2544105 - -24.39818 # # 3和5.674270 e-26 -0.9364936 - -23.64280
meta_degs_comb@MetaVolcano