topconfects的概述

保罗•哈里森

2022-04-26

TOP结果由自信效应大小。Topconfects是一个R包,用于RNA-seq或微阵列差异表达分析和类似的东西,我们感兴趣的是对来自少数样本的许多效应大小(每个基因一个)设置置信度边界,并根据这些置信度效应大小对基因进行排序。

Topconfects在此基础上构建治疗由limma和edgeR包提供的p值,或由DESeq2提供的“greaterAbs”测试p值。它尝试了一系列的折叠变化,并在保持给定的FDR的同时,利用这一结果根据效应大小对基因进行排名。这也产生了折叠变化的置信边界,调整了多次测试。

该方法描述如下:

哈里森PF,帕蒂森AD,鲍威尔DR,贝尔哈尔兹TH。2018.Topconfects:一个用于差异表达分析中自信效应大小的包,提供了改进的感兴趣的基因可用性排名。bioRxiv。doi: 10.1101/343145

如果你想找到最自信的差异表达基因

使用limma_confectsedger_confects,或deseq2_confects作为limma、edgeR或DESeq2分析的备选最后一步。limma法目前比其他方法快得多。

例如,参见小插图“自信的折叠变化”。

如果你有一个带有标准误差的效应大小集合

如果你有某种类型的效应大小的集合,有相关的标准误差,可能有相关的自由度,使用normal_confects。假设误差为正态分布,如果自由度给定,则为t分布。

这是limma的TREAT方法的重新实现,然后将该方法提供给nest_confects(描述)。(或者,如果效应大小都是正的,也可以选择使用单侧t检验作为基础假设检验。)

如果你能计算出区间假设集合的p值

的核心算法topconfects是在函数中实现的吗nest_confects。你可以提供任何函数,它可以计算无效假设的p值,即效应大小不超过指定的数量。对n个项目执行测试,函数应该能够对这n个项目中的一个子集和给定的数量执行此计算。

可视化的结果

使用confects_plot绘制顶部基因的自信效应大小。估计的效应大小(如对数折变化)用一个点表示,而置信界限用一条线表示。

使用confects_plot_me以获得全球概览。与MD或MA图类似,x轴是平均表达式。y轴是效应量。估计的效应大小用灰色表示,可信效应大小用黑色表示(即具有非na可信效应大小的基因用灰色和黑点表示)。

使用rank_rank_plot比较两个排名。

例如,参见小插图“自信的折叠变化”。