从重复的ChIA-PET实验中鉴定可重复的基因组相互作用

康斯坦丁·Krismer

2022-11-01

IDR2D是原始方法IDR的扩展(Li et al. 2011)这是针对ChIP-seq峰值(或一维基因组数据)的。该软件包将该方法应用于二维基因组数据,例如两个基因组位点(也称为锚点)之间的相互作用。基因组相互作用数据由全基因组方法生成,如Hi-C(Berkum et al. 2010), ChIA-PET(Fullwood and Ruan 2009),以及HiChIP(Yan et al. 2014)

输入数据

加载示例数据:

rep1_df < -idr2d:::chiapetrep1_dfrep2_df < -idr2d:::chiapetrep2_df

使用实例数据复制1

只显示了前1000个相互作用。

使用实例数据复制2

只显示了前1000个相互作用。

分析

加载包:

图书馆(idr2d)

估计印尼盾:

idr_results < -estimate_idr2d(rep2_df rep1_dfvalue_transformation =“log_additive_inverse”rep1_idr_df < -idr_resultsrep1_df

类型的语义决定了适当的值转换价值列(总是第七列)rep1_df而且rep2_df.这一列用于建立交互之间的排名,高度显著的交互位于列表的顶部,而最不显著的交互(即最有可能是噪音)位于列表的底部。排名是由价值列,按降序排序。因为我们的价值列中包含fdr(越低越显著),我们需要转换值以符合高值表示高显著性的假设。对于p值和p值衍生的度量(如Q值)log_additive_inverse转换(日志(x))。

结果

只显示了前1000个观测值。

总结

##分析类型:IDR2D ##重复1交互次数:9928 #重复2交互次数:10326 #可重复交互次数:5907 # IDR显著交互次数(IDR < 0.05): 183 # IDR极显著交互次数(IDR < 0.01): 116 # IDR显著交互百分比(IDR < 0.05): 1.77%

额外的信息

IDR2D包的大部分功能也通过网站提供https://idr2d.mit.edu

有关IDR2D的详细讨论,请参阅IDR2D文件:

IDR2D鉴定可复制的基因组相互作用
康斯坦丁·克里斯默,郭宇春和大卫·k·吉福德
《核酸研究》第48卷,第6期,2020年4月6日,第e31页;DOI:https://doi.org/10.1093/nar/gkaa030

参考文献

Berkum, N. L. van, E. Lieberman-Aiden, L. Williams, M. Imakaev, A. Gnirke, L. A. Mirny, J. Dekker和E. S. Lander, 2010。Hi-C:一种研究基因组三维结构的方法。J Vis Exp,没有。39(5月)。

富尔伍德,阮玉玉,2009。“基于chip的远程染色质相互作用识别方法。”j .细胞。物化学。107(1): 30-39。

李群华,黄海燕,黄海燕,黄海燕,Peter J. Bickel, 2011。测量高通量实验的重复性安。达成。统计。5(3): 1752-79。https://doi.org/10.1214/11-AOAS466

严,H., J. Evans, M. Kalmbach, R. Moore, S. Middha, S. Luban, L. Wang等。2014。“HiChIP:用于集成分析ChIP-Seq数据的高通量管道。”BMC生物信息学15(8月):280。