IDR2D是原始方法IDR的扩展(Li et al. 2011)这是针对ChIP-seq峰值(或一维基因组数据)的。该软件包将该方法应用于二维基因组数据，例如两个基因组位点(也称为锚点)之间的相互作用。基因组相互作用数据由全基因组方法生成，如Hi-C(Berkum et al. 2010), ChIA-PET(Fullwood and Ruan 2009)，以及HiChIP(Yan et al. 2014)．

输入数据

加载示例数据:

rep1_df < -idr2d:::chiapet＄rep1_dfrep2_df < -idr2d:::chiapet＄rep2_df

使用实例数据复制1

只显示了前1000个相互作用。

使用实例数据复制2

只显示了前1000个相互作用。

分析

加载包:

图书馆(idr2d)

估计印尼盾:

idr_results < -estimate_idr2d(rep2_df rep1_dfvalue_transformation =“log_additive_inverse”）rep1_idr_df < -idr_results＄rep1_df

类型的语义决定了适当的值转换价值列(总是第七列)rep1_df而且rep2_df．这一列用于建立交互之间的排名，高度显著的交互位于列表的顶部，而最不显著的交互(即最有可能是噪音)位于列表的底部。排名是由价值列，按降序排序。因为我们的价值列中包含fdr(越低越显著)，我们需要转换值以符合高值表示高显著性的假设。对于p值和p值衍生的度量(如Q值)log_additive_inverse转换(日志(x))。

结果

只显示了前1000个观测值。

总结

总结(idr_results)

##分析类型:IDR2D ##重复1交互次数:9928 #重复2交互次数:10326 #可重复交互次数:5907 # IDR显著交互次数(IDR < 0.05): 183 # IDR极显著交互次数(IDR < 0.01): 116 # IDR显著交互百分比(IDR < 0.05): 1.77%

印尼卢比的分布

draw_idr_distribution_histogram(rep1_idr_df)

秩- IDR相关性

draw_rank_idr_scatterplot(rep1_idr_df)

价值- IDR依赖性

draw_value_idr_scatterplot(rep1_idr_df)

额外的信息

IDR2D包的大部分功能也通过网站提供https://idr2d.mit.edu．

有关IDR2D的详细讨论，请参阅IDR2D文件:

IDR2D鉴定可复制的基因组相互作用
康斯坦丁·克里斯默，郭宇春和大卫·k·吉福德
《核酸研究》第48卷，第6期，2020年4月6日，第e31页;DOI:https://doi.org/10.1093/nar/gkaa030

参考文献

Berkum, N. L. van, E. Lieberman-Aiden, L. Williams, M. Imakaev, A. Gnirke, L. A. Mirny, J. Dekker和E. S. Lander, 2010。Hi-C:一种研究基因组三维结构的方法。J Vis Exp,没有。39(5月)。

富尔伍德，阮玉玉，2009。“基于chip的远程染色质相互作用识别方法。”j .细胞。物化学。107(1): 30-39。

李群华，黄海燕，黄海燕，黄海燕，Peter J. Bickel, 2011。测量高通量实验的重复性安。达成。统计。5(3): 1752-79。https://doi.org/10.1214/11-AOAS466．

严，H.， J. Evans, M. Kalmbach, R. Moore, S. Middha, S. Luban, L. Wang等。2014。“HiChIP:用于集成分析ChIP-Seq数据的高通量管道。”BMC生物信息学15(8月):280。

从重复的ChIA-PET实验中鉴定可重复的基因组相互作用

康斯坦丁·Krismer

2022-11-01