内容

1简介

multiHiCcompare是原作的延伸吗HiCcompare包中。它为多个Hi-C数据集之间的差异染色质相互作用的联合归一化和检测提供了功能。multiHiCcompare以染色体特异性染色质相互作用矩阵的形式对处理过的Hi-C数据进行操作。它接受四列制表符分隔的文本文件,以稀疏矩阵格式存储染色质相互作用矩阵(参见创建hicexp对象).转换流行Hi-C数据格式的函数(.hic.cool)到稀疏格式(请参阅cooleHCT116_r2sparse ?,以及下面的例子)。multiHiCcompare与其他试图比较Hi-C数据的包不同的是,它处理的是染色质相互作用矩阵格式的处理数据,而不是原始测序数据。此外,multiHiCcompare为多个Hi-C数据集之间的联合归一化和偏差去除提供了一种非参数方法,用于对比分析。multiHiCcompare还提供了一个基于通用线性模型(GLM)的框架,用于检测Hi-C数据的差异。

2如何使用multiHiCcompare

2.1安装multiHiCcompare从Bioconductor

BiocManager::安装(“multiHiCcompare”)图书馆(multiHiCcompare)

2.2获取Hi-C数据

您将需要以稀疏上三角矩阵或BEDPE文件的形式使用经过处理的Hi-C数据multiHiCcompare.数据可从几个来源获得,下面列出了下载和提取数据的两个示例。如果您有完整的Hi-C接触矩阵,您可以使用完整的Hi-C接触矩阵将它们转换为稀疏的上三角格式full2sparse函数如额外的功能

2.2.1.hic文件

Hi-C数据有多种来源和格式。multiHiCcompare是建立与稀疏上三角矩阵格式的工作,由埃雷兹利伯曼-艾登http://aidenlab.org/data.html.如果你已经有Hi-C数据的形式,无论是稀疏上三角矩阵或完整的接触矩阵,你可以跳过创建hicexp对象部分。如果你从艾登实验室获得数据.hic格式,您将需要首先提取您希望比较的矩阵。

  1. 下载稻草软件https://github.com/theaidenlab/straw/wiki然后安装。
  2. 使用稻草来提取Hi-C稀疏上三角矩阵。下面是一个例子:

假设我们下载并解压缩GSE63525_K562_combined_30.hicGEO文件https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE63525,直接连结ftphttp

为了以500kb分辨率提取22号染色体对应的原始矩阵,我们将在终端中使用以下命令

./straw无GSE63525_K562_combined_30. txthic 22 22 BP 500000 > K562.chHCT116_r22.500kb.txt

这将从.hic文件并保存到K562.chHCT116_r22.500kb.txt文本文件,在稀疏上三角矩阵格式。请参阅有关如何使用的更多示例稻草https://github.com/theaidenlab/straw/wiki/CPP#running.Straw需要几个输入来提取数据.hic文件。

< / VC / VC_SQRT /没有一个KR > < hicFile (s) > < chr1 > [: x1, x2] < chr2 > [: y1, y2] < BP /碎片弹> < binsize >

第一个参数是归一化方法。用于multiHiCcompare你需要原始数据,所以你应该选择没有一个.第二个参数是.hic文件名。接下来是你想要的矩阵的染色体数。对于染色体内接触图,两者应与上述示例相同。如果你想要一个染色体间相互作用的矩阵,你可以使用不同的染色体,即染色体1和染色体2之间的相互作用(注意HiCcompare仅用于染色体内相互作用在这一点的发展)。下一个参数是需要基对文件还是片段文件。为multiHiCcompare使用英国石油公司.最后一个参数是矩阵的bin大小(分辨率)。要提取分辨率为1MB的矩阵,请输入10000000.典型的bin大小为1MB、500KB、100KB、50KB、5KB、1KB。请注意,大多数分辨率高于100KB的矩阵(即分辨率为1KB - 50KB的矩阵)通常过于稀疏(由于测序覆盖率不足),无法进行分析multiHiCcompare

从这里,我们可以将矩阵导入到R中,就像您通常对任何以制表符分隔的文件所做的那样。

  1. 将数据导入RK562。chr22 <- read.table('K562.chr22.500kb.txt', header=FALSE)
  2. 对于希望与使用的第一个数据集进行比较的任何其他Hi-C数据集,重复这些步骤multiHiCcompare

2.2.2.cool文件

冷却器软件http://cooler.readthedocs.io/en/latest/index.html,可访问大量Hi-C数据。较冷指数ftp://cooler.csail.mit.edu/coolers包含Hi-C数据hg19而且mm9有很多不同的来源。中使用数据.cool格式HiCcompare遵循以下步骤:

  1. 下载和安装冷却器http://cooler.readthedocs.io/en/latest/index.html
  2. 下载一个.cool文件从冷却器索引ftp://cooler.csail.mit.edu/coolers
  3. 假设我们下载了Dixon2012-H1hESC-HindIII-allreps-filtered.1000kb.cool文件。看到冷却器转储——帮助用于数据提取选项。为了提取接触矩阵,我们在终端中使用以下命令:
    —join dixon2012 - h1hesc - hindi -allrep -filtered.1000kb。dixon.hESC.1000kb.txt
  4. 读取文本文件,就像读取R中任何以制表符分隔的文件一样
    hesc1000kb <- read.table("dixon.hESC.1000kb.txt", header = FALSE)
  5. 函数转换为稀疏上三角矩阵HiCcompare: cooler2sparse函数。
    稀疏<- cooler2sparse(hesc1000kb)
  6. 对于希望与第一个数据集进行比较的另一个Hi-C数据集,重复上述步骤。

2.2.3使用HiC-Pro的数据

HiC-Pro是另一个将原始Hi-C数据处理成可用的矩阵文件的工具。HiC-Pro会产生一个.matrix文件和请全部文件的数据。这些.matrix文件采用稀疏的上三角格式,类似于Juicer的结果和转储的内容.hic文件,然而,而不是使用基因组开始坐标稀疏矩阵的前两列,他们使用一个ID号。的请全部文件包含每个id到它们基因组坐标的映射。最初的HiCcompare包包含一个功能,将HiC-Pro的结果转换为可用的格式进行分析multiHiCcompare.当使用HiC-Pro中的数据时,使用原始数据是很重要的.matrix文件,而不是冰.matrix文件。的冰.matrix文件已经应用了ICE标准化,不适合进入multiHiCcompare.这里我们将HiC-Pro数据转换为输入multiHiCcompare

# read in files mat <- read.table("hic_1000000.matrix") bed <- read.table("hic_1000000_abs.bed") # convert to BEDPE dat <- HiCcompare::hicpro2bedpe(mat, bed) #注:hicpro2bedpe返回一个列表的列表。#第一个列表dat$cis包含染色体内接触矩阵#注:dat$trans包含染色体间接触矩阵#,该矩阵在multiHiCcompare中不使用。

查看帮助使用? HiCcompare:: hicpro2bedpe欲知详情。

2.3并行处理

Hi-C数据量大,特别是在高分辨率下,黄土归一化计算量大。multiHiCcompare在构建时考虑了并行化,当使用计算集群时,在处理大型Hi-C实验(许多样本或高分辨率)时将获得最佳性能。通过设置,可以对所有归一化和比较函数进行并行处理平行= TRUE在函数选项中。multiHiCcompare使用BioconductorBiocParallel用于并行处理的包。您可以使用以下命令设置Linux上使用的处理器数量:

库(BiocParallel) numCores <- 20寄存器(multicoream (workers = numCores),默认= TRUE)

或者在Windows上使用:

库(BiocParallel) numCores <- 20寄存器(SnowParam(workers = numCores),默认= TRUE)

在哪里numCores用户设置的要使用的处理核数。用于并行处理multiHiCcompare在美国,作业是按染色体和距离分割的,因此使用的处理器越多,函数运行得越快。对于最大速度,建议设置numCores到可用处理器的最大数量。

2.4创建hicexp对象

2.4.1稀疏上三角格式

稀疏矩阵格式表示一种相对紧凑且易于阅读的方式来存储成对交互。它是一种制表符分隔的文本格式,包含三列:“region1”-第一个区域的起始坐标(单位为bp),“region2”-第二个区域的起始坐标,以及“IF”-它们之间的交互频率。0个if被省略(因此稀疏的格式)。由于染色质相互作用的整个矩阵是对称的,只有上三角形部分,包括对角线,被存储。通常这种格式的矩阵存储在每个染色体的单独文本文件中。用于multiHiCcompare,则需要为染色体数添加一列。染色体的数目应该只输入数字。染色体如X、Y等应输入23、24等。如果计划分析不止一条染色体的数据,则需要将这些矩阵连接在一起。一个可以被输入的稀疏Hi-C矩阵multiHiCcompare应该像下面这样:

data("HCT116_r1") #加载示例稀疏矩阵头(HCT116_r1) #> "22" V1 V2 V3 #> 1 22 16000000 16000000 11 #> 2 22 16100000 16100000 1 #> 3 22 16200000 16200000 3 #> 4 22 16300000 16300000 15 #> 5 22 16400000 16400000 3 #> 6 22 16400000 16500000 1 colnames(HCT116_r1) <- c('chr', 'region1', 'region2',#重命名列头(HCT116_r1) #矩阵准备输入到multiHiCcompare #> chr region1 region2 IF #> 1 22 16000000 16000000 11 #> 2 22 16100000 16100000 1 #> 3 22 16200000 16200000 3 #> 4 22 16300000 16300000 15 #> 5 22 16400000 16400000 3 #> 6 22 16400000 16500000 1 #> 6 22 16400000 16500000 1

如果你有完整的Hi-C接触矩阵,你可以将它们转换为稀疏上三角矩阵HiCcompare: full2sparse函数,然后添加一列表示染色体。

假设我们有2个实验条件下的数据,每个条件下有2个样本。我们可以做一个hicexp对象,执行以下操作。

data("HCT116_r1", "HCT116_r2", "HCT116_r3", "HCT116_r4") hicexp1 <- make_hicexp(HCT116_r1, HCT116_r2, HCT116_r3, HCT116_r4, groups = c(0,0,1,1), 0。p = 0.8, A.min = 5, filter = TRUE,移除。区域= hg19_cyto) hicexp1 #> Hi-C实验对象#> 2个实验组#>组1有2个样本

选项指定实验组。必须输入Hi-C矩阵数量的长度向量,其中包含每个矩阵所属组的指示符。一个可选的协变量data.frame与Hi-C矩阵相对应的行和每个附加协变量的列可以用协变量选择。

可以在创建hicexp对象使用zero.p而且A.min的选项。make_hicexp函数。的zero.p选项允许通过交互的零if的比例进行过滤。的A.min允许通过最小平均中频值进行过滤。这些选项可以一起使用,也可以单独使用来过滤数据。过滤是重要的,以消除相互作用与大量的0 if和低平均表达。这些相互作用往往不是很有趣,并且很容易在差异检测期间成为假阳性。此外,删除这些交互将提高的计算速度multiHiCcompare.如果出于某种原因您不想过滤简单设置的数据filter = FALSE

此外,你可以过滤掉特定的基因组区域,如着丝粒或黑名单区域。multiHiCcompare附带内置区域过滤hg19和hg38,可以这样访问。

数据(“hg19_cyto”)的数据(“hg38_cyto”)hg19_cyto # >农庄对象范围和70 2元数据列:# > seqnames范围链|手臂功能# > < Rle > < IRanges > < Rle > | <因素> <因素> # > [1]1 121500000 - 121500000 * | p11.1 acen # > [2] 1 125000000 - 125000000 * | q11 acen # > [3] 1 128900000 - 128900000 * | q12 gvar # > [4] 10 38000000 - 38000000 * | p11.1 acen # > [5] 10 40200000 - 40200000 * | q11.1 acen  #> ... ... ... ... . ... ...#> [66] 23 58100000-60600000 * | p11.1 acen #> [67] 23 60600000-63000000 * | q11.1 acen #> [68] 24 11600000-12500000 * | p11.1 acen #> [69] 24 12500000-13400000 * | q11.1 acen #> [70] 24 28800000-59373566 * | q12 gvar #> ------- #> seqinfo: 24个来自未指定基因组的序列;没有seqlengths

默认情况下,make_hicexp对象将具有remove.regions选项设置来使用hg19_cyto对象。如果数据未与hg19对齐,或者希望删除其他区域,则可以创建一个GenomicRanges对象,该对象包含要删除的范围和remove.regions选项。

2.4.2hicexp对象

hicexpS4类有几个插槽,可以用访问器函数访问它们hic_table ()结果(),元().的hic_table槽包含稀疏格式的Hi-C矩阵。前四列分别是染色体、region1起始位置、region2起始位置和单位距离。所有下面的染色体代表每个样本中相互作用对的if。的比较槽在创建时是空的,但在使用比较函数之一后将被填充。的前四列与hic_table槽,但也有logFC - log折叠变化之间的条件,logCPM - log计数每百万,p.value,和p.adj -多重测试校正p值列,这表明在条件之间的每个相互作用的区域对的差异的显著性。访问比较槽使用结果().的元数据槽位包含data.frame这个实验的协变量。访问元数据使用槽元().其他插槽主要供内部使用,一般用户不需要关心。

2.5归一化

multiHiCcompare附带一些方法来规范化你的Hi-C数据。我们的联合归一化方法再次基于原始的MD图HiCcompare.MD图类似于MA图或Bland-Altman图。\ \(米)\ (log2 \)两个数据集的相互作用频率之间的差异。\ (D \)是两个相互作用区域之间的单位距离。在MD坐标系中表示黄土后,对数据进行黄土处理。

2.5.1图书馆的规模

比较Hi-C数据最简单的归一化形式是库缩放。multiHiCcompare提供了hic_scale ()函数将每个样本的Hi-C库缩放到最小库的大小。如果您认为数据中出现的任何趋势都是重要的差异,而不是由于偏见,那么您可以使用库缩放来规范化数据,如下所示。

Data ("hicexp2") hicexp2 <- hic_scale(hicexp2)

注意,你需要使用简单的缩放或黄土归一化方法。建议使用循环黄土或快速黄土,这将隐式地重新缩放库,并消除不需要的趋势。

2.5.2循环黄土标准化

multiHiCcompare为多Hi-C数据集的联合归一化提供了一种循环黄土方法。该方法基于在MD图上表示数据。MD图类似于MA图(Bland-Altman图),后者通常用于基因表达差异的可视化。\ \(米)定义为两个数据集之间的差异的对数\(M = log_2(IF_2/IF_1)\),在那里\ (IF_1 \)而且\ (IF_2 \)分别为第一组和第二组Hi-C数据集的相互作用频率。\ (D \)定义为两个相互作用区域之间的距离,以\ \ (X)Hi-C数据的分辨率。在MD图中拟合了黄土回归曲线,并利用黄土回归曲线来消除全局偏差\ \(米)差异在\ (M = 0 \)基线。

循环黄土算法通过以下步骤进行。

  1. 从。中选择两个\ (N \)然后生成MD图。
  2. 拟合黄土曲线\ (f (d) \)MD地块。
  3. 减去\ (f (d) / 2 \)从第一个数据集中添加\ (f (d) / 2 \)到第二秒。
  4. 重复这一步骤,直到所有唯一的配对都被比较完。
  5. 重复直到收敛。

要对Hi-C数据进行黄土循环,您将需要使用cyclic_loess ()函数如下所示:

hicexp1 <- cyclic_黄土(hicexp1, verbose = FALSE, parallel = FALSE, span = 0.2) # make MD plot MD_hicexp(hicexp1)

从上面的MD图中可以看出,每个样本的数据已经与所有其他样本进行了联合归一化。注意,用户可以设置span选项。用户设置的跨度将比自动计算跨度的默认选项运行得更快。如果您以前没有使用过数据,最好使用自动跨度计算,但如果您熟悉它,那么设置跨度是加快处理速度的一种方法。的hic_table插槽hicexp对象也更新了标准化的if。

hic_table(hicexp1) #> chr region1 region2 D IF1 IF2 IF3 IF4 #> 1: 22 18000000 18000000 0 4848.93586 5117.56104 5757.67702 4330.37698 #> 2: 22 18000000 18100000 1 1307.53629 1128.57032 1317.91263 893.55501 #> 3: 22 18000000 18200000 2 715.99832 734.05089 729.32691 743.67190 #> 4: 22 18000000 18300000 3 352.17410 409.94247 420.22430 387.50225 #> 5: 22 18000000 18400000 4 296.77137 274.80602 306.21630 314.82774 #>——#> 43740:22 51000000 51100000 1 1622.03802 1762.87853 1664.49400 1271.16626 #> 43741: 22 51000000 51200000 2 30.51641 35.06727 31.06704 22.70308 #> 43742: 22 51100000 51100000 0 3681.72778 4131.14202 4126.33930 3604.34388 #> 43743: 22 51100000 51200000 1 79.15003 63.50592 77.51615 57.56003 #> 43744: 22 51200000 5200000 0 17.19701 25.33298 28.78896 36.23247

在多处理机可用的情况下,通过设置参数可降低循环黄土的运行时间平行选项真正的.该选项按染色体分割数据,并将每个染色体的数据发送到并行处理器。

2.5.3快速黄土标准化(Fastlo)

除标准循环黄土法外,multiHiCcompare同时实现了Fast黄土(Fastlo)联合归一化算法。我们的fastlo实现适用于每个距离的Hi-C数据。为了对Hi-C数据执行“fastlo”,我们首先将数据分成\ (p \)混合矩阵。“渐进池化”用于按单位距离分割Hi-C矩阵,这样距离0是它自己的池,距离1和2被池化,距离3、4、5被池化,直到所有单位距离都属于其中之一\ (p \)池。每个矩阵都有一个\ (IF_ {gj} \)价值与\ (g \)相互作用对每个\ (j \)样本。这些\ (p \)然后可以使用以下步骤将矩阵输入到“fastlo”算法中。

  1. 创建矢量\(\帽子{如果}_ {pgj} \)的行均值\ (p ^ {th} \)矩阵。这相当于在距离池中创建一个平均IF\ (p \)
  2. 情节\(\帽子{如果}_ {p} \)\((IF_{pg} - \hat{IF_p})\)对于每个样本\ (j \).这相当于基因组距离池中的MA图\ (p \)
  3. 拟合黄土曲线\ \ (f (x))到情节。
  4. 减去\ \ (f (x))从样本\ (j \)
  5. 重复所有剩余的重复。
  6. 重复此操作,直到算法收敛。

你可以对你的数据执行fastlo归一化,如下所示:

data("hicexp2") #执行fastlo规范化hicexp2 <- fastlo(hicexp2, verbose = FALSE, parallel = FALSE) # make MD plot MD_hicexp(hicexp2)

同样,上面的MD图显示了规范化的数据。fastlo ()也可以利用并行化来加快计算速度通过设置平行选项真正的.的结果fastlo ()而且cyclic_loess ()可能略有不同,但两者都应消除Hi-C数据集之间的偏差。fastlo ()会有更快的运行时间相比cyclic_loess (),但cyclic_loess ()可能会给出一个稍微好的归一化。

2.6不同检测

multiHiCcompare提供了两种主要的方法来进行Hi-C实验的组或条件之间的差异比较。对于简单的实验,只在两组之间进行比较hic_exactTest ()函数可以使用。对于具有协变量或多个组的更复杂的实验,请使用hic_glm ()函数应该使用。这两个函数都使用刨边机包拟合负二项式模型到Hi-C数据。对于差异检测步骤,multiHiCcompare首先使用fastlo部分中描述的累进池将数据按距离分割。然后,每个距离池被类似地处理为一个独立的RNA-seq数据矩阵刨边机的函数被应用于拟合指定的模型。这个过程如下面的图1所示。

图1所示。多个Hi-C重复的非对角线分析。虚线表示在相互作用区域之间给定距离的相互作用频率的非对角线向量。右图:转换成类似RNA-seq数据的矩阵格式,if可以被黄土归一化,可以使用经验贝叶斯方法估计重复间的方差,并且可以使用对数线性GLMs检测差异。

2.6.1精确的测试

对于简单的Hi-C实验hic_exactTest ()函数可以使用如下所示:

hicexp1 <- hic_exactTest(hicexp1, p.method = 'fdr', parallel = FALSE) # plot results MD_composite(hicexp1)

上面的复合MD图显示了在两组之间检测到的任何显著差异。方法也可以加速此函数平行选择。比较的结果然后保存在比较槽位号hicexp对象。

结果(hicexp1) #> chr region1 region2 D logFC logCPM p.value p.adj #> 1: 22 18000000 18000000 0 -0.002271489 11.162876 0.98355590 0.9978994 #> 2: 22 18000000 18200000 1 -0.166524611 9.056102 0.24699655 0.6200377 #> 3: 22 18000000 18200000 2 0.014611713 8.394195 0.91509193 0.9704410 #> 4: 22 18000000 18300000 3 0.064067277 10.298587 0.60748736 0.9685625 #> 5: 22 18000000 18400000 4 0.098498828 9.903732 0.45349569 0.9206592 #>——#> 43740:22 51000000 51100000 1 -0.223639527 9.499253 0.07028879 0.3629536 #> 43741: 22 51000000 51200000 2 -0.299777832 3.866202 0.34735616 0.6875078 #> 43742: 22 51100000 51100000 0 -0.027527966 10.798143 0.80184233 0.9212657 #> 43743: 22 51100000 51200000 1 -0.097398299 5.032406 0.69220609 0.8790205 #> 43744: 22 512200000 512200000 3.727353 0.08237680 0.3831598

在这个data.table前3列表示相互作用的身份,然后是单位基因组距离(D),组间的对数折叠变化差(logFC),则交互的日志计数为每百万次(logCPM), p值,最后是多重测试校正p值(p.adj).方法更改所应用的多重测试的类型p.method选择。要查看其他可用的调整方法,请查看帮助p.adjust ?

2.6.2全球语言监测方法

对于更复杂的Hi-C实验hic_glm ()函数必须使用。要使用这个函数,首先必须创建一个设计矩阵。在这里使用hicexp2对象,并创建设计矩阵。

Batch <- c(1,2,1,2) #生成设计矩阵d <- model.matrix(~factor(meta(hicexp2)$group) + factor(Batch))

设计矩阵应该包含感兴趣的协变量。任何分类变量都应作为因子输入。方法指定感兴趣的比较对比或者是系数选择。对于这个例子,我们感兴趣的是组差,因此我们可以设置Coef = 2来检验群体效应是否等于0。有关使用的更多信息对比而且系数请参阅刨边机用户手册。现在我们准备好执行比较了。

hicexp2 <- hic_glm(hicexp2, design = d, coef = 2, method = "QLFTest", p.method = "fdr", parallel = FALSE)

有三种方法hic_glm ()可以执行。默认的方法是使用QLFTest它利用了准似然模型。此外,还有轻轨车进行似然比检验。最后一个方法是治疗方法,该方法相对于指定的折叠变化阈值进行测试。对于此选项,使用选项将需要用于指定log2倍更改阈值。

# use处理选项hicexp2 <- hic_glm(hicexp2, design = d, coef = 2, method = "处理",M = 0.5, p.method = "fdr", parallel = FALSE)

2.7下游分析

用于下游结果的分析multiHiCcompare,您可能需要过滤结果。可以通过使用topDirs函数。设置Return_df = 'pairedbed'将返回一个由您的规范筛选的交互对组成的表。

td <- topDirs(hicexp1, logfc_cutoff = 0.5, logcpm_cutoff = 0.5, p.d adj_cutoff = 0.2, return_df = 'pairedbed') head(td) #> chr1 start1 end1 chr2 24700000 24799999 62 1.1694 9.7256 #> 2: chr22 20200000 20299999 chr22 20300000 20399999 1 -0.5443 6.2774 #> 4: chr22 26600000 24499999 chr22 36300000 36399999 119 1.6664 9.4722 #> 5:chr22 28600000 28699999 chr22 39800000 39899999 112 -3.4597 8.0822 #> 6: chr22 30700000 30799999 chr22 33400000 33499999 27 -3.2383 7.1872 #> p.value . p.adj #> 1: 5.9373E-05 1.5217E-01 #> 2: 3.4394E-03 1.1167E-01 #> 3: 8.9882E-05 1.0274E-01 #> 5: 5.1491E-05 1.0274E-01 #> 6: 3.6815E-05 7.5102E-02

此外,您还可以通过设置总结至少一次检测到的重要区域Return_df = '床'

counts <- topDirs(hicexp1, logfc_cutoff = 0.5, logcpm_cutoff = 0.5, p.adj_cutoff = 0.2, return_df = 'bed', pval_aggregate = "max") head(counts) #> chr start end count avgD avgLogFC avgLogCPM avgP。adj: chr22 36300000 36399999 2 117 1.9627 9.0681 1.9318E-01 #> 2: chr22 18500000 18599999 1 62 1.1694 9.7256 1.5217E-01 #> 3: chr22 20200000 20299999 11 1 -0.5443 6.2774 1.1167E-01 #>: chr22 20300000 20399999 11 -0.5443 6.2774 1.1167E-01 #> 5: chr22 24400000 24499999 1 119 1.6664 9.4722 1.0274E-01 #> 6: chr22 24700000 24799999 1 62 1.1694 9.7256 1.5217E-01 #>

Return_df = '床'可以输入到下面的绘图函数中,以可视化顶部差分相互作用区域(DIRs)的p值。

plot_pvals(计数)

或者可视化最高DIRs的计数。

plot_counts(计数)

2.8其他功能

中还包含了其他几个函数multiHiCcomparemanhattan_hicexp ()为比较结果绘制曼哈顿图,以确定基因组中发现大量显著差异的“热点”区域。

曼哈顿hicexp(hicexp1, p.adj_cutoff = "standard")

还有MD绘图功能MD_hicexp ()它会为每一对独特的样本绘制MD图hicexp对象。

MD_hicexp(hicexp1, prow = 2, pcol = 3)

MD_composite ()函数将绘制比较结果的复合MD图,其中突出显示显著差异。

MD_composite (hicexp1)

3.会话信息

#> R version 4.2.0 RC (2022-04-19 r82224) #>平台:x86_64-pc-linux-gnu (64-bit) #>运行在:Ubuntu 20.04.4 LTS #> #>矩阵产品:默认#> BLAS: /home/biocbuild/bbs-3.15-bioc/R/lib/libRblas。所以#> LAPACK: /home/biocbuild/bbs-3.15-bioc/R/lib/libRlapack。so #> #> locale: #> [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# > [3] LC_TIME=en_GB LC_COLLATE= c# > [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 #> [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# > [9] LC_ADDRESS=C LC_TELEPHONE= c# > [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION= c# > #>附加基础包:#> [1]stats graphics grDevices utils datasets methods base #> #>其他附加包:#> [1]multihiccompare_14.0 BiocStyle_2.24.0 #> #>通过命名空间加载(且未附加):# > [1] nlme_3.1 - 157 bitops_1.0-7 # > [3] matrixStats_0.62.0 RColorBrewer_1.1-3 # > [5] GenomeInfoDb_1.32.0 InteractionSet_1.24.0 # > [7] tools_4.2.0 bslib_0.3.1 # > [9] utf8_1.2.2 R6_2.5.1 # > [11] KernSmooth_2.23-20 DBI_1.1.2 # > [13] BiocGenerics_0.42.0 mgcv_1.8-40 # > [15] colorspace_2.0-3 rhdf5filters_1.8.0 # > [17] DNAcopy_1.70.0 gridExtra_2.3 # > [19] tidyselect_1.1.2 aggregation_1.0.1 # > [21] compiler_4.2.0 cli_3.3.0 # > [23] Biobase_2.56.0 DelayedArray_0.22.0 # > [25] bookdown_0.26 sass_0.4.1 # >[27] scales_1.2.0 pbapply_1.5-0 # > [29] stringr_1.4.0 digest_0.6.29 # > [31] Rsamtools_2.12.0 rmarkdown_2.14 # > [33] R.utils_2.11.0 XVector_0.36.0 # > [35] pkgconfig_2.0.3 htmltools_0.5.2 # > [37] parallelly_1.31.1 MatrixGenerics_1.8.0 # > [39] highr_0.9 fastmap_1.1.0 # > [41] limma_3.52.0 rlang_1.0.2 # > [43] impute_1.70.0 jquerylib_0.1.4 # > [45] generics_0.1.2 jsonlite_1.8.0 # > [47] gtools_3.9.2 BiocParallel_1.30.0 # > [49] dplyr_1.0.8 R.oo_1.24.0 # > [51] rcurl_1.98 - 1.6 magrittr_2.0.3 # > [53]GenomeInfoDbData_1.2.8 qqman_0.1.8 #> [55] Matrix_1.4-1 HiCcompare_1.18.0 #> [57] Rhdf5lib_1.18.0 Rcpp_1.0.8.3 #> [59] munsell_0.5.0 S4Vectors_0.34.0 #> [61] fansi_1.0.3 lifecycle_1.0.1 #> [63] r.d astss3_1 .8.1 stringi_1.7.6 #> [65] cghbase_1.56 . 6.0 yaml_2.3.5 #> [67] edgeR_3.38.0 MASS_7.3-57 #> [69] SummarizedExperiment_1.26.0 zlibbioc_1.42.0 #> [71] rhdf5_2.40.0 grid_4.2.0 #> [77] splines_4.2.0 Biostrings_2.64.0 #> [79]magick_1 .7.3 locfit_1.5-9.5 #> [81] knitr_1.38 pillar_1.7.0 #> [83] GenomicRanges_1.48.0 CGHcall_2.58.0 #> [85] future_1. apply_9.0 codetools_0.2-18 #> [87] marray_1.74.0 stats4_4.2.0 #> [89] glue_1.6.2 evaluate_0.15 #> [91] calibrate_1.7.7 data.table_1.14.2 #> [93] BiocManager_1.30.17 vctrs_0.4.1 #> [95] gtable_0.3.0 purrr_0.3.4 #> [97] future_1.25.0 assertthat_0.2.1 #> [101] xfun_0.30 pheatmap_1.0.12 #> [103] tibble_3.1.6 IRanges_2.30.0 #> [105]globals_0.14.0 ellipsis_0.3.2