区域图谱:从scRNA-seq和scATAC-seq中直接推断单细胞高阶染色质

Compartmap扩展了Fortin和Hansen 2015年提出的方法,Genome Biology (https://genomebiology.biomedcentral.com/articles/10.1186/s13059-015-0741-y)进行高阶染色质的直接推断单个细胞scRNA-seq和scATAC-seq。最初,Fortin和Hansen证明染色质构象可以从(sc)ATAC-seq、亚硫酸氢盐测序、DNase-seq和甲基化阵列推断出来,类似于HiC在组水平上提供的结果。因此,除了上述分析所提供的基本信息外,染色质状态也可以推断出来。

在这里,我们提出了一种从scRNA-seq和scATAC-seq推断群体和单细胞水平高阶染色质状态的方法。为了实现这一目标,我们使用来自scRNA-seq和scATAC-seq的染色体或全基因组信息,采用James-Stein估计器(JSE)对全局或目标平均值进行估计。此外,由于单细胞数据的稀疏性,我们采用自举程序来量化与推断的隔间的状态和边界相关的不确定性。然后,与正交分析类型相比,分隔图的输出可以直接可视化,并且/或嵌入UMAP或t-SNE之类的东西。此外,为了探索从分隔图推断出的高阶相互作用域,我们使用随机矩阵理论(RMT)方法来解析“格状”图案,类似于在Hi-C和scHi-C中观察到的图案。

快速开始示例数据

输入

隔间地图的预期输入是aRangedSummarizedExperiment对象。这些可以使用内置函数来构建importBigWig ()如果从BigWigs(推荐用于scRNA-seq)开始,或者从特性级对象(如a)开始SingleCellExperimentrowRanges插槽中填充了每个特性的grange(参见下面的示例)。

在组和单细胞水平上推断高阶染色质结构域

####组级推断#####处理示例K562 scRNA-seq数据的chr14,并在1Mb分辨率下推断高阶染色质k562_compartments < -scCompartments(k562_scrna_chr14空空的=“chr14”res =1 e6组=真正的引导=基因组=“hg19”分析=“rna”####单细胞级推断####要在单细胞中推断高阶域,并通过自举过程量化符号一致性,您可以运行:以10个单元格为例k562_scrna_chr14。子< -k562_scrna_chr14 (,样本colnames(k562_scrna_chr14),大小=10取代=)]k562_compartments。启动< -scCompartments(k562_scrna_chr14.sub空空的=“chr14”res =1 e6组=引导=真正的num.bootstraps =10基因组=“hg19”分析=“rna”#翻转域符号,如果符号一致性在80%的自举中不一致k562_compartments.boot。修复< -fixCompartments(k562_compartments.bootmin.conf =0.8查看GRangesList对象中的第一个单元格k562_compartments.boot.fix [[1]]GRanges对象有89个范围和13个元数据列:## seqnames range strand | PC##    | ## chr14 1900000 -19999999 * | 0.824163## chr14 20000000-20999999 * | 0.427980chr14 21000000-21999999 * | 0.272336## chr14 2200000 -22999999 * | 0.017647## chr14 2300000 -23999999 * | -0.194594## ... ... ... ... . ...chr14 10300000 -103999999 * | -0.0672494chr14 10400000 -104999999 * | 0.0600952chr14 10500000 -105999999 * | 0.3147846## chr14 10600000 -106999999 * | 0.5694740## chr14 10700000 -107349539 * | 0.8241634##隔间评分引导。打开boot.closed## <字符> <数字> <数字> <数字>开0.824163 82## chr14:20000000-20999999 open 0.427980 8 2## chr14:21000000-21999999 open 0.272336 8 2## chr14:2200000 -22999999 open 0.017647 4 6## chr14:2300000 -23999999关闭-0.194594 2 8## ... ... ... ... ...## chr14:10300000 -103999999关闭-0.0672494 7 3## chr14:10400000 -104999999 open 0.0600952 7 3## chr14:10500000 -105999999 open 0.3147846 8 2## chr14:10600000 -106999999 open 0.5694740 10 0## chr14:1070000 -107349539 open 0.8241634 10 0## conf.est conf.est. upperci conf.est. lowerci## <数字> <数字> <数字>## chr14:190000 -19999999 0.716740 0.954113 0.479368## chr14:20000000-20999999 0.716740 0.954113 0.479368## chr14:21000000-21999999 0.716740 0.954113 0.479368## chr14:2200000 -22999999 0.427753 0.688396 0.167111## chr14:2300000 -23999999 0.716740 0.954113 0.479368## ... ... ... ...## chr14:10300000 -103999999 0.355507 0.607675 0.103338## chr14:10400000 -104999999 0.644493 0.896662 0.392325## chr14:10500000 -105999999 0.716740 0.954113 0.479368## chr14:10600000 -106999999 0.861234 1.000000 0.679113## chr14:1070000 -107349539 0.861234 1.000000 0.679113##翻转。分数flip.conf.est## <逻辑> <数字> <数字>## chr14:190000 -19999999 FALSE 0.824163 0.716740## chr14:20000000-20999999 FALSE 0.427980 0.716740## chr14:21000000-21999999 FALSE 0.272336 0.716740## chr14:2200000 -22999999 FALSE 0.017647 0.427753## chr14:230000 -23999999 FALSE -0.194594 0.716740## ... ... ... ...## chr14:10300000 -103999999 FALSE -0.0672494 0.355507## chr14:10400000 -104999999 FALSE 0.0600952 0.644493## chr14:10500000 -105999999 FALSE 0.3147846 0.716740## chr14:10600000 -106999999 FALSE 0.5694740 0.861234## chr14:1070000 -107349539 FALSE 0.8241634 0.861234## flip.conf.est.upperCI flip.conf.est.lowerCI## <数字> <数字>## chr14:190000 -19999999 0.954113 0.479368## chr14:20000000-20999999 0.954113 0.479368## chr14:21000000-21999999 0.954113 0.479368## chr14:2200000 -22999999 0.688396 0.167111## chr14:2300000 -23999999 0.954113 0.479368## ... ... ...## chr14:10300000 -103999999 0.607675 0.103338## chr14:10400000 -104999999 0.896662 0.392325## chr14:10500000 -105999999 0.954113 0.479368## chr14:10600000 -106999999 1.000000 0.679113## chr14:1070000 -107349539 1.000000 0.679113## -------## seqinfo: 1个来自未指定基因组的序列;没有seqlengths

可见推断的染色质域

在组级或单单元级处理数据后,可以使用plotAB功能在隔间地图。值得注意的是,我们可以包括置信区间和中位数,从符号一致性的自举过程中得到的染色体范围的置信估计。在50%的情况下,这表明在开放状态和封闭状态之间的估计是平均的。这可能是由于数据的稀疏性或异构性。解决这个问题的一种可能的方法是,如果初始设置较低(例如10),则增加执行的引导次数。或者,它可能是一个值得为您的数据集研究的区域。

导入bigWigs作为输入隔间地图

目前推荐的scRNA-seq的compartmap输入文件是单单元格bigWigs,尽管它可以使用基于特征/计数的对象(下一节将演示)。单细胞bigWigs可以通过几种工具生成,例如deeptools (https://deeptools.readthedocs.io/en/latest/).要导入bigWigs,我们可以使用importBigWig功能在隔间地图。这将读入一个bigWig文件,并有选择地总结为任意大小的bin。在compartmap手稿中使用的箱子大小是1kb,这也是我们在这里所做的。

从一个基于特性或计数的对象开始

在没有或不能从bigWigs对象(例如scATAC)开始的情况下,我们可以从特征级或计数对象开始(例如scATAC)。SingleCellExperiment).必须要做的两件事是确保rowRanges而且colnames为每个特征和单元格/样本设置。我们将使用K562中的scATAC-seq作为对象外观的示例,但也将展示添加的一种方法rowRanges到一个SingleCellExperiment,这对a也是一样的SummarizedExperiment对象。

显示rowRanges槽位为农庄对于每个特性

但如果我们没有rowRanges比如SingleCellExperiment我们的工作,我们需要产生它们。因此,我们将展示一个如何添加的示例rowRanges从GTF文件到SingleCellExperiment

高阶染色质相互作用图

我们可以从scRNA和scATAC中得出的另一个有趣的方面是通过使用随机矩阵理论方法对相关矩阵进行去噪来获得高阶相互作用域。这通常用Hi-C和scHi-C方法中显示的“格状”模式表示,其中较强的相关性(例如较大的红色强度)表示相对于较低的相关性的相互作用域。我们可以在这里做类似的事情。