内容

1介绍

Cytofkit软件包旨在促进一个或多个FCS文件中质量细胞术数据的分析。用户可以自定义其数据合并策略,以将来自多个文件的数据与正确的转换相结合;应用最先进的聚类方法densvm[1]和现场[2]以及内部开发算法clusterx自动检测细胞子集;通过线性转换,可以像群集标签那样可视化高维数据PCA或非线性维度降低ISOMAP[3]或T-SNE[4];绘制由估计的细胞亚型的进展ISOMAP或者扩散图[5]并介绍了沿细胞进程的标记表达。除了为研究社区提供一站式分析平台外,Cytofkit与直观设计的GUI和交互式Web应用程序一起运输,以促进质量细胞仪数据的简便分析和解释。

2Cytofkit分析管道

示意图Cytofkit管道如下,它包含四个主要组成部分:

Cytofkit管道

Cytofkit管道

2.1预处理

在此步骤中,将使用一个或多个选择的FCS文件加载到R环境中读取.fcs功能流核包裹。然后以适当的转换方法提取选定标记的表达值(包括Cytofasinh(建议数据),Autolgcl(建议FCM数据),徽标Arcsinh),然后将来自多个文件的表达矩阵组合成单个矩阵。对于多个FCS文件,Cytofkit提供四个数据组合方法,包括i)Ceil哪个样品将用户指定的单元格数量最多,而无需从每个FCS文件替换,然后组合,ii)全部从每个FCS文件中获取所有单元格,然后组合,iii)最小哪个从每个FCS文件中的所有FCS文件中采样最少数量的单元格,然后组合IV)固定的哪个从每个FCS文件中示例用户指定的单元格数(当文件总数小于指定的数字时替换)然后组合。组合结合后,整个数据集将存储在数据矩阵中,行名表示为filename_cellid,MAMES表示为marker_name。此步骤是在Funciton实施的cytof_exprsmerge,阅读此功能的详细信息:

cytof_exprsmerge

2.2细胞子集检测

子集检测是通过聚类算法执行的。Cytofkit配有两种最先进的聚类方法densvm现场和内部开发的聚类算法clusterx。其中,densvmclusterx是从密度基于密度的聚类算法中估计的T-SNE嵌入地图。尽管现场是直接在高维数据上执行的基于图的聚类算法。对于晚于1.4.4的版本,我们插入了流动聚类算法[6]。检查功能cytof_cluster用于实施此步骤。

?cytof_cluster

2.3细胞子集可视化和解释

三维降低方法已集成到Cytofkit将高维质量细胞仪数据可视化到信息传感和关系保存的二维图中。其中包括一种线性转换方法PCA和两种非线性转化方法ISOMAPT-SNEPCA是一种广泛使用的技术,可去除变量之间的线性相关性。后PCA,数据由主组件表示,而这两个或三个具有最大方差的主要组件用于可视化数据。ISOMAP用于将高维数据点嵌入低维度,同时保留数据结构的内在几何形状。T-SNE找到高维数据的二维表示,最能保留局部和全局几何形状。减少尺寸后,Cytofkit将细胞点绘制到这些转换的二维图中,点颜色代表其从上一步检测到的细胞类型,而点形表示细胞来自哪个样品。为了总结每个细胞子集的表达曲线,可以生成一个热图以可视化每个单元格中每个标记的平均值或中位表达式。该热图可以极大地促进对已知细胞类型的解释,并以其特殊的标记表达特征以及具有新型表达模式的新细胞类型的检测。检查功能cytof_dimreduction用于实施此步骤。

cytof_dimreduction

2.4子集进展的推断

我们没有使用所有细胞来推断子集进展,而是根据检测到的细胞子集执行进程路径估计。具体而言,我们将每个单元子集的细胞数量降低到一个固定数字,因此使每个子集具有相等数量的单元格。这消除了大多数细胞的细胞亚型的潜在显性影响。然后扩散图或者ISOMAP用于推断下抽样子集之间的关系。扩散图ISOMAP都可以比较细胞的总体相关性,并考虑到细胞之间的非线性地球距离。通过绘制沿着标记表达式扩散图或者ISOMAP尺寸1或尺寸2具有较低的回归,具有高度与进展相关的表达模式的标记可以定义为调节标记。检查功能cytof_progression用于实施此步骤。

cytof_progression

2.5后期处理

群集结果可以通过从尺寸转换的数据可视化。T-SNE,,,,PCAISOMAP。集群坐标,以及T-SNE,,,,PCAISOMAP坐标将作为其他参数存储到FCS文件中,为了进行后分析,所有结果文件和图都可以使用该函数保存cytof_writeresults

cytof_writeresults

在保存的结果中,R数据对象将通过后缀保存.rdata,这是专门用于加载到闪亮的Web应用程序的,以进行交互式可视化和分析结果的探索。可以通过命令启动闪亮的应用程序cytofkitshinyapp()或通过此链接https://cytofkit.shinyapps.io/shiny/

3参考

[1] Becher B,Schlitzer A,Chen J,Mair F,Sumatoh HR,Wei K等。鼠髓样细胞系统的高维分析。NAT免疫。2014; 15。doi:10.1038/ni.3006。

[2] Levine JH,Simonds EF,Bendall SC,Davis KL,Amir ED,Tadmor MD等。数据驱动的AML表型解剖揭示了与预后相关的祖细胞样细胞。细胞。Elsevier Inc.;2015;1 ??? 14。doi:10.1016/j.cell.2015.05.047

[3] Tenenbaum JB,De Silva V,Langford JC,Silva V DE,Langford JC。非线性维度降低的全球几何框架。科学。美国科学发展协会;2000; 290:2319-23。doi:10.1126/science.290.5500.2319

[4] Maaten L van der。使用基于树的算法加速T-SNE。J Mach学习Res。2014; 15:1-21。

[5] Haghverdi L,Buettner F,Theis FJ。扩散图,用于分化数据的高维单细胞分析。生物信息学。2015;1-10。doi:10.1093/bioinformatics/btv325

[6] Van Gassen S,Callebaut B,Van Helden MJ,Lambrecht BN,Demeester P,Dhaene T等。流量:使用自组织图来可视化和解释细胞术数据。细胞仪A. 2015;1-10。doi:10.1002/cyto.a.22625