1德研究所矫揉造作的en Cancerologie de蒙彼利埃Inserm,蒙彼利埃法国;法国蒙彼利埃蒙彼利埃地区du癌症研究所;法国蒙彼利埃大学德蒙彼利埃
本指南概述SingleCellSignalR的包,一个全面的框架,从scRNA-seq获得手机网络地图数据。SingleCellSignalR带有一个完整的管道集成现有集群个体细胞转录组和识别细胞亚种群的方法以及新型蜂窝网络特殊算法。更高级的用户可以用自己的逻辑或替代工具在数据处理的不同阶段。SingleCellSignalR也地图细胞族群内部网络与感兴趣的基因通过整合监管KEGG Reactome通路与配体和受体参与的信息交互。蜂窝网络可以被导出的文本文件和需要进一步探讨graphML对象Cytoscape (www.cytoscape.org),祷告(www.yworks.com),或类似的软件工具。
独立于选择scRNA-seq平台,深或浅,表是一个数据读取或独特的分子标识符(UMI)计数,每单个细胞和一行每一列基因。初始处理需要准备这些数据后续分析和我们决定为了方便提出一个通用的解决方案,但用户可以很容易地替代自己的计算。雨果基因名称(符号)提供在表的第一列。
每个分析是围绕一个工作目录(或项目文件夹):
包含读计数的文件应放置在工作目录。
数据处理就可以开始:
的data_prepare ()函数执行之前排除了非表达基因读计数正常化。
规范化数据被提交到一个聚类算法来识别细胞亚群:
# > 4集群检测# >集群1 - > 17细胞# >集群2 - > 288 # # > >集群3 - > 8细胞集群4 - > 87个细胞
我们设置了参数方法simlr
,导致SIMLR ()SIMLR包的功能[1]。的SIMLR_Estimate_Number_of_Clusters ()函数确定集群的数量,2到n (n = 10)。
接下来,差异表达基因在一个集群中使用的比别人更确定cluster_analysis ()函数,该函数依赖刨边机。自动创建在一个结果表聚类分析文件夹:
上面的初步步骤完成后,SingleCellSignalR可用于生成细胞互动列表使用吗cell_signaling ()功能:
信号< -cell_signaling(data =数据,基因=rownames(数据),集群=clust美元集群,写=假)table_dge_cluster 1 # >没有这样的文件。三种聚类分析的文件夹table_dge_cluster 2 # >没有这样的文件。三种聚类分析的文件夹如table_dge_cluster 3 # >没有这样的文件。三种聚类分析的文件夹如table_dge_cluster 4 # >没有这样的文件。三种聚类分析的文件夹# >旁分泌信号:# >检查细胞类型之间的信号从集群1 # > 22交互集群2从集群1 # > 21交互集群3# > 9集群交互从集群1到4# > 0无显著交互发现从集群2集群1# > 9集群交互从集群2到3# > 2集群交互从集群2到4从集群3集群1 # > 55交互从集群3 # > 43交互集群2# > 60交互集群集群3 - 4所示从集群4集群1 # > 2的相互作用# > 8从集群4集群2的相互作用从集群4集群3 # > 16交互
一个细胞间的网络也可以生成映射整体配体/受体交互调用inter_network ()功能:
inter.net < -inter_network(data =数据,信号=信号,基因=的基因,集群=clust美元集群,写=假)1 # >做集群和集群2…好吧1 # >做集群和集群3…好吧1 # >做集群和集群4…好吧2 # >做集群和集群3…好吧2 # >做集群和集群4…好吧3 # >做集群和集群1…好吧3 # >做集群和集群2…好吧3 # >做集群和集群4…好吧4 # >做集群和集群1…好吧4 # >做集群和集群2…好吧4 # >做集群和集群3…好吧
此时细胞间网络生成和导出的文本和graphML格式网络文件夹中。
摘要细胞集群之间的交互可以输出的形式的和弦图visualize_interactions ()功能:
这个函数将创建一个情节在R图窗口。
两个集群之间的交互的细节,例如集群1和2,也可以与情节所示窗口visualize_interactions ()函数。注意,在下面的例子中我们要求两对细胞集群的显示,对1包含交互集群从1到2,和一对4从集群2比1。(名(信号)
返回在每一对细胞集群名称,看到的功能visualize_interactions ()细节。)
而这些情节中可以保存为pdf文件图片文件夹使用write.in
论点的visualize_interactions ()函数。
红色的
红色的
红色的
SingleCellSignalR包函数有许多参数的参数,用户可以改变以适应她的需求(见参考手册的更多细节)。此外,一些方便的功能,上面没有说明提供给生成额外的情节或报告。
后运行的例子快速启动节中,用户可以定义细胞集群后的输出cell_classifier ()。演示数据集的一个子集组成的10倍PBMC数据集[3],即免疫细胞。t-SNE映射的计算聚类()功能也将被使用。在这个例子中,我们将设置plot.details
参数的监控阈值的选择基因签名的分数。
类=cell_classifier(data =数据,基因=rownames(数据),标记=标记(c(“免疫”)),tsne =clust美元”t-SNE”,plot.details =真正的,写=假)
让我们使用获得的细胞集群cell_classifier ()函数。尽管“定义”细胞可能是有趣的在某些情况下,他们在这里形成一个异构集群似乎因为他们代表细胞在两种状态之间的转换(“t细胞”和“细胞毒性细胞”或“中性粒细胞”和“巨噬细胞”,见上面的热图)。我们丢弃这些细胞。
#定义集群向量和集群名称集群< -类美元集群c.names < -类美元c.names#删除未定义的细胞数据< -数据(集群! =(马克斯(集群)))tsne < -clust美元”t-SNE”(集群! =(马克斯(集群)))c.names < -c.names [- - - - - -马克斯(集群)]集群< -集群(集群! =(马克斯(集群)))
然后可以进行分析。
clust。安娜< -cluster_analysis(data =数据,基因=rownames(数据),集群=集群,c.names =c.names,写=假)基因差异表达# >磨边机(dge)处理:# >寻找在t细胞的差异表达基因# >寻找在b细胞的差异表达基因# >寻找在巨噬细胞的差异表达基因# >寻找差异表达基因在细胞毒性细胞# >中性粒细胞中寻找差异表达的基因
一旦完成了聚类分析,cell_signaling (),inter_network ()可以使用函数。
信号< -cell_signaling(data =数据,基因=的基因,集群=集群,c.names =c.names,写=假)# >没有table_dge_T-cells等文件。三种聚类分析的文件夹# >没有table_dge_B-cells等文件。三种聚类分析的文件夹# >没有table_dge_Macrophages等文件。三种聚类分析的文件夹# > table_dge_Cytotoxic细胞没有这样的文件。三种聚类分析的文件夹# >没有table_dge_Neutrophils等文件。三种聚类分析的文件夹# >旁分泌信号:# >检查细胞类型之间的信号# > 10 t细胞和b细胞的相互作用# > 20 t细胞和巨噬细胞的相互作用# > 20 t细胞的细胞毒性细胞的相互作用# > 24 t细胞和中性粒细胞的交互# > 5 b细胞和t细胞的相互作用# > 26 b细胞和巨噬细胞的相互作用# > 19 b细胞的细胞毒性细胞的交互29 # > b细胞和中性粒细胞的交互# > 2从巨噬细胞、t细胞的相互作用11 # >从巨噬细胞、b细胞的相互作用# > 20从巨噬细胞的细胞毒性细胞的相互作用# > 1巨噬细胞和中性粒细胞的交互# > 2从细胞毒性t细胞细胞的相互作用# > 4从细胞毒性细胞b细胞的相互作用# > 21从细胞毒性细胞巨噬细胞相互作用# > 21从细胞毒性细胞中性粒细胞的交互7 # >中性粒细胞的t细胞的相互作用# > 12从中性粒细胞、b细胞的相互作用7 # >中性粒细胞和巨噬细胞的相互作用29 # >中性粒细胞的细胞毒性细胞的相互作用inter.net < -inter_network(data =数据,信号=信号,基因=的基因,集群=集群,写=假)# >做t细胞和b细胞……好吧# >做t细胞和巨噬细胞……好吧# >做t细胞和细胞毒性细胞……好吧# >做t细胞和中性粒细胞……好吧# >做b细胞和t细胞…好吧# >做b细胞和巨噬细胞……好吧# >做b细胞和细胞毒性细胞……好吧# >做b细胞和中性粒细胞……好吧# >做巨噬细胞和t细胞……好吧# >做巨噬细胞和b细胞……好吧# >做巨噬细胞和细胞毒性细胞…好吧# >做巨噬细胞和中性粒细胞……好吧# >做细胞毒性细胞和t细胞……好吧# >做细胞毒性细胞和b细胞……好吧# >做细胞毒性细胞和巨噬细胞……好吧# >做细胞毒性细胞和中性粒细胞……好吧# >做中性粒细胞和t细胞……好吧# >做中性粒细胞和b细胞……好吧# >做中性粒细胞和巨噬细胞……好吧# >做中性粒细胞和细胞毒性细胞……好吧
如果我们看一看信号[[6]]
(或信号[[" B-cells-Macrophages "]]
)
信号[[6]]LRscore # > b细胞巨噬细胞相互作用类型0.9154102 # > 2589 RPS19 C5AR1旁分泌0.8673637 # > 1587 HSP90B1 ASGR1旁分泌0.8647858 # > 1589 HSP90B1 LRP1恰巧旁分泌0.8373524 # > 2599 RPS27A TLR4旁分泌0.8035628 # > 1592 HSP90B1 TLR4旁分泌0.7773343 # > 452 CALR LRP1恰巧旁分泌0.7567524 # > 1428 GNAI2 C5AR1旁分泌0.7487672 # > 2969 UBA52 TLR4旁分泌0.7366246 # > 2989年哥伦比亚大学TLR4旁分泌0.7313738 # > 2510 PTMA VIPR1旁分泌0.7095773 # > 3230 CD99 PILRA旁分泌0.7049480 # > 2049 LTB LTBR旁分泌0.7007288 # > 228 B2M HFE旁分泌0.6997901 # > 1441 GNAI2 FPR1旁分泌0.6561746 # > 2034 LRPAP1 LRP1恰巧旁分泌0.6542829 # > 1568 HMGB1 TLR4旁分泌0.6505954 # > 2979 UBB TLR4旁分泌0.6234452 # > 224 B2M CD1B旁分泌0.6234452 # > 235 B2M KLRD1旁分泌0.6184186 # > 1473玲娜VIPR1旁分泌0.6135906 # > 2457 PSAP LRP1恰巧旁分泌0.6071115 # > 1471玲娜PTGIR旁分泌0.6027855 # > 2954 UBA52 ACVR1旁分泌0.6027855 # > 2964 UBA52 NOTCH1旁分泌0.5851681 # > 1567 HMGB1 THBD旁分泌0.5301838 # > 626 CD55 ADGRE2旁分泌
我们可以感兴趣的基因参与途径与受体的利益在一个集群的兴趣。让我们说ASGR1在“巨噬细胞”。
内部=intra_network(goi =“ASGR1”,data =数据,基因=rownames(数据),集群=集群,coi =“巨噬细胞”,c.names =c.names,信号=信号,写=假)
现在,让我们把细胞类型之间的信号的概述。
让我们更深层次的看“t细胞”和“b细胞之间的信号为例。
以下命令将保存这些情节图片文件夹中。
在这个例子中,我们使用scRNAseq数据集来自Tirosh et al。[4]。我们只使用数据从患者80人。
备注:人能注意到零率低于前面的例子也反映了这样一个事实:测序是更深层次的。
我们知道这个数据集是由黑色素瘤细胞及其微环境,我们因此定义标记表使用标记()函数。
>my.markers<-标记(类别=c(“免疫”,“开心”,“黑色素瘤”))>头(my.markers)T- - - - - -B细胞- - - - - -DC细胞巨噬细胞细胞毒性细胞肥大细胞中性粒细胞NK细胞Treg内皮细胞战乱国家黑素瘤1张CD19 CD163 PRF1 CCL13 TPSB2 FPR1 XCL1 FOXP3 PECAM1 FAP米娅2CD3D CD79A CD14 GZMA CD209 TPSAB1 SIGLEC5 XCL2 VWF THY1酪氨酸3CD3E CD79B CSF1R GZMB HSD11B1 CPA3 CSF3R NCR1 CDH5宽带SLC45A24CD3G黑色C1QC NKG7 MS4A2 FCAR KIR2DL3 CLDN5 COL1A1 CDH195CD8A MS4A1 VSIG4 GZMH HDC FCGR3B KIR3DL1 PLVAP COL1A2 PMEL6SIRPG BANK1 C1QA KLRK1 CEACAM3 KIR3DL2 ECSCR COL6A1 SLC24A5
让我们执行聚类。在这个例子中,我们设置了方法“kmeans”和论点n参数12。
>clust < -聚类(data =数据,n =12,方法=“kmeans”)估计数量的集群估计集群的数量=66集群检测集群1- >157年细胞集群2- >15细胞集群3- >137年细胞集群4- >6细胞集群5- >114年细胞集群6- >51细胞
现在我们利用标记
论点的cluster_analysis ()函数使用my.markers上面得到的标记()函数。
>clust。安娜< -cluster_analysis(data =数据,基因=rownames(数据),集群=clust美元集群,标记=my.markers)磨边机差异基因表达式(dge)处理:看为差异表达基因在集群1看为差异表达基因在集群2看为差异表达基因在集群3看为差异表达基因在集群4看为差异表达基因在集群5看为差异表达基因在集群6
我们可以看到集群2和5是定义良好的,它们分别是癌症相关成纤维细胞(保护)和黑色素瘤细胞。集群6也明显内皮细胞组成。集群1和2的免疫细胞,但集群没有成功的正确排序和集群4数量只有6细胞。这些似乎并不均匀,我们决定移除它们。
然后我们可以命名集群之前手动进行分析。
>c.names < -c(“免疫1”,“战乱国家”,“免疫2”,“黑色素瘤”,“内皮”)>信号< -cell_signaling(data =数据,基因=rownames(数据),集群=集群,c.names =c.names)旁分泌信号:检查为信号之间的细胞类型78年相互作用的免疫1对战乱国家30.相互作用的免疫1对黑素瘤11相互作用的免疫1对内皮67年从战乱国家免疫的相互作用185年从战乱国家免疫的相互作用286年从战乱国家黑色素瘤的交互78年从战乱国家内皮的交互84年相互作用的免疫2对战乱国家55相互作用的免疫2对黑素瘤44相互作用的免疫2对内皮12从黑素瘤免疫的相互作用133从黑素瘤到战乱国家的交互19从黑素瘤免疫的相互作用212从黑素瘤血管内皮的交互53从内皮细胞免疫的相互作用133从内皮战乱国家的交互69年从内皮细胞免疫的相互作用228从内皮黑色素瘤的交互
备注:dge的表的名称cluster_analysis根据集群名称文件夹必须改变(c.names)。
现在想象!
备注:我们观察到在上面的弦图中,突出显示的“特定的”交互一本厚厚的黑线。
让我们看看其中的一个特定的交互使用expression_plot_2 ()函数。
红色的
红色的
红色的
感谢您阅读本指南和使用SingleCellSignalR。
王B,朱J,皮尔森E, Ramazzotti D, Batzoglou s单细胞RNA-seq数据的可视化和分析,基于相似的学习。Nat方法。2017;14:414-6。
麦卡锡DJ,陈Y,史密斯星期。微分表达式的分析多因素RNA-Seq实验对生物变异。核酸研究》2012;40:4288 - 97。
从健康捐献者8 k PBMCs[网络]。2017年。可以从:https://support.10xgenomics.com/single-cell-gene-expression/datasets/2.1.0/pbmc8k
Tirosh我,伊扎尔B, Prakadan SM,沃兹沃思MH,崔西D, Trombetta JJ, et al。解剖的多细胞生态系统由单细胞RNA-seq转移性黑素瘤。科学。2016;352:189 - 96。