内容

1简介

在这个小插图中,我们描述如何生成一个SingleCellExperiment对象的观测值和聚类结果相结合DuoClustering2018方法来查看和可视化生成的对象iSEE(Rue-Albrecht et al. 2018)

2加载必要的包

suppressPackageStartupMessages({library(singlecel实验)library(DuoClustering2018) library(dplyr) library(tidyr)})
## snapshotDate(): 2022-10-24

3.检索数据集

方法中描述了从包中检索数据集的不同方法plot_performance装饰图案。在这里,我们将使用包中提供的快捷功能加载数据集。

dat <- sce_filteredExpr10_Koh()
参见?DuoClustering2018和browseVignettes('DuoClustering2018')获取文档
##从缓存加载

4读取一组聚类结果

对于这个数据集,我们还加载了一组使用不同聚类方法获得的聚类结果。

res <- clustering_summary_filteredExpr10_Koh_v2()
参见?DuoClustering2018和browseVignettes('DuoClustering2018')获取文档
##从缓存加载

5合并数据和聚类结果

我们为一次运行和一组不同数量的集群向数据集添加集群标签。

res < - res % > % dplyr:过滤器(运行= = 1 & k % % c(3、5、9))% > % dplyr:: group_by(法、k) % > % dplyr::过滤器(is.na(分辨率)|分辨率= =分辨率[1])% > % dplyr:解组()% > % tidyr::统一(col = method_k方法,k, 9 =“_”,删除= TRUE) % > % dplyr::选择(单元、method_k集群)% > % tidyr::传播(键= method_k值=集群)colData (dat) < - DataFrame (as.data.frame (colData (dat)) % > % dplyr:: left_join (res, = c(“运行”=“细胞”)))头(colData (dat))
## 6行55列的数据框架##运行LibraryName phenoid libsize功能下降。drop total_features ## <字符> <字符> <字符> <逻辑> <逻辑>  ## 1 SRR3952323 H7hESC H7hESC FALSE FALSE 4887 ## 2 SRR3952325 H7hESC H7hESC FALSE FALSE 4888 ## 4 SRR3952327 H7hESC H7hESC FALSE FALSE 4879 ## 5 SRR3952328 H7hESC H7hESC FALSE FALSE 4873 ## 6 SRR3952329 H7hESC H7hESC FALSE FALSE 4893 ## <数字> <数字> <数字> ## 1 3.68984 2248411 6.35188 ## 23.68913 2271617 3.68922 584682 5.76692 6.35634 # # 3 # # 4 3.68842 3191810 6.50404 # # 5 3.68789 3191810 3.68966 2187289 6.33991 6.34052 # # 6 # # pct_counts_top_50_features pct_counts_top_100_features # # <数字> <数字> # # 1 # # 2 24.6725 - 32.2228 18.2790 - 25.9754 20.8674 - 29.0039 22.7328 - 30.2060 # # 3 # # 4 # 5 # 21.2879 - 29.4237 # 6 # 20.5931 - 27.7401 # # pct_counts_top_200_features pct_counts_top_500_features is_cell_control # # <数字> <数字> <逻辑> # # 1 35.5376 41.5474 52.4109假# # 257.9692假# # 3 39.4313 - 55.2858假# # 4 38.7856 - 56.0209假# # 5 39.3077 - 56.6410假# # 6 36.7819 - 52.7547假# # sizeFactor CIDR_3 CIDR_5 CIDR_9 FlowSOM_3 FlowSOM_5 # # <数字> <人物> <人物> <人物> <人物> <人物> # 1.889865 # 1 1 1 1 2 2 # # 2 1 1 1 2 2 # # 3 0.486899 1.810539 2.562950 1 1 1 2 2 # # 4 1 1 1 2 2 # # 5 1.848037 - 1 1 1 2 2 # # 6 1.897451 - 1 1 1 2 2 # # FlowSOM_9 PCAHC_3 PCAHC_5 PCAHC_9 PCAKmeans_3 PCAKmeans_5 # # <人物> <人物> <人物><人物> <人物> <人物> # # 1 4 1 1 1 3 1 # # 2 4 1 1 1 3 1 # # 3 4 1 1 1 3 1 # # 4 4 1 1 1 3 1 # # 1 # # 6 5 4 1 1 1 3 4 1 1 1 3 1 # # PCAKmeans_9 RaceID2_3 RaceID2_5 RaceID2_9 RtsneKmeans_3 RtsneKmeans_5 # # <人物> <人物> <人物> <人物> <人物> <人物> # # 1 4 1 1 1 1 1 # # 2 4 2 2 2 1 1 # # 3 4 2 2 2 1 1 # # 4 4 1 1 1 1 1 # # 5 4 1 1 1 1 1 # # 6 4 2 2 1 1 # # RtsneKmeans_9 SAFE_3 SAFE_5 SAFE_9 SC3_3 SC3_5 # # <人物> <人物> <人物> <人物> <人物> ## 1 9 2 1 3 1 3 ## 2 9 2 1 5 1 3 ## 3 9 2 1 3 1 3 ## 4 9 2 1 5 1 3 ## 5 9 2 1 5 1 3 ## 6 9 2 1 5 1 3 ## SC3_9 SC3svm_3 SC3svm_5 SC3svm_9 Seurat_9 TSCAN_3 ##       ## 1 4 3 3 3 5 1 ## 2 4 3 3 3 5 1 ## 3 4 3 3 3 5 3 ## 4 4 3 3 3 5 1 ## 5 4 3 3 3 5 2 ## 6 4 3 3 3 5 1 ## TSCAN_5 TSCAN_9 ascend_3 ascend_5 ascend_9 monocle_3 ##       ## 1 1 1 1 NA NA 3 ## 2 1 2 1 NA NA 3 ## 3 3 2 1 NA NA 3 ## 4 1 1 1 NA NA 3 ## 5 2 2 1 NA NA 3 ## 6 1 1 1 NA NA 3 ## monocle_5 monocle_9 pcaReduce_3 pcaReduce_5 pcaReduce_9 ##      ## 1 3 3 1 5 5 ## 2 3 3 1 5 5 ## 3 3 3 1 5 5 ## 4 3 3 1 5 5 ## 5 3 3 1 5 5 ## 6 3 3 1 5 5

6可视化与iSEE

由此产生的SingleCellExperiment可以使用,例如iSEE包中。这对于进一步了解通过不同聚类方法推断出的分区,在低维表示(PCA或t-SNE)中可视化这些分区,以及研究它们与已知或推断出的细胞分组的一致程度是有用的。

if (require(iSEE)) {iSEE(dat)}

7会话信息

sessionInfo ()
## R正在开发中(不稳定)(2022-10-25 r83175) ##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 22.04.1 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.17-bioc/R/lib/libRblas。so ## LAPACK: /usr/lib/x86_64-linux-gnu/ LAPACK /liblapack.so.3.10.0 ## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats4 stats graphics grDevices utils datasets methods ##[8]基础## ##其他附加包:[1] tidyr_1.2.1 dplyr_1.0.10 ## [3] DuoClustering2018_1.17.0 SingleCellExperiment_1.21.0 ## [5] SummarizedExperiment_1.29.0 Biobase_2.59.0 ## [7] genomicranges_1.1.1.0 GenomeInfoDb_1.35.0 ## [9] IRanges_2.33.0 S4Vectors_0.37.0 ## [11] BiocGenerics_0.45.0 MatrixGenerics_1.11.0 ## [13] matrixStats_0.62.0 BiocStyle_2.27.0 ## ##通过命名空间加载(并且没有附加):# # # # [1] tidyselect_1.2.0 viridisLite_0.4.1 [3] blob_1.2.3 Biostrings_2.67.0 # # [5] filelock_1.0.2 viridis_0.6.2 # # [7] bitops_1.0-7 fastmap_1.1.0 # # [9] rcurl_1.98 - 1.9 BiocFileCache_2.7.0 # # [11] promises_1.2.0.1 digest_0.6.30 # # [13] mime_0.12 lifecycle_1.0.3 # # [15] ellipsis_0.3.2 KEGGREST_1.39.0 # # [17] interactiveDisplayBase_1.37.0 RSQLite_2.2.18 # # [19] magrittr_2.0.3 compiler_4.3.0 # # [21] rlang_1.0.6 sass_0.4.2 # # [23] tools_4.3.0 utf8_1.2.2 # # [25] yaml_2.3.6 knitr_1.40 # # [27][35] fansi_1.0.3 ExperimentHub_2.7.0 ## [37] xtable_1.8-4 colorspace_2.0-3 ## [39] ggplot2_3.3.6 scales_1.2.1 ## [41] cli_3.4.1 crayon_1.5.2 ## [43] rmarkdown_2.17 generics_0.1.3 ## [45] httr_1.4.4 reshape2_1.4.4 ## [47] DBI_1.1.3 cachem_1.0.6 ## [49] string_1 .4.1 zlibbioc_1.45.0 ## b[51] ggthemes_4.2.4 assertthat_0.2.1 ## [53] AnnotationDbi_1.61.0 BiocManager_1.30.19[55] XVector_0.39.0 vctrs_0.5.0 ## [57] Matrix_1.5-1 jsonlite_1.8.3 ## [59] bookdown_0.29 bit64_4.0.5 ## [61] jquerylib_0.1.4 glue_1.6.2 ## [63] stringi_1.7.8 gtable_0.3.1 ## [65] later_1.3.0 BiocVersion_3.17.0 ## [67] munsell_0.5.0 tibble_3.1.8 ## [69] pillar_1.8.1 rappdirs_0.3.3 ## [71] htmltools_0.5.3 GenomeInfoDbData_1.2.9 ## [73] R6_2.5.1 dbplyr_2.2.1 ## [75] evaluate_0.17 shiny_1.7.3 ## [77] lattice_0.20-45 AnnotationHub_3.7.0 ## [79] png_0.1-7 memoise_2.0.1 ## [81] httpuv_1.6.6 bslib_0.4.0 ## [83] Rcpp_1.0.9 gridExtra_2.3 ## [85] xfun_0.34 pkgconfig_2.0.3

参考文献

Rue-Albrecht, K, F Marini, C Soneson, ATL Lun。2018。“iSEE:交互式摘要实验浏览器。”F1000Research7: 741。