此小插图将指导您如何访问和操作SCoPE2数据集SingleCellMultimodal包中。

1安装

如果(!requireNamespace("BiocManager", quiet = TRUE)) install.packages("BiocManager")::install("SingleCellMultiModal")

1.1加载包

库(SingleCellMultiModal)库(MultiAssayExperiment)

2SCoPE2

SCoPE2是一种基于质谱(MS)的单细胞蛋白质组学协议,以非靶向的方式量化单细胞的蛋白质组。它最初是由Specht等人(2021)

2.1下载数据集

用户可以使用默认选项查看可用的数据集。

SCoPE2("巨噬细胞分化",mode = "*", version = "1.0.0", dry.run = TRUE)
## snapshotDate(): 2022-04-19
## EH4695 rna_assays 68.7 Mb HDF5Matrix 2020-09-24 ## EH4696 rna_se 0.2 Mb singlecel实验实验2020-09-24 ## rdatadateremoved ## 1  ## 2  ## 3 

或者简单地跑步:

SCoPE2(“macrophage_differentiation”)
## snapshotDate(): 2022-04-19
## EH4695 rna_assays 68.7 Mb HDF5Matrix 2020-09-24 ## EH4696 rna_se 0.2 Mb singlecel实验实验2020-09-24 ## rdatadateremoved ## 1  ## 2  ## 3 

2.2可用项目

目前,只有macrophage_differentiation是可用的。

2.3检索数据

您可以从中检索实际数据ExperimentHub通过设置dry.run = FALSE.此示例检索的完整数据集(转录组和蛋白质组)macrophage_differentiation项目:

scope2 <- scope2("巨噬细胞分化",modes = "rna|蛋白",dry.run = FALSE)
## split.default(fileppaths, fact):数据长度不是## split变量的倍数
scope2
一个MultiAssayExperiment对象,包含2个列出的实验,使用用户自定义名称和各自的类。##包含一个长度为2的ExperimentList类对象:## [1]protein: singlecelexperimental with 3042 row and 1490 columns ## [2] rna: singlecelexperimental with 32738 row and 20274 columns ##功能:## experiments() -获取ExperimentList实例## colData() -主/表型DataFrame ## sampleMap() -样本协调DataFrame ## ' $ ', '[', '[[' -提取colData列,子集,或实验## *格式()-转换为长或宽的DataFrame ## assays() -转换ExperimentList为矩阵的SimpleList ## exportClass() -保存数据到平面文件

3.巨噬细胞分化项目

该数据集由Slavov实验室(???).它包含了巨噬细胞和单核细胞的单细胞蛋白质组学和单细胞RNA测序数据。产生这些数据的研究目的是了解在缺乏细胞因子的情况下,同种单核细胞是否分化为具有同种或异种特征的巨噬细胞。转录组学和蛋白质组学的获取是在相似细胞的两个独立子集上进行的(相同的实验设计)。样本的细胞类型仅为蛋白质组学数据。蛋白质组学数据是从作者的论文中检索的。网站转录组数据从GEO数据库中检索(登录id:GSE142392).

有关协议的更多信息,请参见???

3.1数据版本

只有版本1.0.0目前可用。

macrophage_differentiation此包中的数据集包含两个分析:核糖核酸而且蛋白质

3.1.1细胞注释

单细胞蛋白质组数据包含细胞类型注释(celltype)、样品制备批(batch_digest而且batch_sort)、色谱批(batch_chromatography),以及微软的收购运作(batch_MS).单细胞转录组数据分两批获得(batch_Chromium).请注意,由于组成这两种分析的细胞是不同的,因此蛋白质组学和转录组学都没有共同的细胞注释。因此注释中填满了NA相应的年代。

colData (scope2)
##数据框架与21764行和6列##单元类型batch_digest batch_sort batch_色谱## <字符> <字符> <字符> <字符> ## AAACCTGAGAAACCAT-1.1 NA NA NA NA NA ## AAACCTGAGACTAGGC-1.2 NA NA NA NA NA ## aaacctgagaggtagac -1.1 NA NA NA NA NA ## AAACCTGAGGCTAGGT-1.1 NA NA NA NA NA NA ## ... ... ... ... ...## i985巨噬细胞Q s8 LCA10 ## i987单核细胞Q s8 LCA10 ## i998单核细胞R s9 lca3 ## i999单核细胞R s9 LCB3 ## batch_MS batch_cr ## <字符> <因子> ## AAACCTGAGAAACCAT-1.1 NA 1 ## AAACCTGAGACTAGGC-1.2 NA 2 ## aaacctgagaggtaga -1.1 NA 1 ## AAACCTGAGGCTAGGT-1.1 NA 1 ## ... ... ...X190321S_LCA10_X_FP9..NA ## i986 X190321S_LCA10_X_FP9…X190321S_LCA10_X_FP9..n ## i998 X190914S_LCB3_X_16pl..n ## i999 X190914S_LCB3_X_16pl..NA

3.1.2转录组数据

你可以通过子集提取和检查转录组数据:

scope2 [[" rna "]]
##类:singlecel实验## dim: 32738 20274 ##元数据(0):## assays(1):计数## rownames(32738): MIR1302-10 FAM138A…AC002321.2 AC002321.1 ## rowData names(0): ## colnames(20274): AAACCTGAGAAACCAT-1.1 aaacctgagatgcacc -1.1…## TTTGTCATCGCTTAGA-1.2 TTTGTCATCGTAGATC-1.2 ## colData names(1): Batch ## reducedDimNames(0): ## mainExpName: NULL ## altExpNames(0):

数据相当大,因此使用HDF5后端存储在磁盘上。您可以通过查看分析数据矩阵来验证这一点。注意,这些计数是UMI计数。

试验(scope2[[“rna”]])(1:5,1:5)
## <5 x 5>稀疏矩阵类DelayedMatrix和类型“integer”:## AAACCTGAGAAACCAT-1.1…Aaacctgcaataacga-1.1 ## mir1302-10 0。0 ## fam138a 0;0 ## or4f5 0。0 ## rp11-34p13.7 0。0 ## rp11-34p13.8 0。0

3.1.3蛋白质组学数据

蛋白质分析包含ms - s蛋白质组学数据。数据经过样本和特征质量控制,归一化,日志转换,估算和批量校正。有关数据处理的详细信息可在另一个装饰图案.你可以像提取转录组数据一样提取蛋白质组数据:

scope2[[“蛋白质”]]
##类:singlecel实验## dim: 3042 1490 ##元数据(0):## assays(1): logexprs ## rownames(3042): A0A075B6H9 A0A0B4J1V0…Q9Y6X6 Q9Y6Z7 ## rowData names(0): ## colnames(1490): i4 i5…i2766 i2767 ## colData names(5): celltype batch_digest batch_sort batch_chromatography ## batch_ms# # reducedDimNames(0): ## mainExpName: NULL ## altExpNames(0):

在这种情况下,蛋白质数据具有合理的大小,并直接加载到内存中。数据矩阵存储在logexprs.我们决定不使用传统的logcounts因为与scRNA-Seq不同,MS蛋白质组学测量的是强度而不是计数。

试验(scope2[[“蛋白质”]])(1:5,1:5)
A0A075B6H9 -0.01366062 - 0.18977307 0.08940234 0.05711272 ## A0A0B4J1V0 0.13875137 0.5383824 -0.35823777 -0.10122993 -0.10688821 ## A0A0B4J237 0.54897085 -0.2247036 0.50132075 -0.14652437 -0.40384721 ## A0A1B0GTH6 0.05392801 -0.3811629 0.07532757 0.29708811 -0.03003732 ## A0A1B0GUA6 -0.16910887 0.1542946 -0.14959632 0.14745758 0.03578250

4sessionInfo

sessionInfo ()
## R版本4.2.0 RC (2022-04-19 r82224) ##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.4 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.15-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.15-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats4 stats graphics grDevices utils datasets methods ##[8]基础## ##其他附加包:[5] MultiAssayExperiment_1.22.0 SummarizedExperiment_1.26.0 ## [7] Biobase_2.56.0 GenomicRanges_1.48.0 ## [9] GenomeInfoDb_1.32.0 IRanges_2.30.0 ## [11] S4Vectors_0.34.0 BiocGenerics_0.42.0 ## [13] MatrixGenerics_1.8.0 matrixStats_0.62.0 ## [15] BiocStyle_2.24.0 ## ##通过命名空间加载(并且没有附加):# # # # [1] bitops_1.0-7 bit64_4.0.5 [3] filelock_1.0.2 httr_1.4.2 # # [5] tools_4.2.0 bslib_0.3.1 # # [7] utf8_1.2.2 R6_2.5.1 # # [9] HDF5Array_1.24.0 DBI_1.1.2 # # [11] rhdf5filters_1.8.0 withr_2.5.0 # # [13] tidyselect_1.1.2 bit_4.0.4 # # [15] curl_4.3.2 compiler_4.2.0 # # [17] cli_3.3.0 formatR_1.12 # # [19] DelayedArray_0.22.0 bookdown_0.26 # # [21] sass_0.4.1 rappdirs_0.3.3 # # [23] stringr_1.4.0 digest_0.6.29 # # [25] SpatialExperiment_1.6.0 R.utils_2.11.0 # # [27] rmarkdown_2.14 XVector_0.36.0 # # [29]pkgconfig_2.0.3 htmltools_0.5.2 ## [31] sparseMatrixStats_1.8.0 limma_3.52.0 ## [33] dbplyr_2.1.1 fastmap_1.1.0 ## [35] rlang_1.0.2 RSQLite_2.2.12 ## [37] shiny_1.7.1 DelayedMatrixStats_1.18.0 ## [39] jquerylib_0.1.4 generics_0.1.2 ## [41] jsonlite_1.8.0 BiocParallel_1.30.0 ## [43] R.oo_1.24.0 dplyr_1.0.8 ## [45] RCurl_1.98-1.6 magrittr_2.0.3 ## [47] scuttle_1.6.0 GenomeInfoDbData_1.2.8 ## [49] Matrix_1.4-1 Rcpp_1.0.8.3 ## [51] Rhdf5lib_1.18.0 fansi_1.0.3 ## [53] R.methodsS3_1.8.1 lifecycle_1.0.1 ## [55] edgeR_3.38.0 stringi_1.7.6 ## [57] yaml_2.3.5 zlibbioc_1.42.0 ## [59] BiocFileCache_2.4.0 AnnotationHub_3.4.0 ## [61] grid_4.2.0 blob_1.2.3 ## [63] dqrng_0.3.0 parallel_4.2.0 ## [65] promises_1.2.0.1 ExperimentHub_2.4.0 ## [67] crayon_1.5.1 lattice_0.20-45 ## [69] beachmat_2.12.0 Biostrings_2.64.0 ## [71] KEGGREST_1.36.0 magick_2.7.3 ## [73] locfit_1.5-9.5 knitr_1.39 ## [75] pillar_1.7.0 rjson_0.2.21 ## [77] glue_1.6.2 BiocVersion_3.15.2 ## [79] evaluate_0.15 BiocManager_1.30.17 ## [81] vctrs_0.4.1 png_0.1-7 ## [83] httpuv_1.6.5 purrr_0.3.4 ## [85] assertthat_0.2.1 cachem_1.0.6 ## [87] xfun_0.30 DropletUtils_1.16.0 ## [89] mime_0.12 xtable_1.8-4 ## [91] later_1.3.0 tibble_3.1.6 ## [93] AnnotationDbi_1.58.0 memoise_2.0.1 ## [95] ellipsis_0.3.2 interactiveDisplayBase_1.34.0

参考文献

斯佩希特,哈里森,爱德华·埃默特,亚历山德拉·A·佩特尔斯基,R·格雷·霍夫曼,大卫·H·帕尔曼,马可·塞拉,彼得·哈尔琴科,安东尼斯·科勒和尼古拉·斯拉沃夫。使用SCoPE2对巨噬细胞异质性进行单细胞蛋白质组学和转录组学分析。基因组医学杂志。22(1): 50。