1概述

这个包提供了Bioconductor之间的轻量级接口SingleCellExperiment数据结构和PythonAnnData基于单细胞分析环境。其理念是让用户和开发人员能够轻松地在这些框架之间移动数据,从而在2021欧洲杯体育投注开户R/Bioconductor和Python之间构建一个多语言分析管道。

2读写H5AD文件

readH5AD ()函数可以用来读取SingleCellExperiment从H5AD文件。可以用通常的方法来操作SingleCellExperiment文档。

library(zellkonverter) #获取H5AD示例文件。example_h5ad < -系统。文件(“extdata”、“krumsiek11。h5ad", package = "zellkonverter") readH5AD(example_h5ad)
## class: singlecellexperexperiment ## dim: 11 640 ## metadata(2): highlight iroot ## assays(1): x# # rownames(11): Gata2 Gata1…EgrNab Gfi1 ## rowData names(0): ## colnames(640): 0 1…158-3 159-3 ## colData names(1): cell_type ## reducedDimNames(0): ## mainExpName: NULL ## altExpNames(0):

我们也可以写aSingleCellExperiment到H5AD文件中writeH5AD ()函数。下面展示的是Zeisel小鼠大脑的经典数据集scRNAseq包中。生成的文件可以直接在兼容的基于python的分析框架中使用。

库(sciselbraindata) sce_zeisel <- ZeiselBrainData() out_path <- tempfile(pattern = ".h5ad") writeH5AD(sce_zeisel, file = out_path)

3.之间的转换SingleCellExperiment而且AnnData对象

2021欧洲杯体育投注开户控制Python环境的开发人员和高级用户可以直接在SingleCellExperiment而且AnnData对象使用SCE2AnnData ()而且AnnData2SCE ()实用工具。这些函数期望网状已与适当版本的anndata包中。我们建议使用蛇怪包来设置Python环境,然后再使用这些函数。

library(basilisk) library(scRNAseq) seger <- segerstolpe胰岛数据()往返<- basiliskRun(fun = function(sce){#将sce转换为AnnData: adata <- SCE2AnnData(sce) #可能在Python中做一些工作'adata': # BLAH BLAH BLAH #转换回sce: AnnData2SCE(adata)}, env = zellkonverterAnnDataEnv(), sce = seger)

包开发人员可以保2021欧洲杯体育投注开户证他们使用的Python包的版本与zellkonverter通过使用AnnDataDependencies ()函数来设置它们的Python环境。

AnnDataDependencies ()
# #[1]“anndata = = 0.8.0”“h5py = = 3.6.0”“hdf5 = = 1.12.1”“的作用= = 8.1.0”# #[5]“numpy = = 1.22.3”“包装= = 21.3”“熊猫= = 1.4.2”“python = = 3.8.13”# #[9]“scipy = = 1.7.3”“sqlite = = 3.38.2”

该函数还可用于返回使用较旧版本的环境的依赖关系anndata

AnnDataDependencies (version = " 0.7.6”)
# #[1]“anndata = = 0.7.6”“h5py = = 3.2.1”“hdf5 = = 1.10.6”“安装7.1.1的作用= = # #[5]“numpy = = 1.20.2”“包装= = 20.9”“熊猫= = 4”“scipy = = 1.6.3”# #[9]“sqlite = = 3.35.5”

4进展的消息

中的函数默认情况下zellkonverter不要显示任何关于进度的信息,但这可以通过设置verbose = TRUE论点。

readH5AD(example_h5ad, verbose = TRUE)
## class: singlecellexperexperiment ## dim: 11 640 ## metadata(2): highlight iroot ## assays(1): x# # rownames(11): Gata2 Gata1…EgrNab Gfi1 ## rowData names(0): ## colnames(640): 0 1…158-3 159-3 ## colData names(1): cell_type ## reducedDimNames(0): ## mainExpName: NULL ## altExpNames(0):

如果您希望在默认情况下查看所有函数的进度消息,可以使用setZellkonverterVerbose ()函数。

setZellkonverterVerbose(TRUE)

5会话信息

sessionInfo ()
## R版本4.2.0(22-04-22)##平台:x86_64-pc-linux-gnu(64位)##运行在:Ubuntu 20.04.4 LTS ## ##矩阵产品:default ## BLAS: /home/biocbuild/bbs-3.15-bioc/R/lib/libRblas. #因此## LAPACK: /home/biocbuild/bbs-3.15-bio /R/lib/libRlapack。因此## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# [3] LC_TIME=en_GB LC_COLLATE= c# [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# [9] LC_ADDRESS=C LC_TELEPHONE= c# [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats4 stats graphics grDevices utils datasets methods ## [8] base ## ##其他附加的包:# [5] Biobase_2.56.0基因组icranges_1 .48.0 ## [7] GenomeInfoDb_1.32.2 IRanges_2.30.0 ## [9] S4Vectors_0.34.0 biocgenerics_0.0.4 2.0 ## [11] MatrixGenerics_1.8.0 matrixStats_0.62.0 ## [13] zellkonverter_1.6.1 knitr_1.39 ## [15] BiocStyle_2.24.0 ## ##通过命名空间加载(并没有连接):# # # # [1] ProtGenerics_1.28.0 bitops_1.0-7 [3] bit64_4.0.5 progress_1.2.2 # # [5] filelock_1.0.2 httr_1.4.3 # # [7] rprojroot_2.0.3 tools_4.2.0 # # [9] bslib_0.3.1 utf8_1.2.2 # # [11] R6_2.5.1 lazyeval_0.2.2 # # [13] DBI_1.1.2 withr_2.5.0 # # [15] prettyunits_1.1.1 tidyselect_1.1.2 # # [17] bit_4.0.4 curl_4.3.2 # # [19] compiler_4.2.0 cli_3.3.0 # # [21] basilisk.utils_1.8.0 xml2_1.3.3 # # [23] DelayedArray_0.22.0 rtracklayer_1.56.0 # # [25] bookdown_0.26 sass_0.4.1 # # [27] rappdirs_0.3.3 Rsamtools_2.12.0# # # # [29] stringr_1.4.0 digest_0.6.29 [31] rmarkdown_2.14 XVector_0.36.0 # # [33] pkgconfig_2.0.3 htmltools_0.5.2 # # [35] ensembldb_2.20.1 dbplyr_2.1.1 # # [37] fastmap_1.1.0 rlang_1.0.2 # # [39] RSQLite_2.2.14 shiny_1.7.1 # # [41] BiocIO_1.6.0 jquerylib_0.1.4 # # [43] generics_0.1.2 jsonlite_1.8.0 # # [45] BiocParallel_1.30.2 dplyr_1.0.9 # # [47] rcurl_1.98 - 1.6 magrittr_2.0.3 # # [49] GenomeInfoDbData_1.2.8 Matrix_1.4-1 # # [51] Rcpp_1.0.8.3 fansi_1.0.3 # # [53] reticulate_1.25 lifecycle_1.0.1 # # [55]stringi_1.7.6 yaml_2.3.5 # # [57] zlibbioc_1.42.0 BiocFileCache_2.4.0 # # [59] AnnotationHub_3.4.0 grid_4.2.0 # # [61] blob_1.2.3 parallel_4.2.0 # # [63] promises_1.2.0.1 ExperimentHub_2.4.0 # # [65] crayon_1.5.1 dir.expiry_1.4.0 # # [67] lattice_0.20-45 Biostrings_2.64.0 # # [69] GenomicFeatures_1.48.1 hms_1.1.1 # # [71] KEGGREST_1.36.0 pillar_1.7.0 # # [73] rjson_0.2.21 biomaRt_2.52.0 # # [75] xml_3.99 - 0.9 glue_1.6.2 # # [77] BiocVersion_3.15.2 evaluate_0.15 # # [79] BiocManager_1.30.17 png_0.1-7 # # [81]vctrs_0.4.1 httpuv_1.6.5 ## [83] purrr_0.3.4 assertthat_0.2.1 ## [85] cachem_1.0.6 xfun_0.31 ## [87] mime_0.12 xtable_1.8-4 ## [89] AnnotationFilter_1.20.0 restfulr_0.0.13 ## [91] later_1.3.0 tibble_1 .1.7 ##[93]基因组校正s_1.32.0 AnnotationDbi_1.58.0 ## [95] memoise_2.0.1 ellipsis_0.3.2 ## [97] interactiveDisplayBase_1.34.0 here_1.0.1