几十年来,NCI-60癌细胞系面板一直被用作抗癌药物筛选。该小组是作为发育治疗计划(DTP,http://dtp.nci.nih.gov/美国国家癌症研究所(NCI)。在NCI-60上已经测试了数千种化合物,这些化合物已被许多平台广泛表征为基因和蛋白质表达、拷贝数、突变等(Reinhold, et al., 2012)。CellMiner项目的目的(http://discover.nci.nih.gov/cellminer)一直致力于整合来自多个分析NCI-60的平台的数据,并为探索NCI-60数据提供一套强大的工具。
rcellminerData包中的所有数据都直接从CellMiner项目(http://discover.nci.nih.gov/cellminer)的网站。CellMiner使用来自发育治疗计划(DTP)的公共药物,https://dtp.nci.nih.gov),由他负责生成资料。对于那些希望访问没有通过我们的质量控制的活动数据的人,可以在CellMiner下载数据集页面(https://discover.nci.nih.gov/cellminer/loadDownload.do)下载化合物活性:DTP NCI-60.如果细胞系之间的范围很小,或者实验不可重复,则活动质量控制失败。下载的数据和用于生成此数据包的脚本都包含在本月/ extdata包的文件夹。
如果(!requireNamespace("BiocManager", quiet = TRUE) install.packages("BiocManager") BiocManager::install("rcellminer") BiocManager::install("rcellminerData")
负载rcellminer而且rcellminerData包:
库(rcellminer)库(rcellminerData)
使用以下命令可以获得所有可访问的小插图和方法的列表。
help.search(“rcellminerData”)
还可以检索有关药物数据或分子分析数据的特定信息
帮助(“drugData”)(“molData”)
数据rcellminerData存在于两个S4类对象:molData和drugData。molData包含在NCI-60上进行的分子分析(例如基因组学、蛋白质组学等)的结果,drugData包含药物反应分析的结果(Reinhold等,2012)。
molData是MolData S4类的一个实例,由2个插槽组成:eSetList和sampleData。eSetList是一个eSet对象的列表,可以是不同的维度;注意:在概念上,这类似于eSet对象,但不同之处在于eSet assayData插槽要求矩阵具有相等的维度。第二个插槽sampleData是一个MIAxE类实例,但是它的访问器getSampleData()返回一个data.frame,其中包含每个示例的信息。下面是可以在MolData对象上执行的可能操作的示例。
#获取MolData对象中的特征数据类型。名称(getAllFeatureData (molData))
MolData对象中的eSetList列表成员可以直接使用双方括号操作符引用,就像普通列表一样,该操作返回一个eSet对象。在rcellminerData的情况下,返回一个源自eSet的ExpressionSet。任何eSet派生类都可能被添加到eSetList中;将对象添加到eSetList将在后面的部分中描述。
class(molData[["exp"]]) geneExpMat <- exprs(molData[["exp"]])
关于MolData对象的示例信息可以使用getSampleData()访问,它返回一个data.frame。对于NCI-60,我们提供了每个细胞系的起源组织的信息。
TissueType“getSampleData (molData) [1:10]
可以将其他数据集添加到MolData对象中,如下所示,其中rcellminerData中提供的蛋白质数据被复制为“test”。这为用户提供了更广泛地使用MolData类的灵活性。
#添加数据molData[["test"]] <- molData[["pro"]] names(getAllFeatureData(molData))
药物活性(反应)数据在rcellminerDataNCI-60的封装。drugData是DrugData S4类的一个实例,它由3个槽组成:act、repeatAct和sampleData。act(跨多个重复的汇总数据)和repeatAct(行重复数据)都是作为ExpressionSet对象提供的活动数据槽。在下例中,由于跨多个重复的数据已经汇总,因此drugActMat的行数比drugRepeatActMat少,但列数(样本)相同。
drugActMat <- exprs(getAct(drugData)) dim(drugActMat) drugRepeatActMat <- exprs(getRepeatAct(drugData)) dim(drugRepeatActMat)
rcellminerData提供大量在NCI-60上测试药物的信息,包括结构信息、临床测试状态等。这些数据可以提取到data.frame中,如下所示:
drugAnnotDf <- as(featureData(getAct(drugData)), "data.frame") colnames(drugAnnotDf)
DrugData对象可以以与MolData对象相同的方式包含样例数据。在这种情况下rcellminerData,为drugData对象提供的样本数据将与为molData对象提供的样本数据相同。
相同的(getSampleData (molData) getSampleData (drugData))
sessionInfo ()
## R版本4.2.0 RC (2022-04-19 r82224) ##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.4 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.15-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.15-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC= c# # [3] LC_TIME=en_GB LC_COLLATE= c# # [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME= c# # [9] LC_ADDRESS=C lc_phone = c# # [11] LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats graphics grDevices utils datasets methods基础## ##其他附加包:## [1]knitr_1.39 BiocStyle_2.24.0 ## ##通过命名空间加载(且未附加):## [1] bookdown_0.26 digest_0.6.29 R6_2.5.1 ## [4] jsonlite_1.8.0 formatR_1.12 magrittr_2.0.3 ## [7] evaluate_0.15 stringi_1.7.6 rlang_1.0.2 ## [10] cli_3.3.0 jquerylib_0.1.4 bslib_0.3.1 ## [13] rmarkdown_2.14 tools_4.2.0 string_1 .4.0 ## [16] xfun_0.30 yaml_2.3.5 fastmap_1.1.0 ## [19] compiler_4.2.0 BiocManager_1.30.17 htmltools_0.5.2 ## [22] sass_0.4.1