TCGA肿瘤的类型涵盖了一系列的解剖间室。将肿瘤类型按相关的隔室分组可能是有成效的。我们将使用来自an的肿瘤树OBO表示NCI同义词典ontoProc的bioc3.9版本中的OBO分布。
该表格于2019年10月10日使用ontoProc包中的材料手工制作。
suppressPackageStartupMessages({图书馆(DT)图书馆(ontoProc)图书馆(magrittr)图书馆(dplyr)图书馆(BiocOncoTK)getOncotreeOnto()
数据(“map_tcga_ncit”)数据表(map_tcga_ncit)
3.解剖部位的正式注释
3.1迅速的映射
我们将放弃CNTL类,当两个NCIT映射似乎匹配时,只使用第一个NCIT映射。
哪一个(map_tcga_ncit [,1]= =“CNTL”)map_tcga_ncit [-controlindex,1]map_tcga_ncit [-controlindex,3.]strsplit(ncitsites"\ \|”)酸式焦磷酸钠(ssi,“(”,1)data.frame(代码=tcgacodes,oncotr_site =otree$名字(网站),ncit =网站,stringsAsFactors =假)样本(seq_len(nrow(simpmap)),5),)
## code oncotr_site ## NCIT:C40217 UCEC子宫肌体子宫内膜基质和相关肿瘤## NCIT:C9383 READ直肠腺癌## NCIT:C6975 KIRP乳头状肾细胞癌## NCIT:C4146 KICH恐色肾细胞癌## NCIT:C4436 CHOL胆管癌## NCIT:C40217 NCIT:C40217 # NCIT:C9383 NCIT:C9383 ## NCIT:C4146 NCIT:C4146 # NCIT:C4436
我们现在有了从TCGA代码到NCIT站点的1-1映射。根据NCIT:C3263是“按部位划分的肿瘤”(实际上应该是“系统”)这一知识,这些部位可以根据器官系统进行分组。
otree$孩子(“NCIT: C3263”] [[1]]#所有可能的系统otree$祖先(simpmap$ncit]酸式焦磷酸钠(allanc函数(x)相交(x, poss_sys) (1])#忽视多样性unlist(otree$名称(特定的))数据表(systab < -cbind(simpmapsys =sys))
胸腺瘤和间皮瘤本身都没有NCIT器官系统映射。
3.2聚合
我们现在有12种33种肿瘤类型。用于查找给定系统的TCGA代码的代码模式是:
## code oncotr_site ncit ## ncit:C40195 ## ncit:C7550 OV卵巢浆腺癌ncit:C7550 ## ncit:C2919 PRAD前列腺腺癌ncit:C2919 ## ncit:C8591 TGCT睾丸生殖细胞肿瘤ncit:C8591 ## ncit:C42700 UCS子宫癌肉瘤ncit:C42700 # sys # ncit:C40195生殖系统肿瘤## ncit:C7550生殖系统肿瘤## ncit:C2919生殖系统肿瘤## ncit:C8591生殖系统肿瘤##C42700生殖系统肿瘤