CVE 1.11.2
越来越多的全球精密肿瘤项目正在启动。支持这种发展,我们提出癌症变异Explorer (CVE), R包和交互式的界面。利用Oncotator注释和药物基因数据库交互,CVE变异为重点确定司机,耐药机制和druggability。我们鼓励CVE的扩展分析和提供一个定制的附加模块的第一CVE扩展添加变体基因的探索在melanoma-specific co-expression网络。本教程的目标是提供CVE包的功能。
通过Bioconductor CVE可以安装
如果(!requireNamespace (“BiocManager”,悄悄地= TRUE)) install.packages (“BiocManager”) BiocManager::安装(CVE)
一旦安装加载
库(CVE)
变体信息下载单一结直肠癌病人使用RTCGAToolbox
包中。
#加载包库(RTCGAToolbox) #负载crcData < - getFirehoseData大肠癌所有数据(数据集=“COAD”,临床= TRUE,突变= TRUE, runDate =“20160128”)
#选择单个病人的案例研究mutData < - selectType (crcData,“突变”)crcCase_Firehouse < - mutData [mutData [[“Tumor_Sample_Barcode”]] = =“TCGA-AA-A00N-01A-02W-A00E-09”)
结肠adeonocarcinoma样本港口4709个变异。CVE需要一个数据帧包括列染色体,开始,结束,参考等位基因和观察等位基因。
crcCase_input = data.frame (= crcCase_Firehouse $染色体,从而向开始= crcCase_Firehouse Start_position美元,结束= crcCase_Firehouse End_position美元,reference_allele = crcCase_Firehouse reference_allele美元,observed_allele = crcCase_Firehouse Tumor_Seq_Allele2美元)头(crcCase_input)
# # 1 # #杆开始结束reference_allele observed_allele 10 100894110 100894110 T G # # 2 10 100894110 100894110 C # # 3 10 101137905 101137905 G 4 # # 10 101137905 101137905 C # # 5 10 101445832 101445832 G 10 # # 6 101445832 101445832 G T
以下函数检索Oncotator注释通过应用程序编程接口(需要互联网连接这一步)。Oncotator变异注释工具总结variant-centric信息来自14个不同的公开资源相关的癌症研究人员1拉莫斯A.H.利希滕斯坦,L。古普塔,M。劳伦斯,硕士普,T.J.Saksena, G。安德森,M。斯坦利·G。:Oncotator:癌症变异注释工具。人类变异36 (4),2423 - 2429 (2015)。有关更多信息,请参见Oncotator网页。
库(jsonlite) crcCase < - get.oncotator.anno (crcCase_input [1:10 0,])
这个函数openCVE
打开了CVE闪亮的应用。它要求Oncotator输出文件(加文件)作为一个数据帧或多个加器文件的列表。的同一病人的案例研究可以装满一个冒号腺癌
openCVE (crcCase)
的核心实现CVE闪亮的应用探索变异提供了四种不同的标签。
注释标签的第一部分总结了从GENCODE包括功能注释结果变体的分类(如错义,胡说,框移等)。CVE的左侧面板提供了一个过滤器来还包括non-SNVs进一步优先顺序。底部显示集群的热图dbNSFP突变效应预测算法的数据库2刘,X。剑,X。& Boerwinkle大肠(2013)。dbNSFP v2.0:数据库的非同义SNVs及其功能预测和注释。人类突变,34 (9),E2393-E2402。http://doi.org/10.1002/humu.22376数据集。算法主要利用推理更多的有害基因区域较少观察替换跨物种由于紧缩的进化约束(即保护性的算法)或氨基酸的不同物理化学性质和相应的三维蛋白质结构(即功能预测算法)。此外,运用分数结合不同的方法开发(例如CADD)。关于单个算法的更多信息,请参阅。值得注意的是,CVE没有基准功能预测算法的分数,也不试图获得最好的成绩。相反,它显示了异质性的预测基于rankscores 18算法。rankscores是在0和1之间,1表示排名最高的87347043个非同义单核苷酸变异。CVE描述算法具有类似的变体通过rankscores指数衍生的共识的热图集群基于共识的热图,用户可以选择一个预测算法类似的信息集群算法的选择。此外,对于用户不熟悉各个算法的前景提出dbNSFP组合得分\ (c \)
\ [c = \ sum_ {j = 1} ^ {m} y_j \ qquad \文本{和}\ qquad y_j ={病例}\ \开始眉题{间{ij}}和{如果}\四\ \文本眉题{间{ij}} \ 0.75 \ \组0 & \文本{如果}\四\眉题{间{ij}} < 0.75 \{病例}结束\]
在哪里\(间{ij} \)的rankscore算法我\ \ ()在集群\ (j \)和\(\眉题{间{ij}} \)算法的平均rankscore集群\ (j \)。\(\眉题{间{ij}} \)只是增加了\ (c \)如果有重要的证据在集群算法的变体\ (j \),定义为平均rankscore属于rankscores的上四分位数。
根据科学问题,或多或少限制变量的优先级是必要的。一项研究旨在表明选择靶向治疗可能只有感兴趣的最有前途的制药变体在一个外显子组数据集。相反,有针对性的测序,10 - 100监测关键基因变异是一个可行的数量变化在这种疾病(如循环细胞自由肿瘤DNA的分析,ctDNA)。因此,CVE提供即时、灵活修改过滤器和达标的关键。优先顺序的核心工作流的功能预测算法的选择。交互式滑块在左栏面板可用于修改截止。除了dbNSFP数据,Oncotator注释包含更多的信息,可以用于priortisation。我们建议
可选地,在已知DNA修复基因变异所总结的木材等。3木材、r D。米切尔,M。林达尔,t (2005)。人类DNA修复基因,2005年。突变研究,577 (2):275 - 283。显示,也可以包括通过应用另一个过滤器。
表顶部优先变体可以访问的表选项卡。简单的数据处理,上面的表也可以下载作为一个制表符分隔扩展清单使用侧边栏的下载按钮。顶部的列表总结:
reproduciblity,顶部的头表包括所有过滤器表优先变体。
此时的工作流,变异注释,排名优先。因此,剩下为数不多的变异可能是个体肿瘤生物学的关键。下一步需要指导精度癌症医学是评估候选人的druggability变体。
最新的,所以数据库(DGIdb)4格里菲斯,M。Grif th, o . L。Coffman, a . C。Weible, j . V。麦克j·F。、间谍、n . C。Koval, J。Das,我。卡拉威,m . B。埃尔德雷德,j . M。,et al。(2013)。DGIdb:矿业制药基因组。自然方法,10 (12):1209 - 1210。提供最全面的药物相互作用的集合。在DGIdb CVE只有查询往往和我的癌症基因组信息,来源都是expert-curated和组成多种肿瘤类型。CVE访问DGIdb数据通过应用程序编程接口(API)。这种方式,不需要数据库的本地安装和条目被自动更新。可以探索发现的交互数据表也还可以下载的csv文件sidepanel CVE。
CVE揭示了单结直肠癌的以下几点:
CVE也可以应用在数据队列变体。作为一个有意义的群组,我们选择BRAF-wt / RAS-wt黑色素瘤,因为他们既不能目标BRAF和MEK抑制剂在扩散至设置。我们收集了癌症基因组图谱的案例研究5癌症基因组图谱网络。(2015)。皮肤的黑色素瘤的基因分类。细胞,161 (7),1681 - 1696。http://doi.org/10.1016/j.cell.2015.05.044。93年的345例可以对BRAF-wt / RAS-wt。四个选项卡的核心实现CVE可以应用于所有肿瘤实体。说明一个开源R代码的功能和灵活性,我们开发了一个第一个扩展探索变异基因的兴趣melanoma-specific通路上下文。为此,我们生成了一个melanoma-specfic coexpression TCGA网络数据使用WGCNA方法(见小插图WGCNA_from_TCGA_RNAseq
)。开始扩展的黑色素瘤队列研究:
openCVE (melanomaCase、扩展=“WGCNAmelanoma”)
sessionInfo ()
# # R版本3.6.0(2019-04-26)# #平台:x86_64-pc-linux-gnu(64位)# #下运行:Ubuntu 18.04.2 LTS # # # #矩阵产品:默认# #布拉斯特区:/home/biocbuild/bbs - 3.10 - bioc / R / lib / libRblas。所以# # LAPACK: /home/biocbuild/bbs - 3.10 - bioc / R / lib / libRlapack。# # # #语言环境:# # [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC = C # #[3]而= en_US。utf - 8 LC_COLLATE = C # # [5] LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # # [7] LC_PAPER = en_US。utf - 8 LC_NAME = C # # [9] LC_ADDRESS C = C LC_TELEPHONE = # # [11] LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C附加基本包:# # # # # #[1]统计图形grDevices跑龙套数据集方法基础# # # #其他附加包:# # [1]RTCGAToolbox_2.15.3 BiocStyle_2.13.1 # # # #通过加载一个名称空间(而不是附加):# # [1]Rcpp_1.0.1 compiler_3.6.0 # # [3] BiocManager_1.30.4 GenomeInfoDb_1.21.1 # # [5] XVector_0.25.0 bitops_1.0-6 # # [7] tools_3.6.0 zlibbioc_1.31.0 # # [9] digest_0.6.19 evaluate_0.14 # # [11] lattice_0.20-38 Matrix_1.2-17 # # [13] DelayedArray_0.11.0 yaml_2.2.0 # # [15] parallel_3.6.0 xfun_0.7 # # [17] GenomeInfoDbData_1.2.1 stringr_1.4.0 # # [19] knitr_1.23 RCircos_1.2.1 # # [21] S4Vectors_0.23.10 IRanges_2.19.7 # # [23] stats4_3.6.0 grid_3.6.0 # # [25] data.table_1.12.2 Biobase_2.45.0 # # [27] survival_2.44 - 1.1 xml_3.98 - 1.20 # # [29] BiocParallel_1.19.0 rmarkdown_1.13 # # [31] bookdown_0.11 rjsonio_1.3 - 1.2 # # [33] limma_3.41.3 magrittr_1.5 # # [35] splines_3.6.0 matrixStats_0.54.0 # # [37] htmltools_0.3.6 BiocGenerics_0.31.3 # # [39] GenomicRanges_1.37.9 RaggedExperiment_1.9.0 # # [41] SummarizedExperiment_1.15.1 stringi_1.4.3 # # [43] rcurl_1.95 - 4.12