内容

1概述

Geneplast是专为大规模进化可塑性和分析基于直接同源组加油(OG)分布在一个给定的物种树。这个支持方案提供数据集获取和处理来自不同直接同源数据库用于geneplast进化分析。

目前,来自以下数据源的数据是可用的:

每个数据集由四个对象:

1.1对象的创建

创建对象的一般程序之前首先从直接同源选择只有真核生物物种描述数据库的帮助下NCBI分类法分类。

我们建立一个从分类节点图和定位真核生物的根源。然后,我们遍历这个子图指出从根到叶子对应数据库中的物种的分类标识符。通过选择树叶产生的子图指出,我们获得的sspids对象。

一旦选择感兴趣的物种,orthology信息过滤得到相应的蛋白质cogdata对象。的cogids对象由独特的直接同源标识符cogdata

最后,phyloTree对象是由TimeTree完整的真核生物系统发育树,修剪只显示感兴趣的物种。失踪的物种都是使用策略匹配的属和最近的物种推断从NCBI的树之前构建的。

1.2加载数据集

1 -创建一个新的AnnotationHub连接和查询所有geneplast资源。

库(AnnotationHub) #创建一个AnnotationHub连接啊< - AnnotationHub() #搜索所有geneplast资源元< -查询(啊,“geneplast”)头(元)

2 -加载对象到会话中使用的ID选择数据集。

#加载对象从数据库字符串v11.0加载(元[[“AH83116”]])

2案例研究:转移加油PPI网络的信息

这部分再现了一个案例研究使用带注释的数据集从字符串,OMA, OrthoDB。

以下步骤展示了如何运行geneplast支持分析和转移其结果图模型。为详细的一步一步的指示,请检查geneplast装饰图案

2.1字符串

2.1.1支持推理

1 -创建一个对象的类“OGR”引用“spid”。

库(geneplast) ogr < -大的。预处理(cogdata = cogdata phyloTree = phyloTree spid = " 9606 ")

2 -运行大的功能和推断进化根源。注意:这一步应该长的处理时间由于og的大量输入数据(也nPermutations参数被设置为100)出于演示目的。

ogr < - groot (ogr nPermutations = 100, verbose = TRUE)

2.1.2PPI网络图模型

1 - PPI网络负载和所需的包。的igraph对象称为“ppi。gs的细胞凋亡和genome-stability基因提供了PPI的信息(@Castro2008)

库(红色)图书馆(igraph)图书馆(RColorBrewer)数据(ppi.gs)

2 -地图信息加油igraph对象。

g < - ogr2igraph (ogr cogdata, ppi。gs, idkey =“可以”)

3 -调整颜色的支持信息。

朋友< -布鲁尔。RdYlBu“pal (9) color_col <——colorRampPalette (pal)(37) #设置颜色为每个根!g < - att.setv (g = g =“根”=“nodeColor”关口= color_col na。坳= " grey80 ",减免= seq (37))

4 -美学调整对一些图像属性。

g < - att.setv (g = g =“象征”=“nodeAlias”) E (g)美元edgeColor < -“grey80”V (g)美元nodeLineColor < -“grey80”

5 -发送igraph对象红色的接口。

rdp < - RedPort()打电话(rdp) resetd (rdp) addGraph addLegend (rdp g)。颜色(rdp colvec = g legNodeColor美元规模、大小= 15,labvec = g legNodeColor传说,美元title =“图一根代表”)

6 -细胞凋亡和genome-stability子网。

g1 < - induced_subgraph (g = g, V (g)美元的名字(V (g)凋亡美元= = 1])g2 < - induced_subgraph (g = g, V (g)的名字(V (g)美元GenomeStability = = 1])

7 -组细胞凋亡和genome-stability基因导入容器。

myTheme < -列表(变焦nestFontSize = 25日= 80,不是= TRUE, gscale = 65,主题= 2)addGraph (rdp g1, gcoord = c(25、50),主题= c (myTheme, nestAlias =“凋亡”))addGraph (rdp g2, gcoord = c(75年,50),主题= c (myTheme, nestAlias =“基因组稳定”))放松(rdp p1 = 50, p2 = 50, p3 = 50, p4 = 50, p5 = 50, ps = TRUE)
标题

标题

2.2OMA

负载(元[[“AH83117”]]) cogdata cog_id < - paste0 (OMA, cogdata cog_id美元)cogids cog_id < - paste0 (OMA, cogids cog_id美元)human_entrez_2_oma_Aug2020 < - read_delim (“processed_human.entrez_2_OMA.Aug2020。tsv”, delim = " \ t”, escape_double = FALSE, col_names = FALSE, trim_ws = TRUE)名称(human_entrez_2_oma_Aug2020) < - c (“protein_id”、“gene_id”) cogdata < - cogdata % > % left_join ogr < - groot (human_entrez_2_oma_Aug2020)。预处理(cogdata = cogdata phyloTree = phyloTree spid = " 9606 ") ogr < - groot (ogr nPermutations = 100, verbose = TRUE) g < - ogr2igraph (ogr cogdata, ppi。gs, idkey =“可以”)的朋友< -布鲁尔。RdYlBu“pal (9) color_col <——colorRampPalette (pal)(37) #设置颜色为每个根!g < - att.setv (g = g =“根”=“nodeColor”关口= color_col na。坳= " grey80 ",减免= seq (37))g < - att.setv (g = g =“象征”=“nodeAlias”) E (g)美元edgeColor < -“grey80”V (g)美元nodeLineColor < -“grey80”# rdp <- RedPort() # calld(rdp) resetd(rdp) addGraph(rdp, g) addLegend.color(rdp, colvec=g$legNodeColor$scale, size=15, labvec=g$legNodeColor$legend, title="Roots represented in Fig2") g1 <- induced_subgraph(g=g, V(g)$name[V(g)$Apoptosis==1]) g2 <- induced_subgraph(g=g, V(g)$name[V(g)$GenomeStability==1]) myTheme <- list(nestFontSize=25, zoom=80, isNest=TRUE, gscale=65, theme=2) addGraph(rdp, g1, gcoord=c(25, 50), theme = c(myTheme, nestAlias="Apoptosis")) addGraph(rdp, g2, gcoord=c(75, 50), theme = c(myTheme, nestAlias="Genome Stability")) relax(rdp, p1=50, p2=50, p3=50, p4=50, p5= 50, ps = TRUE)
标题

标题

2.3OrthoDB

负载(元[[“AH83118”]]) cogdata cog_id < - paste0 (ODB, cogdata cog_id美元)cogids cog_id < - paste0 (ODB, cogids cog_id美元)human_entrez_2_odb < - read_delim (“odb10v1_genes-human-entrez。tsv”, delim = " \ t”, escape_double = FALSE, col_names = FALSE, trim_ws = TRUE)名称(human_entrez_2_odb) < - c (“protein_id”、“gene_id”) cogdata < - cogdata % > % left_join ogr < - groot (human_entrez_2_odb)。预处理(cogdata = cogdata phyloTree = phyloTree spid = " 9606 ") ogr < - groot (ogr nPermutations = 100, verbose = TRUE) g < - ogr2igraph (ogr cogdata, ppi。gs, idkey =“可以”)的朋友< -布鲁尔。RdYlBu“pal (9) color_col <——colorRampPalette (pal)(37) #设置颜色为每个根!g < - att.setv (g = g =“根”=“nodeColor”关口= color_col na。坳= " grey80 ",减免= seq (37))g < - att.setv (g = g =“象征”=“nodeAlias”) E (g)美元edgeColor < -“grey80”V (g)美元nodeLineColor < -“grey80”rdp < - RedPort()打电话(rdp) resetd (rdp) addGraph addLegend (rdp g)。颜色(rdp colvec = g legNodeColor美元规模、大小= 15,labvec = g legNodeColor传说,美元title =“根在不可”)g1 < - induced_subgraph (g = g, V (g)的名字(V (g)凋亡美元= = 1])g2 < - induced_subgraph (g = g, V (g)的名字(V (g)美元GenomeStability = = 1]) myTheme < -列表(变焦nestFontSize = 25日= 80,不是= TRUE, gscale = 65,主题= 2)addGraph (rdp g1, gcoord = c(25、50),主题= c (myTheme, nestAlias =“凋亡”))addGraph (rdp g2, gcoord = c(75年,50),主题= c (myTheme, nestAlias =“基因组稳定”))放松(rdp p1 = 50, p2 = 50, p3 = 50, p4 = 50, p5 = 50, ps = TRUE)
标题

标题

3会话信息

4.1.3 sessionInfo () # > R版本(2022-03-10)# >平台:x86_64-pc-linux-gnu(64位)# >下运行:Ubuntu 20.04.4 LTS # > # >矩阵产品:默认# >布拉斯特区:/home/biocbuild/bbs - 3.14 - bioc / R / lib / libRblas。所以# > LAPACK: /home/biocbuild/bbs - 3.14 - bioc / R / lib / libRlapack。所以# > # >语言环境:# > [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC c# = >[3]而= en_GB LC_COLLATE = c# > [5] LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # > [7] LC_PAPER = en_US。utf - 8 LC_NAME c# = > [9] LC_ADDRESS = C LC_TELEPHONE = C # > [11] LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C # > # >附加基本包:# >[1]统计图形grDevices跑龙套数据集方法基础# > # >其他附加包:# > [1]BiocStyle_2.22.0 # > # >加载通过名称空间(而不是附加):# > [1]bookdown_0.25 digest_0.6.29 R6_2.5.1 # > [4] jsonlite_1.8.0 magrittr_2.0.3 evaluate_0.15 # > [7] stringi_1.7.6 rlang_1.0.2 cli_3.2.0 # > [10] jquerylib_0.1.4 bslib_0.3.1 rmarkdown_2.13 # > [13] tools_4.1.3 stringr_1.4.0 xfun_0.30 # > [16] yaml_2.3.5 fastmap_1.1.0 compiler_4.1.3 # > [19] BiocManager_1.30.16 htmltools_0.5.2 knitr_1.38 # > [22] sass_0.4.1