包geneplast。来自不同来源的数据提供数据集通过AnnotationHub geneplast管道使用。数据集的物种系统发育树,和从不同的直接同源orthology真核生物之间的关系数据库。
geneplast。数据0.99.6
Geneplast是专为大规模进化可塑性和分析基于直接同源组加油(OG)分布在一个给定的物种树。这个支持方案提供数据集获取和处理来自不同直接同源数据库用于geneplast进化分析。
目前,来自以下数据源的数据是可用的:
每个数据集由四个对象:
data.frame
包含OG标识符。data.frame
与物种的标识符。data.frame
与噩蛋白质映射。phylo
代表一个物种的系统发育树sspids
。创建对象的一般程序之前首先从直接同源选择只有真核生物物种描述数据库的帮助下NCBI分类法分类。
我们建立一个从分类节点图和定位真核生物的根源。然后,我们遍历这个子图指出从根到叶子对应数据库中的物种的分类标识符。通过选择树叶产生的子图指出,我们获得的sspids
对象。
一旦选择感兴趣的物种,orthology信息过滤得到相应的蛋白质cogdata
对象。的cogids
对象由独特的直接同源标识符cogdata
。
最后,phyloTree
对象是由TimeTree完整的真核生物系统发育树,修剪只显示感兴趣的物种。失踪的物种都是使用策略匹配的属和最近的物种推断从NCBI的树之前构建的。
1 -创建一个新的AnnotationHub
连接和查询所有geneplast资源。
库(AnnotationHub) #创建一个AnnotationHub连接啊< - AnnotationHub() #搜索所有geneplast资源元< -查询(啊,“geneplast”)头(元)
2 -加载对象到会话中使用的ID选择数据集。
#加载对象从数据库字符串v11.0加载(元[[“AH83116”]])
这部分再现了一个案例研究使用带注释的数据集从字符串,OMA, OrthoDB。
以下步骤展示了如何运行geneplast支持分析和转移其结果图模型。为详细的一步一步的指示,请检查geneplast装饰图案。
1 -创建一个对象的类“OGR”引用“spid”。
库(geneplast) ogr < -大的。预处理(cogdata = cogdata phyloTree = phyloTree spid = " 9606 ")
2 -运行大的
功能和推断进化根源。注意:这一步应该长的处理时间由于og的大量输入数据(也nPermutations
参数被设置为100)出于演示目的。
ogr < - groot (ogr nPermutations = 100, verbose = TRUE)
1 - PPI网络负载和所需的包。的igraph
对象称为“ppi。gs的细胞凋亡和genome-stability基因提供了PPI的信息(@Castro2008)。
库(红色)图书馆(igraph)图书馆(RColorBrewer)数据(ppi.gs)
2 -地图信息加油igraph
对象。
g < - ogr2igraph (ogr cogdata, ppi。gs, idkey =“可以”)
3 -调整颜色的支持信息。
朋友< -布鲁尔。RdYlBu“pal (9) color_col <——colorRampPalette (pal)(37) #设置颜色为每个根!g < - att.setv (g = g =“根”=“nodeColor”关口= color_col na。坳= " grey80 ",减免= seq (37))
4 -美学调整对一些图像属性。
g < - att.setv (g = g =“象征”=“nodeAlias”) E (g)美元edgeColor < -“grey80”V (g)美元nodeLineColor < -“grey80”
5 -发送igraph
对象红色的接口。
rdp < - RedPort()打电话(rdp) resetd (rdp) addGraph addLegend (rdp g)。颜色(rdp colvec = g legNodeColor美元规模、大小= 15,labvec = g legNodeColor传说,美元title =“图一根代表”)
6 -细胞凋亡和genome-stability子网。
g1 < - induced_subgraph (g = g, V (g)美元的名字(V (g)凋亡美元= = 1])g2 < - induced_subgraph (g = g, V (g)的名字(V (g)美元GenomeStability = = 1])
7 -组细胞凋亡和genome-stability基因导入容器。
myTheme < -列表(变焦nestFontSize = 25日= 80,不是= TRUE, gscale = 65,主题= 2)addGraph (rdp g1, gcoord = c(25、50),主题= c (myTheme, nestAlias =“凋亡”))addGraph (rdp g2, gcoord = c(75年,50),主题= c (myTheme, nestAlias =“基因组稳定”))放松(rdp p1 = 50, p2 = 50, p3 = 50, p4 = 50, p5 = 50, ps = TRUE)
标题
负载(元[[“AH83117”]]) cogdata cog_id < - paste0 (OMA, cogdata cog_id美元)cogids cog_id < - paste0 (OMA, cogids cog_id美元)human_entrez_2_oma_Aug2020 < - read_delim (“processed_human.entrez_2_OMA.Aug2020。tsv”, delim = " \ t”, escape_double = FALSE, col_names = FALSE, trim_ws = TRUE)名称(human_entrez_2_oma_Aug2020) < - c (“protein_id”、“gene_id”) cogdata < - cogdata % > % left_join ogr < - groot (human_entrez_2_oma_Aug2020)。预处理(cogdata = cogdata phyloTree = phyloTree spid = " 9606 ") ogr < - groot (ogr nPermutations = 100, verbose = TRUE) g < - ogr2igraph (ogr cogdata, ppi。gs, idkey =“可以”)的朋友< -布鲁尔。RdYlBu“pal (9) color_col <——colorRampPalette (pal)(37) #设置颜色为每个根!g < - att.setv (g = g =“根”=“nodeColor”关口= color_col na。坳= " grey80 ",减免= seq (37))g < - att.setv (g = g =“象征”=“nodeAlias”) E (g)美元edgeColor < -“grey80”V (g)美元nodeLineColor < -“grey80”# rdp <- RedPort() # calld(rdp) resetd(rdp) addGraph(rdp, g) addLegend.color(rdp, colvec=g$legNodeColor$scale, size=15, labvec=g$legNodeColor$legend, title="Roots represented in Fig2") g1 <- induced_subgraph(g=g, V(g)$name[V(g)$Apoptosis==1]) g2 <- induced_subgraph(g=g, V(g)$name[V(g)$GenomeStability==1]) myTheme <- list(nestFontSize=25, zoom=80, isNest=TRUE, gscale=65, theme=2) addGraph(rdp, g1, gcoord=c(25, 50), theme = c(myTheme, nestAlias="Apoptosis")) addGraph(rdp, g2, gcoord=c(75, 50), theme = c(myTheme, nestAlias="Genome Stability")) relax(rdp, p1=50, p2=50, p3=50, p4=50, p5= 50, ps = TRUE)
标题
负载(元[[“AH83118”]]) cogdata cog_id < - paste0 (ODB, cogdata cog_id美元)cogids cog_id < - paste0 (ODB, cogids cog_id美元)human_entrez_2_odb < - read_delim (“odb10v1_genes-human-entrez。tsv”, delim = " \ t”, escape_double = FALSE, col_names = FALSE, trim_ws = TRUE)名称(human_entrez_2_odb) < - c (“protein_id”、“gene_id”) cogdata < - cogdata % > % left_join ogr < - groot (human_entrez_2_odb)。预处理(cogdata = cogdata phyloTree = phyloTree spid = " 9606 ") ogr < - groot (ogr nPermutations = 100, verbose = TRUE) g < - ogr2igraph (ogr cogdata, ppi。gs, idkey =“可以”)的朋友< -布鲁尔。RdYlBu“pal (9) color_col <——colorRampPalette (pal)(37) #设置颜色为每个根!g < - att.setv (g = g =“根”=“nodeColor”关口= color_col na。坳= " grey80 ",减免= seq (37))g < - att.setv (g = g =“象征”=“nodeAlias”) E (g)美元edgeColor < -“grey80”V (g)美元nodeLineColor < -“grey80”rdp < - RedPort()打电话(rdp) resetd (rdp) addGraph addLegend (rdp g)。颜色(rdp colvec = g legNodeColor美元规模、大小= 15,labvec = g legNodeColor传说,美元title =“根在不可”)g1 < - induced_subgraph (g = g, V (g)的名字(V (g)凋亡美元= = 1])g2 < - induced_subgraph (g = g, V (g)的名字(V (g)美元GenomeStability = = 1]) myTheme < -列表(变焦nestFontSize = 25日= 80,不是= TRUE, gscale = 65,主题= 2)addGraph (rdp g1, gcoord = c(25、50),主题= c (myTheme, nestAlias =“凋亡”))addGraph (rdp g2, gcoord = c(75年,50),主题= c (myTheme, nestAlias =“基因组稳定”))放松(rdp p1 = 50, p2 = 50, p3 = 50, p4 = 50, p5 = 50, ps = TRUE)
标题
4.1.3 sessionInfo () # > R版本(2022-03-10)# >平台:x86_64-pc-linux-gnu(64位)# >下运行:Ubuntu 20.04.4 LTS # > # >矩阵产品:默认# >布拉斯特区:/home/biocbuild/bbs - 3.14 - bioc / R / lib / libRblas。所以# > LAPACK: /home/biocbuild/bbs - 3.14 - bioc / R / lib / libRlapack。所以# > # >语言环境:# > [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC c# = >[3]而= en_GB LC_COLLATE = c# > [5] LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # > [7] LC_PAPER = en_US。utf - 8 LC_NAME c# = > [9] LC_ADDRESS = C LC_TELEPHONE = C # > [11] LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C # > # >附加基本包:# >[1]统计图形grDevices跑龙套数据集方法基础# > # >其他附加包:# > [1]BiocStyle_2.22.0 # > # >加载通过名称空间(而不是附加):# > [1]bookdown_0.25 digest_0.6.29 R6_2.5.1 # > [4] jsonlite_1.8.0 magrittr_2.0.3 evaluate_0.15 # > [7] stringi_1.7.6 rlang_1.0.2 cli_3.2.0 # > [10] jquerylib_0.1.4 bslib_0.3.1 rmarkdown_2.13 # > [13] tools_4.1.3 stringr_1.4.0 xfun_0.30 # > [16] yaml_2.3.5 fastmap_1.1.0 compiler_4.1.3 # > [19] BiocManager_1.30.16 htmltools_0.5.2 knitr_1.38 # > [22] sass_0.4.1