% \ VignetteIndexEntry{1。界面教程}%\VignetteKeywords{用户界面}%\VignettePackage{BioNetStat} %\VignetteEngine{knitr::knitr}

BioNetStat背景

从细胞和细胞器到整个生物圈的生物系统中发生的相互作用的多样性,可以用网络理论的工具进行评估。结构的动态性和要素之间相互作用的动态性是这些系统的固有特征。已经提出了几种工具来比较网络,代表一个系统假设的许多状态。然而,到目前为止,还没有人能够同时比较两个以上网络的结构特征。由于一个给定的生物系统可以假设许多状态,我们开发了一种统计工具来比较两个或多个网络,并指出系统中的关键变量。考虑到之前的数据预处理,BioNetStat能够比较由基因表达数据、代谢物浓度或任何可能具有统计相关性的变量构建的相关网络。网络比较是基于图谱(邻接矩阵中的特征值组),如谱分布。这一测量与网络的几个结构特征有关,如行走的数量、直径和点击。除了光谱分布,BioNetStat还可以使用光谱熵、度分布和节点中心来比较网络。到目前为止,BioNetStat的理论基础仅在硕士论文,用葡萄牙语。这篇论文正在制作中,将尽快在这里发表。

BioNetStat用户界面教程

安装R和BioNetStat,如图所示自述,您只需打开R并运行以下命令。

runBioNetStat()

第一个屏幕

当你启动BioNetStat时,你会看到这张图片。

BioNetStat图像

如果您正在使用Rstudio将打开一个替代窗口,因此BNS将在浏览器中使用时表现良好。所以,点击屏幕左上方的“在浏览器中打开”,BNS将作为第一张图片在浏览器中打开。

BioNetStat_rstudio的图像

加载文件

点击“浏览..”'图标在第1节(加载数据)将打开一个窗口的变量值表被选择。

data_selection

在本教程中,要选择的文件是variablesValue_BioNetStat_tutorial_data.csv.文件将被加载,软件将识别由r分类为“数字”的列,屏幕上显示了表的前一个视图。此外,“因素”部分将识别哪些列被r评为“因素”。在这个部分中,您可以选择将用于选择比较的状态(处理,条件)的因素,每个状态将是一个要比较的网络。状态的选择可以在“Choose The conditions to be comparison”中完成:

BioNetStatFactors图像

选择变量值表后,可以将文件“变量组”(可选)加载到“变量集数据库”中。在本教程中,所选文件为variableSet_BioNetStat_tutorial_data.gmt根据相关的代谢途径来设定变量组。如果用户没有加载任何文件,程序将比较网络与文件“变量值数据”中加载的所有变量

BioNetStatFiles图像BioNetStatFiles图像

构建变量组表的教程如下在这里

参数设置

加载输入文件后,可以将参数设置为网络构造:将在“变量集大小范围”中比较的网络中的变量(节点)数量的低和高。程序返回介于这些值之间的变量集的数量(上图)。2.相关性度量用于推断相关网络。3.关联强度将被用作两个节点之间形成边的阈值,以及使用哪个阈值。4.要构建的网络类型,在边缘上有或没有权重。在有权重的网的情况下,哪个关联度量将被用作边权重。

BioNetStatNetParameters图像BioNetStatNetParameters图像

  1. 网络比较法。如果使用频谱或度分布来比较网络,则有必要设置方法来设置带宽(“Silveram”或“Sturges”可用)。
  2. 排列的数量和如果种子将用于重采样方法也可以使用。

BioNetStatNet2Parameters图像BioNetStatNet2Parameters图像

运行差分网络分析

加载文件并选择分析参数后,单击“开始分析”来比较网络。

BioNetStatrunning图像

结果

  1. 在执行分析时,将显示以下警告:

BioNetStatwaiting的图片

  1. 分析完成后,程序将显示用于执行分析的参数。

BioNetStatres1的图像

  1. 最终的表格如下图所示:

BioNetStatres2的图像

节点差分分析

  1. 还可以比较节点的重要性。在“进一步分析”选项卡中,您可以根据阈值标准选择变量组。选择变量组,程序将生成节点比较度中心性。

BioNetStatresVert1的图像

  1. 当表出现时,可以选择其他结构属性来比较节点的重要性。差分节点分析表如下图所示:

节点分析

BioNetStatresVert2图像

KEGG路径可视化

  1. 另一个可用的功能是观察数据库代谢途径中的变量KEGG,让您更深入地了解所研究变量相关的代谢途径。

BioNetStatresVert3的图像

您需要插入一个包含两列的表,其中第一列必须是您正在研究的变量的名称,第二列是这些变量各自的KEGG代码。KEGG代码可以在KEGG的的网站。如果研究的变量是基因/蛋白质或代谢物,除了表中变量的代码外,还应选择在绘图中使用的颜色。图中出现的变量与节点微分分析表中分析的变量相同,可以根据test的值或与其关联的pvalor或qvalue进行过滤。有必要选择哪一个代谢途径将用于产生可视化和在哪个物种

BioNetStatresVert5的图像

在KEGG地图上,你会注意到矩形或圆形被分为列,代表你选择比较的治疗方法。颜色的强度是相对于根据图例选择的中心值。这是一个用kegg的癌症(05200)途径的基因构建的人类(“hsa”)的地图示例。

BioNetStatresVert6的图像

当点击保存按钮时需要等待程序下载地图,将其保存在“下载”目录下的压缩文件中。视图位于压缩文件中。

BioNetStatresVert7的图像

网络可视化

可视化网络可以帮助我们更容易地理解变化的模式。这种可视化可以通过几种方式实现,其中一些可以在BioNetStat的“网络可视化图”选项卡中使用。由于本节中的BNS可以比较多个状态,每次只需要选择其中两个进行查看和比较。

BioNetStatclassSelection的图像

  1. 可视化网络的第一种方法是邻接矩阵(表示网络的矩阵)的热图形式。最初,用户可以选择参数(颜色、形状和大小)来构建图形,然后可以查看所选状态的网络。

BioNetStatplotSettings2图像

  1. 生成的网络可以通过网络谱熵或中度中心性等全局结构属性进行比较:

top_properties的图像

  1. 差分矩阵允许分析所有变量对在状态之间的关系如何变化。

comparison_net的图片

  1. 变量之间的关联列表并不能使我们对两种状态的关联力之间的差异有一个更精确的概念。

association_list的图像

  1. 最后,可以将网络导出到生物集成程序S.I.T.(系统集成工具)中,在那里可以查看和操作网络。

BioNetStat sit_list图片

研究变量的行为

BioNetStat还提供了对变量行为的研究,以便用户可以对其研究对象有一个完整的视图。1.最初,可以通过构造热图来探索变量,在热图中选择图形的参数。列中是样本,颜色表示每个样本属于哪个状态。在“热图集群选项”一节中,可以对热图的列(样本)和行(变量)进行分组。

BioNetStat热图图像

  1. 在KEGG数据库地图中,我们还可以观察到基因表达、蛋白质浓度和代谢物。在“KEGG路径可视化”中,用户必须输入变量代码,一个包含两列的表格,其中第一列应该是您正在研究的变量的名称,第二列是这些变量各自的KEGG代码。这些代码可以在KEGG网站本身。图中出现的变量与顶点微分分析表中分析的变量相同,可以根据测试值或pvalor值或与之相关的值进行过滤。图中会显示一个代表每个状态的所有样本的值,它可以是平均值、中位数、最小值或最大值。有必要选择哪一个代谢途径将用于产生可视化和在哪个物种

BioNetStatresVert5的图像BioNetStatresVert5的图像

在KEGG地图上,你会注意到矩形或圆形被分为列,代表你选择比较的治疗方法。颜色的强度是相对于根据图例选择的中心值。这是一个用kegg的癌症(05200)途径的基因构建的人类(“hsa”)的地图示例。

BioNetStat_keeg_parameters_exp2的图像

当点击保存按钮时需要等待程序下载地图,将其保存在“下载”目录下的压缩文件中。视图位于压缩文件中。

BioNetStat_resultsVert7_image的图像

  1. BioNetStat提供了一个统计测试,用于验证状态之间变量行为的变化(测试t用于两个状态,ANOVA用于两个以上状态,使用各自的非参数测试)。结果如下表所示:

BioNetStat_anova图像

  1. 最后,BioNetStat中可用的最后一种分析是在箱线图中可视化给定变量的值。最初,用户必须选择图形的参数和将要显示的变量。

BioNetStat_boxplot图像