rWikiPathways 1.17.0
WikiPathways是一个著名的生物路径存储库,为研究界提供独特的工具,用于内容创建、编辑和利用[1].
R是一种用于统计和探索性数据分析的强大编程语言和环境。
rWikiPathways利用WikiPathways API进行通信R以及WikiPathways,允许以数据和图像格式查询、询问和下载任何路径。查询通常基于基因、蛋白质和代谢物的标准化标识符“Xrefs”执行。一旦确定了路径,就可以使用WPID (WikiPathways标识符)进行额外的查询。
你所需要的就是这个rWikiPathways包!如果您正在查看这个小插图,那么您可能已经安装和加载了rWikiPathways例如,通过:
如果(!“rWikiPathways”%in% installed.packages()){if (!requireNamespace("BiocManager", quiet =TRUE)) install.packages("BiocManager") BiocManager::install("rWikiPathways")} library(rWikiPathways)
让我们先了解一下维基路径包含了什么。例如,以下是如何查看维基路径目前支持哪些物种:
listOrganisms ()
你应该会看到30个或更多的物种。此列表对于采用生物参数,以避免拼写错误。
接下来,让我们看看人类有多少条路径:
海关。pathways <- listPathways('Homo sapiens') hs.pathways
呵!这是很多的信息。让我们来分析一下:
? listPathways长度(hs.pathways)
好的。帮助文档告诉我们,对于每个人类路径,我们都获得了大量的信息。一个简单的长度函数可能是你真正想知道的。或者如果你只对一个特定的信息感兴趣,看看这些函数:
listpathwayid, listPathwayNames, listPathwayUrls
这些返回简单的列表,仅包含每个路径结果的特定信息。
最后,还有另一种方法可以找到感兴趣的路径:通过Xref。Xref只是官方源代码的标准化标识符。WikiPathways依赖于BridgeDb[2]为基因、蛋白质和代谢物提供数十个Xref来源。查看完整列表https://github.com/bridgedb/datasources/blob/main/datasources.tsv
与rWikiPathways在美国,方法很简单。取感兴趣分子的支持标识符,例如HGNC的官方基因符号“TNF”,并检查系统代码对于数据源,例如HGNC = H(这来自于datasoures .txt表的第二列),然后形成你的查询:
肿瘤坏死因子。pathways <- findPathwaysByXref('TNF','H') TNF .pathways
Ack !这是很多的信息。我们不仅提供路径信息,而且还提供搜索结果分数,以防您想对结果进行排名等。同样,如果你感兴趣的是wpid,名称或url,那么有这些方便的替代方案,只返回简单的列表:
? ?findPathwayIdsByXref
请注意:简单的长度函数可能会误导,因为如果Xref出现多次,则给定的路径将被列出多次。
此时,我们应该已经从上面的查询中确定了一条或多条路径。让我们假设我们确定了“WP554”,Ace抑制途径(https://wikipathways.org/instance/WP554).我们将在后续查询中使用它的WPID (WP554)。
首先,我们可以获得关于路径的信息(如果我们上面没有收集到的话):
getPathwayInfo(“WP554”)
接下来,我们可以获得路径中包含的所有xref,并将其映射到我们选择的数据源。多方便啊!我们使用相同的系统代码如上所述。举个例子,如果我们想要这条通路中所有被列为Entrez基因的基因:
getXrefList(“WP554”、“L”)
或者,如果我们想把它们列为ensemble id,那么……
getXrefList(“WP554”、“En”)
而且,如果我们想要代谢产物、药物和其他与通路相关的小分子,那么我们只需提供化学数据库的系统代码,例如Ch (HMBD)、Ce (ChEBI)或Cs (Chemspider):
getXrefList('WP554', 'Ch') getXrefList('WP554', 'Ce')
就是这么简单!
我们还提供了作为数据文件和图像检索路径的方法。WikiPathways的原生文件格式是GPML,一种自定义XML规范。你可以通过…
gpml <- getpath ('WP554')
维基路径还提供每月数据发布,存档于http://data.wikipathways.org.存档包括GPML、GMT和SVG集合,按组织和时间戳划分。有一个R函数可以从存档中抓取文件…
downloadPathwayArchive ()
这将简单地在默认浏览器中打开存档,以便您可以四处查看(以防您不知道自己在寻找什么)。默认情况下,它会打开到最新的GPML文件集合。但是,如果您提供了一个组织,那么它将把该文件下载到您的当前工作目录或指定目录中destpath.例如,下面是如何获得鼠标的最新GMT文件:
downloadPathwayArchive(有机体="Mus musculus", format="gmt")
如果您想指定一个存档日期,以便您可以在将来的任何时候轻松地共享和重新生成脚本,并获得相同的结果。请记住,每个月都会有新的路径添加到WikiPathways中,现有的路径会不断改进!
downloadPathwayArchive(date="20171010", organism="Mus musculus", format="gmt")
这是一个概述rWikiPathways包中。查看其他小插图和包功能的完整列表:
browseVignettes (rWikiPathways)帮助(包=“rWikiPathways”)
1.Pico AR, Kelder T, Iersel MP van, Hanspers K, Conklin BR, Evelo C:维基路径:为人们编辑路径.公共科学图书馆杂志2008年,6: e184 +。
2.Iersel M van, Pico A, Kelder T, Gao J, Ho I, Hanspers K, Conklin B, Evelo C:BridgeDb框架:对基因、蛋白质和代谢物标识符映射服务的标准化访问.BMC生物信息学2010年,11: 5 +。