rWikiPathways 1.16.0
WikiPathways是否有一个著名的生物路径库,为研究社区提供了独特的内容创建、编辑和利用工具[1].
R是一种用于统计和探索性数据分析的功能强大的编程语言和环境。
rWikiPathways利用WikiPathways API进行通信R以及WikiPathways,允许以数据和图像格式查询、查询和下载任何路径。查询通常基于“Xrefs”执行,这是基因、蛋白质和代谢物的标准化标识符。一旦确定了路径,就可以使用WPID (WikiPathways标识符)进行其他查询。
你所需要的就是这个rWikiPathways包!如果您正在查看这个小插图,那么您可能已经安装和加载了rWikiPathways,例如,通过:
如果(!"rWikiPathways" %in% installed.packages()){if (!requireNamespace("BiocManager", quiet =TRUE)) install.packages("BiocManager") BiocManager::install(" rwikipaths ")}
让我们先了解一下WikiPathways包含了什么。例如,下面是如何查看维基路径目前支持的物种:
listOrganisms ()
您应该会看到列出的30个或更多物种。该列表对于后续的查询非常有用生物争论,以避免拼写错误。
接下来,让我们看看人类有多少条路径:
海关。paths <- listpaths ('Homo sapiens') hs. paths . paths .路径
呵!这是大量的信息。让我们来分解一下:
? listPathways长度(hs.pathways)
好的。帮助文档告诉我们,对于每个人类路径,我们得到了很多信息。一个简单的长度函数可能是你真正想知道的。或者如果你只对某一条信息感兴趣,看看下面这些函数:
listPathwayIds listPathwayNames ? listPathwayUrls
这些返回的简单列表只包含每个路径结果的特定信息。
最后,还有另一种查找感兴趣的路径的方法:通过Xref。Xref只是官方源代码的标准化标识符。WikiPathways依赖于BridgeDb[2]为基因、蛋白质和代谢物提供数十种Xref来源。完整榜单见https://github.com/bridgedb/datasources/blob/main/datasources.tsv
与rWikiPathways在美国,方法很简单。为感兴趣的分子取一个支持的标识符,例如,HGNC的官方基因符号“TNF”,并检查系统代码例如,HGNC = H(这来自上面链接到的datasources.txt表的第二列),然后形成你的查询:
肿瘤坏死因子。paths <- findPathwaysByXref('TNF','H'
Ack !信息量很大啊。我们不仅提供路径信息,还提供搜索结果评分,以便您对结果进行排序等。同样,如果你只对wpid、名称或url感兴趣,那么有这些方便的选择,它们只返回简单的列表:
findPathwayIdsByXref findPathwayNamesByXref ? findPathwayUrlsByXref
请注意:一个简单的长度函数在这里可能会产生误导,因为如果Xref出现多次,则给定的路径将被列出多次。
此时,我们应该从上面的查询中识别出一个或多个路径。假设我们发现了' WP554 ', Ace抑制途径(https://wikipathways.org/instance/WP554).我们将在后续查询中使用它的WPID (WP554)。
首先,我们可以获得关于路径的信息(如果我们还没有收集到):
getPathwayInfo(“WP554”)
接下来,我们可以获得路径中包含的所有xref,并将其映射到我们选择的数据源。多方便啊!我们使用相同的系统代码如上所述。例如,如果我们想要从这个途径中获得所有被列为Entrez基因的基因:
getXrefList(“WP554”、“L”)
或者,如果我们想把它们列为ensemble id,那么……
getXrefList(“WP554”、“En”)
而且,如果我们想要代谢产物、药物和其他与通路相关的小分子,那么我们只需提供化学数据库的系统代码,例如Ch (HMBD)、Ce (ChEBI)或Cs (Chemspider):
getXrefList('WP554', 'Ch') getXrefList('WP554', 'Ce')
它是那么容易!
我们还提供了将路径作为数据文件和图像进行检索的方法。WikiPathways的原生文件格式是GPML,这是一种自定义XML规范。你可以通过…
gpml < - getPathway(“WP554”)
WikiPathways还提供存档在http://data.wikipathways.org.档案按组织和时间戳包括GPML、GMT和SVG集合。有一个R函数用于从存档中抓取文件…
downloadPathwayArchive ()
这将简单地在默认浏览器中打开存档,以便您可以四处查看(以防您不知道要查找什么)。默认情况下,它打开到最新的GPML文件集合。但是,如果您提供了一个生物体,那么它将下载该文件到您当前的工作目录或指定的目录中destpath.例如,下面是如何获取鼠标的最新GMT文件:
downloadPathwayArchive(生物=“亩所支配”,格式=“格林尼治时间”)
如果您想要指定存档日期,以便您可以在将来的任何时候轻松地共享和重新生成脚本,并获得相同的结果。记住,每个月都会有新的路径添加到WikiPathways中,现有的路径也会不断得到改进!
downloadPathwayArchive(date="20171010",有机体="Mus musculus", format="gmt")
这是一个概述rWikiPathways包中。查看其他小插图和包功能的完整列表:
browseVignettes (rWikiPathways)帮助(包=“rWikiPathways”)
1.Pico AR, Kelder T, Iersel MP van, Hanspers K, Conklin BR, Evelo C:维基路径:为人们编辑路径.公共科学图书馆杂志2008,6: e184 +。
2.Iersel M van、Pico A、Kelder T、Gao J、Ho I、Hanspers K、Conklin B、Evelo C:BridgeDb框架:对基因、蛋白质和代谢物标识符映射服务的标准化访问.BMC生物信息学2010年,11: 5 +。