库(BiocStyle)库(HPAanalyze)图书馆(dplyr)图书馆(xml2)
人类的蛋白质图谱允许您下载每个蛋白质非常详细的数据以xml文件的形式,和hpaXmlGet
和hpaXml
允许您从HPA服务器和检索这些文件自动解析。然而,由于技术限制,您将无法保存/“xml_document xml_node”
对象。问题是:如何保持这些文件的一个版本使用当你没有连接到互联网,或再现性?
看一下“可下载的数据”从HPA网站页面,您将看到如何下载这些文件。基本上,你添加[ensembl_id] . xml
来http://www.proteinatlas.org
(这就是下载单个条目hpaXmlGet
幕后),或下载吗整个大集合。
从那里,您可以导入文件使用xml2: read_xml ()
。输出应该一模一样hpaXmlGet
。
# #一样hpaXmlGet (“ENSG00000134057”) CCNB1xml < - xml2:: read_xml(“数据/ ENSG00000134057.xml”)
hpaXml
功能自伞函数hpaXml
取的运用id或进口xml_document
对象,您可以养活你刚才进口,得到预期的结果。
CCNB1_parsed < - hpaXml (CCNB1xml)
您当然可以使用hpaXml
功能。
hpaXmlProtClass (CCNB1xml) hpaXmlTissueExprSum (CCNB1xml) hpaXmlAntibody (CCNB1xml) hpaXmlTissueExpr (CCNB1xml)
建议您保存解析对象的再现性。不像xml_document
解析对象,这些对象是普通R标准向量或数据帧列表。你可以拯救他们。
saveRDS (CCNB1_parsed,“数据/ CCNB1_parsed.rds”)
安特兰,2018 - 2022
请列举:Tran, A.N.Dussaq,点Kennell t . et al . HPAanalyze: R包,促进了人类的蛋白质图谱数据的检索和分析。BMC生物信息学463 (2019)https://doi.org/10.1186/s12859 - 019 - 3059 - z