1最初的评论

人类代谢组学数据库(HMDB,http://www.hmdb.ca)包括描述114000种代谢物的XML文档。我们将展示如何相当灵活地操作代谢物的元数据。

2包的关键实用程序

hmdbQuery包包含了一个通过HTTP直接查询HMDB的函数:

结果被解析并封装在一个S4对象中

lk1
## 1-甲基组氨酸的HMDB代谢物元数据:##注释了10种疾病。报告了5个生物标本和2个组织的直接关联。使用疾病()、生物标本()、组织()获取更多信息。

关于单一代谢物的信息的完整导入的大小表明,在记忆中拥有关于所有HMDB成分的全面信息并不太方便。管理元数据的最有效方法将取决于长期开发的用例。

但请注意,该软件包确实提供了截至2017年9月23日的所有可用信息中某些直接关联的快照。关于数据库中报告的直接关联的信息显示在表格中hmdb_diseasehmdb_genehmdb_proteinhmdb_omim.例如

##数据框架与75360行和3列##接入名称疾病## <字符> <字符> <字符> ## 1 HMDB0000001 -甲基组氨酸阿尔茨海默病## 2 HMDB0000001 -甲基组氨酸糖尿病。1-甲基组氨酸肾脏病## 4 -甲基组氨酸肥胖## 5## ... ... ... ...四甘醇钠(i-14:0/17:0/i-13:0) TG(15:0/i-14:0/a-21:..NA

3.处理元数据

3.1疾病协会

一些HMDB代谢物已被映射到疾病中。

##加载所需的包:AnnotationDbi
##加载所需的包:stats4
##加载所需的包:BiocGenerics
##加载所需的包:并行
## ##附加包:“BiocGenerics”
以下对象将从'package:parallel'中屏蔽:## ## clusterApply, clusterApplyLB, clusterCall, clusterEvalQ, ## clusterExport, clusterMap, parApply, parCapply, parApply, ## parapplylb, parRapply, parSapply, parSapplyLB
以下对象从'package:stats'中屏蔽:## ## IQR, mad, sd, var, xtabs
##以下对象从'package:base'中屏蔽:## ## Filter, Find, Map, Position, Reduce, anyduplication, append, ## as.data.frame, basename, cbind, colnames, dirname, do。调用,## duplicate eval evalq get grep grepl, intersect, is。Unsorted, ## lapply, mapply, match, mget, order, paste, pmax, pmax.int, pmin, ## pmin.int, rank, rbind, rownames, sapply, setdiff, sort, table, ## tapply, union, unique, unsplit,其中。马克斯,which.min
##加载所需的包:Biobase
##欢迎访问Bioconductor ## ##小插图包含介绍性材料;查看## 'browseVignettes()'。要引用Bioconductor,请参见##“citation(“Biobase”)”,以及软件包的“citation(“pkgname”)”。
##加载所需的包:IRanges
##加载所需的包:S4Vectors
## ##附加包:“S4Vectors”
以下对象从'package:base'中屏蔽:## ## I,展开。网格,unname
标题:二甲基甘氨酸在尿毒症中累积,并预测血浆同型半胱氨酸浓度升高。作者:DO McGregor, WJ Dellow, M Lever, PM George, RA Robson, ST ## Chambers ## Journal: Kidney Int ##日期:2001年6月

3.2生物标本和组织定位元数据

注意,在HMDB v 4.0之前,生物标本被称为生物流体。

每个HMDB条目都提供了任意数量的生物标本和组织关联。我们有直接访问器,默认情况下,我们捕获所有元数据,可通过商店方法。

“血液”“脑脊液(CSF)”##[3]“粪便”“唾液”“尿液”
##[1]“胎盘”“骨骼肌”
##[1]“版本”“creation_date”“update_date”##[4]“接入”“状态”“secondary_accessions”
46
“- ala - his二肽酶”## ## $protein ##[1]“蛋白质精氨酸n -甲基转移酶3”
# # # # $蛋白质[1]“CNDP1”# # # # # # $蛋白质[1]“PRMT3”