biodbLipidmaps 1.0.1
biodbLipidmaps是一个biodb扩展包,实现了一个连接器Lipidmaps结构(Sud et al . 2007年)。
如果(!requireNamespace (“BiocManager”,悄悄地= TRUE)) install.packages (“BiocManager”) BiocManager::安装(“biodbLipidmaps”)
使用的第一步biodbLipidmaps,是创建biodb类的一个实例BiodbMain
从主biodb包中。这是通过调用类的构造函数:
mybiodb < - biodb: newInst ()
在此步骤配置设置,初始化缓存系统加载和扩展包。
我们将看到的最后一幕biodb实例需要终止调用终止()
方法。
在biodb连接数据库是由连接器实例,您可以从工厂。这里的代码实例化一个连接器Lipidmaps结构数据库:
康涅狄格州< - mybiodb getFactory美元()美元createConn (“lipidmaps.structure”)
# #加载所需的包:biodbLipidmaps
得到的条目存储在数据库中,运行:
康涅狄格州getNbEntries美元()
# # [1]NA
第一批进入id从数据库(加入数字),运行:
康涅狄格州id < - $ getEntryIds (2) id
# # [1]“LMFA00000001”“LMFA00000002”
检索条目,使用:
康涅狄格州条目< - $ getEntry (ids)条目
([1])# # # # LMFA00000001 Biodb脂质结构映射条目实例。# # # # # # Biodb[[2]]条目实例LMFA00000002脂质地图结构。
将一个条目列表转换成一个数据帧,运行:
x < - mybiodb entriesToDataframe美元(条目)
# #加载所需的包:biodbChebi
x
# # 1 # #加入ncbi.pubchem.comp.id LMFA00000001 10930192 # # 2 LMFA00000002 10930192 # # comp.iupac.name.syst单一同位素的。质量# # 1 2-methoxy-12-methyloctadec-17-en-5-ynoyl酐626.4910 # # 2 N - (3 s-hydroxydecanoyl) -L-serine 275.1733名称# # 1 # #公式C40H66O5 2-methoxy-12-methyloctadec-17-en-5-ynoyl酸酐;乙炔的酸# # 2 C13H25NO5 Serratamic酸# # lipidmaps.structure。id chebi。id # # 1 LMFA00000001 < NA > # # 137783 # # 1 # # inchi LMFA00000002 < NA > # # 2 inchi = 1 s / C13H25NO5 c1-2-3-4-5-6-7-10 (16) 8 - 12 (17) 14-11 (15) 13 (18) 19 / h10-11 15-16H, 2-9H2, 1 h3 (H, 14日,17)(19)H, 18日/ t10 - 11 - / mo / s1 # # inchikey分子。质量# # 1 < NA > NA # # 2 NDDJIMSGSZNACM-QWRGUYRKSA-N 275.342
你可以访问web服务直接与“LMSDSearch”wsLmsdSearch方法:
康涅狄格州id < - $ wsLmsdSearch(模式= ProcessStrSearch, name =“脂肪”,retfmt =“id”) id
# # [1]“LMFA01010000”“LMFA01140081”“LMFA01140082”“LMFA01140083”“LMFA01140084”# # [6]“LMFA01140085”“LMFA05000000”“LMFA06000000”
从这个标识符的列表,我们可以获得完整的条目对象:
康涅狄格州条目< - $ getEntry (ids)
然后一个数据帧:
entriesDf < - mybiodb entriesToDataframe美元(条目)
在表中可以看到1。
加入 | chebi.id | kegg.compound.id | comp.iupac.name.syst | 的名字 | lipidmaps.structure.id | inchi | inchikey | molecular.mass | ncbi.pubchem.comp.id | monoisotopic.mass | 公式 |
---|---|---|---|---|---|---|---|---|---|---|---|
LMFA01010000 | 35366年 | C00162 | 脂肪酸 | 脂肪酸 | LMFA01010000 | NA | NA | 45.0174 | NA | NA | NA |
LMFA01140081 | NA | NA | 2 - [5]-ladderane乙酸 | 2 - [5]-ladderane乙酸;C14 - [5] -ladderane脂肪酸 | LMFA01140081 | NA | NA | NA | 137323820 | 218.1307 | C14H18O2 |
LMFA01140082 | NA | NA | 2 - [3]-ladderane乙酸 | 2 - [3]-ladderane乙酸;C14 - [3] -ladderane脂肪酸 | LMFA01140082 | NA | NA | NA | 137323821 | 220.1463 | C14H20O2 |
LMFA01140083 | NA | NA | 8 - [1]-ladderane辛酸 | 8 - [1]-ladderane辛酸;甜2 - [1]-ladderane脂肪酸 | LMFA01140083 | NA | NA | NA | 137323822 | 302.2246 | C20H30O2 |
LMFA01140084 | NA | NA | 8 - [1]-ladderane辛酸 | 8 - [1]-ladderane辛酸;甜2 - [1]-ladderane脂肪酸 | LMFA01140084 | NA | NA | NA | 137323823 | 304.2402 | C20H32O2 |
LMFA01140085 | NA | NA | 6 - [1]-ladderane己酸 | 6 - [1]-ladderane己酸,使用C18 - [1] -ladderane脂肪酸 | LMFA01140085 | NA | NA | NA | 137323824 | 274.1933 | C18H26O2 |
LMFA05000000 | 142622年 | NA | NA | 脂肪醇 | LMFA05000000 | NA | NA | 31.0340 | NA | NA | NA |
LMFA06000000 | 35746年 | NA | NA | 脂肪醛 | LMFA06000000 | NA | NA | 29.0180 | NA | NA | NA |
当你完成了biodb实例必须终止,为了确保释放资源(文件句柄、数据库连接等):
mybiodb终止美元()
# #信息[16:58:26.715]关闭BiodbMain实例…# #信息[16:58:26.717]lipidmaps连接器”。结构”删除。# #信息(16:58:26.724)连接器“chebi”删除。
sessionInfo ()
# # R版本以下4.4.1(2021-08-10)# #平台:x86_64-pc-linux-gnu(64位)# #下运行:Ubuntu 20.04.3 LTS # # # #矩阵产品:默认# #布拉斯特区:/home/biocbuild/bbs - 3.14 - bioc / R / lib / libRblas。所以# # LAPACK: /home/biocbuild/bbs - 3.14 - bioc / R / lib / libRlapack。# # # #语言环境:# # [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC = C # #[3]而= en_GB LC_COLLATE = C # # [5] LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # # [7] LC_PAPER = en_US。utf - 8 LC_NAME = C # # [9] LC_ADDRESS C = C LC_TELEPHONE = # # [11] LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C附加基本包:# # # # # #[1]统计图形grDevices跑龙套数据集方法基础# # # #其他附加包:# # [1]biodbChebi_1.0.1 biodbLipidmaps_1.0.1 BiocStyle_2.22.0 # # # #通过加载一个名称空间(而不是附加):# # [1]progress_1.2.2 tidyselect_1.1.1 xfun_0.27 # # [4] bslib_0.3.1 purrr_0.3.4 vctrs_0.3.8 # # [7] generics_0.1.1 htmltools_0.5.2 BiocFileCache_2.2.0 # # [10] yaml_2.2.1 utf8_1.2.2 blob_1.2.2 # # [13] xml_3.99 - 0.8 rlang_0.4.12 jquerylib_0.1.4 # # [16] pillar_1.6.4 withr_2.4.2 glue_1.4.2 # # [19] DBI_1.1.1 rappdirs_0.3.3 bit64_4.0.5 # # [22] dbplyr_2.1.1 lifecycle_1.0.1 plyr_1.8.6 # # [25] stringr_1.4.0 memoise_2.0.0 evaluate_0.14 # # [28] knitr_1.36 fastmap_1.1.0 curl_4.3.2 # # [31] fansi_0.5.0 highr_0.9 biodb_1.2.0 # # [34] Rcpp_1.0.7 openssl_1.4.5 filelock_1.0.2 # # [37] BiocManager_1.30.16 cachem_1.0.6 jsonlite_1.7.2 # # [40] bit_4.0.4 hms_1.1.1 chk_0.7.0 # # [43] askpass_1.1 digest_0.6.28 stringi_1.7.5 # # [46] bookdown_0.24 dplyr_1.0.7 bitops_1.0-7 # # [49] tools_4.1.1 magrittr_2.0.1 sass_0.4.0 # # [52] rcurl_1.98 - 1.5 RSQLite_2.2.8 tibble_3.1.5 # # [55] crayon_1.4.1 pkgconfig_2.0.3 ellipsis_0.3.2 # # [58] prettyunits_1.1.1 assertthat_0.2.1 rmarkdown_2.11 # # [61] httr_1.4.2 lgr_0.4.3 R6_2.5.1 # # [64] compiler_4.1.1
Sud、Manish Eoin Fahy黎明销,亚历克斯·布朗,爱德华·a·丹尼斯,克里斯托弗·k .玻璃、阿尔弗雷德·h·美林Jr . et al . 2007。“LMSD:脂质地图数据库结构。”核酸的研究35(数据库问题):D527-D532。https://doi.org/10.1093/nar/gkl838。