1简介

microRNAs (miRNAs)通过促进降解或抑制靶转录物的翻译来调节表达。基于实验验证和使用各种算法的计算预测,miRNA靶点已经在数据库中进行了编目。一些在线资源提供多个数据库的集合,但需要导入其他软件,如R,以进行处理、制表、绘图和计算。目前R中可用的miRNA靶点包在数据库数量、数据库类型和灵活性方面受到限制。

R包multiMiR, web服务器在http://multimir.org,是预测和验证的mirna -靶点相互作用及其与疾病和药物的关系的综合集合。multiMiR包含了一些现有R包中没有的新特性:

  1. 汇编了14个不同的数据库,比任何其他集合都多
  2. 将数据库扩展到基于疾病注释和药物反应的数据库,此外还有许多实验和计算数据库
  3. 用户自定义的预测结合强度截止,以提供最可靠的选择。

multiMiR包可以在R中从14个外部数据库检索miRNA-target相互作用,而不需要访问所有这些数据库。高级用户还可以向web服务器提交SQL查询以检索结果。看到在PubMed上发表有关数据库及其创建的其他详细信息。数据库现在已经有了版本控制,因此可以使用当前R包中的以前版本的数据库,但是包默认为最新版本。

警告从旧的未维护的数据库合并目标id时存在问题。最近更新的数据库(1-2年)使用带注释的id的当前版本。在每次更新中,由于缺乏一种可靠的方法来消除原始ID与当前ID的歧义,这些旧的目标ID都会被保留下来。对于来自未更新的旧数据库的结果,请记住这一点。我们将继续研究解决这些歧义的方法,并改进数据库之间的目标一致性。如果需要,可以使用唯一的()R函数来识别并删除多个目标基因。

2了解multiMiR数据库

multiMiRweb服务器http://multimir.org宿主有一个数据库,其中包含来自外部数据库的miRNA-target相互作用。这个包multiMiR类通信的函数multiMiRWeb服务器及其数据库。的multiMiR数据库现在是版本化的。默认情况下multiMiR每次都会使用最新的版本吗multiMiR加载。但是,现在可以在数据库版本之间进行切换并获取有关multiMiR数据库版本。multimir_dbInfoVersions ()返回一个包含可用版本的数据框架。

##欢迎来到multiMiR。## ## multiMiR数据库URL已设置为##默认值:http://multimir.org/ ## ##数据库版本:2.3.0更新日期:2020-04-15
版本更新RDA DBNAME模式rda multimir2_3 multiMiR_DB_schema。SQL 1 ## 2 2.2.0 2017-08-08 multimir_cutoffs_2.2。rda multimir2_2 multiMiR_DB_schema。SQL 1 ## 3 2.1.0 2016-12-22 multiir_cutoffs_2.1 . SQLrda multimir2_1 multiMiR_DB_schema。SQL 1 ## 4 2.0.0 2015-05-01 multimir_cutoffs。rda multimir multiMiR_DB_schema。sql 1 ##表## 1 multiMiR_dbTables.txt ## 2 multiMiR_dbTables.txt ## 3 multiMiR_dbTables.txt ## 4 multiMiR_dbTables.txt

在我们可以使用的版本之间切换multimir_switchDBVersion ()

版本更新RDA DBNAME模式rda multimir2_3 multiMiR_DB_schema。SQL 1 ## 2 2.2.0 2017-08-08 multimir_cutoffs_2.2。rda multimir2_2 multiMiR_DB_schema。SQL 1 ## 3 2.1.0 2016-12-22 multiir_cutoffs_2.1 . SQLrda multimir2_1 multiMiR_DB_schema。SQL 1 ## 4 2.0.0 2015-05-01 multimir_cutoffs。rda multimir multiMiR_DB_schema。sql 1 ##表## 1 multiMiR_dbTables.txt ## 2 multiMiR_dbTables.txt ## 3 multiMiR_dbTables.txt ## 4 multiMiR_dbTables.txt
##现在使用数据库版本:2.0.0
##现在使用数据库版本:2.3.0

其余函数将查询所选的版本,直到包被重新加载或切换到另一个版本为止。

中的表中存储来自每个外部数据库的信息multiMiR数据库。要查看表的列表,可以使用multimir_dbTables ()函数。

## [1] "diana_microt" "elmmo" "map_counts" "map_metadata" " microcoms " "mir2disease" ## [7] "miranda" "mirdb" "mirecords" "mirna" "mirtarbase" "pharmaco_mir" ## [13] "phenomir" "pictar" "pita" "tarbase" "target" "targetscan"

要显示数据库模式,可以使用multimir_dbSchema ()函数。以下只是完整输出的一部分。

# #--# #表“mirna”的表结构# #--# ## #下降表格如果存在“microrna的”;# #创建表格“microrna的”(# # mature_mirna_uid整数无符号AUTO_INCREMENT,——成熟miRNA唯一ID# #组织VARCHAR4,——有机体简称# # mature_mirna_accVARCHAR20.默认的,——成熟的miRNA接入# # mature_mirna_idVARCHAR20.默认的,——成熟的miRNA ID/名称# #主要的关键(mature_mirna_uid),# #关键org(组织),# #关键mature_mirna_acc (mature_mirna_acc),# #关键mature_mirna_id (mature_mirna_id)# #);# ## #--# #——表“目标”的表结构# #--# ## #下降表格如果存在“目标”;# #创建表格“目标”(# # target_uid整数无符号AUTO_INCREMENT,——目标基因唯一ID# #组织VARCHAR4,——有机体简称# # target_symbolVARCHAR80默认的,——目标基因符号# # target_entrezVARCHAR10默认的,——目标基因Entrez基因ID# # target_ensemblVARCHAR20.默认的,——目标基因Ensembl基因ID# #主要的关键(target_uid),# #关键org(组织),# #关键target_symbol (target_symbol),# #关键target_entrez (target_entrez),# #关键target_ensembl (target_ensembl)# #);# ## #--# #——mirecords表的表结构# #--# ## #下降表格如果存在“mirecords”;# #创建表格“mirecords”(# # mature_mirna_uid整数无符号,——成熟miRNA唯一ID# # target_uid整数无符号,——目标基因唯一ID# # target_site_numberINT10默认的,——目标站点编号# # target_site_positionINT10默认的,——目标位置# #实验VARCHAR160默认的,——支撑实验# # support_typeVARCHAR40默认的,——配套实验类型# # pubmed_idVARCHAR10默认的,——PubMed ID# #外国关键(mature_mirna_uid)# #参考文献microrna (mature_mirna_uid)# #更新级联删除限制,# #外国关键(target_uid)# #参考文献目标(target_uid)# #更新级联删除限制# #);# ## #......# ###(请注意只有三个19显示在这里示范# #目的。)

这个函数multimir_dbInfo ()将在?中显示有关外部miRNA和miRNA-target数据库的信息multiMiR,包括版本、发布日期、下载数据的链接,以及相应的表格multiMiR

# # 1 # # map_name source_name source_version source_date diana_microt DIANA-microT 5 9月,2013 # # 2 elmmo EIMMo 5 1月,2011 # # 3缩影缩影5 9月,2009 # # 4 mir2disease mir2disease 3月14日,8月2011 # # 5米兰达米兰达,2010 # # 6 mirdb mirdb 6月6日,2019 # # 7 mirecords mirecords 4 4月27日,2013 # # 8 mirtarbase mirtarbase 7.0 9月,2017 # # 9 pharmaco_mir Pharmaco-miR(验证集)# # 10 phenomir phenomir 2 2月15日,2011 # # 11 pictar pictar 2 12月21日,2012 # # 12皮塔饼皮塔饼6 8月31日2008 ## 13 tarbase tarbase 8 2018 ## 14 targetscan targetscan 7.2 3月,2018 # # 1 # # source_url http://diana.imis.athena-innovation.gr/DianaTools/index.php?r=microT_CDS/index http://www.ebi.ac.uk/enright-srv/microcosm/cgi-bin/targets/v5/download.pl http://www.mirz.unibas.ch/miRNAtargetPredictionBulk.php # # # 2 # 3 # # 4 http://www.mir2disease.org # # 5 http://www.microrna.org/microrna/getDownloads.do http://mirecords.biolead.org/download.php http://mirdb.org # # # 6 # 7 # # 8 http://mirtarbase.mbc.nctu.edu.tw/php/download.php # # 9http://www.pharmaco-mir.org/home/download_VERSE_db ## 10 http://mips.helmholtz-muenchen.de/phenomir/ ## 11 http://dorina.mdc-berlin.de ## 12 http://genie.weizmann.ac.il/pubs/mir07/mir07_data.html ## 13 http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r=tarbasev8%2Findex ## 14 http://www.targetscan.org/cgi-bin/targetscan/data_download.cgi?db=vert_61

在14个外部数据库中,8个包含预测的mirna -靶标相互作用(DIANA-microT-CDS、ElMMo、microcosmo、miRanda、miRDB、PicTar、PITA和TargetScan), 3个已经实验验证了mirna -靶标相互作用(miRecords、miRTarBase和TarBase),其余3个包含mirna -药物/疾病关联(miR2Disease、Pharmaco-miR和PhenomiR)。为了在R中检查这些类别和数据库,我们有一组四个辅助函数:

##[1]“diana_microt”“elmmo”“microcosmos”“miranda”“mirdb”“pictar”##[7]“pita”“targetscan”
## [1] "mirecords" "mirtarbase" "tarbase"
##[1]“mir2disease”“pharmaco_mir”“phenomir”
##[1]“预测”

要查看这14个外部数据库中有多少条记录,请参考multimir_dbCount函数。

# # 1 # # map_name human_count mouse_count rat_count total_count diana_microt 7664602 3747171 0 3747171 # # 2 elmmo 3747171 7664602 547191 5955436 762987 534735 353378 1651100 # # # # 3缩影4 mir2disease米兰达2875 0 0 2875 # # 5 5429955 2379881 247368 2379881 # # 6 mirdb 2379881 5429955 199250 3280938 7 mirecords 2425 449 171 3045 # # # # 8 mirtarbase 544588 50673 652 308 595913 # # 9 pharmaco_mir 5 0 313 # # 10 phenomir 15138 491 0 15629 # # 11 pictar 404066 302236 0 706302 # # 12皮塔饼771093613 tarbase 433048 209831 1307 644186 ## 14目标可以13906497 10442093 0 24348590
## human_count mouse_count rat_count total_count 25371114 1349317 69547393

当前版本multiMiR包含近5000万条记录。

3.更改包:multiMiR- S3和S4类

随着multiir添加到Bioconductor,返回对象已经从S3 (mmquery)转至S4班(mmquery_bioc)。新的S4对象具有与以前版本相似的结构,除了所有返回的数据集(已验证的、预测的、疾病。药物)现在都组合成一个数据集。若要只获取一种类型,请在类型变量使用后面讨论的AnnotationDbi方法或基本R方法子集(myqry@data, myqry@data$type == "validated"))。为了向后兼容,get_multimir ()将返回旧的S3对象如果参数的遗产。out = TRUE

现在可以使用S4访问操作符访问特性@.此外,AnnotationDbi访问器方法,,keytypes,选择所有工作mmquery_bioc对象。参见7.6

4在multiMiR数据库中列出mirna,基因,药物和疾病

除了显示数据库和表信息的函数外,multiMiR包还提供list_multimir ()功能列出所有独特的mirna,靶基因,药物和疾病multiMiR数据库。添加了一个限制返回记录数量的选项,以帮助进行测试和探索。

1 7829 ath MIMAT0000184 ath- mir163 ## 2 7833 ath MIMAT0000201 ath- mir170 -3p ## 3 7831 ath MIMAT0000206 ath- mir173 -5p ## 4 7828 ath MIMAT0001001 ath- mir400 ## 5 7837 ath MIMAT0001004 ath- mir403 -3p ## 6 7830 ath MIMAT0001011 ath- mir408 -3p
## target_uid org target_symbol target_entrez target_ensembl ## 1 112854 ath AT1G02860 ## 2 112855 ath AT1G06180 ## 3 112856 ath AT1G06580 ## 4 112857 ath AT1G15125 ## 5 112868 ath At1g31280 ## 6 112869 ath At1g50055
##药物## 1 3,3'-二吲哚基甲烷## 2 5-氟尿嘧啶## 3 abt-737 ## 4阿利维甲酸## 5阿拉伯胞嘧啶## 6三氧化二砷
acth非依赖性大结节性肾上腺增生;Aimah ## 2急性淋巴细胞白血病(all) ## 3急性髓系白血病(aml) ## 4急性髓系白血病(aml) ## 5急性早幼粒细胞白血病(apl) ## 6腺瘤

当前版本multiMiR拥有5830个mirna和97186个来自人、小鼠和大鼠的靶基因,以及64种药物和223种疾病术语。根据网络连接的速度,检索大量的目标基因可能需要几分钟的时间。

5使用get_multimir ()命令,查询multiMiR数据库

get_multimir ()该包的主要功能是检索预测和验证的mirna -靶标相互作用及其与疾病和药物的关联multiMiR数据库。

要熟悉的参数get_multimir (),你可以输入get_multimir ?帮助(get_multimir)在下一节中,将有许多示例说明参数的使用。

6Bioconductor工作流中的multiMiR示例

的使用multiMiR刨边机Bioconductor包。在这里,我们从ISS和ILS小鼠品系中提取microRNA数据并进行差异表达分析。然后使用顶部差异表达的microRNA搜索multiMiR数据库,以获得验证的目标基因。

##加载所需的包:limma
##搜索错误记录…##搜索mirtarbase…##搜索tarbase…
MIMAT0000519 mm - mir -200a-3p Dlx5 13395 ENSMUSG00000029755 ## 4 mirecords MIMAT0000541 mm - mir -96-5p Aqp5 11830 ENSMUSG00000044217 ## 5 mirecords MIMAT0000541 mm - mir -96-5p Celsr2 53883 ENSMUSG00000068740 ## 6 mirecords MIMAT0000541 mm - mir -200b-3p Zeb2 24136 ENSMUSG00000026872 ## 2 mirecordsMyrip 245049 ENSMUSG00000041794实验support_type pubmed_id type ## 1 Western blot 17585049 validated ## 2 Western blot//荧光素酶活性测定19454767 validated ## 3 Western blot//荧光素酶活性测定19454767 validated ## 4 19363478 validated ## 5 19363478 validated ## 6 19363478 validated

7多ir查询的例子

在本节中,介绍了各种关于如何查询multiMiR数据库的示例。

7.1例1:检索给定miRNA的所有有效靶基因

在第一个例子中,我们询问哪些基因是hsa-miR-18a-3p的有效靶标。

##搜索错误记录…##搜索mirtarbase…##搜索tarbase…
# #空
## ##验证## 803
# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 mirecords MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 # # 2 mirtarbase MIMAT0002891 hsa-miR-18a-3p ac 47 ENSG00000131473 # # 3 mirtarbase MIMAT0002891 hsa-miR-18a-3p AP1B1 162 ENSG00000100280 # # 4 mirtarbase MIMAT0002891 hsa-miR-18a-3p ALDOA 226 ENSG00000149925 # # 5 mirtarbase MIMAT0002891 hsa-miR-18a-3p ARF5 381 ENSG00000004059 # # 6 mirtarbase MIMAT0002891 hsa-miR-18a-3p ATM 472ENSG00000149311 ## 1 Western blot//荧光素酶活性检测## 2 CLASH功能性MTI(弱)## 3 CLASH功能性MTI(弱)## 4 PAR-CLIP功能性MTI(弱)## 5 CLASH功能性MTI(弱)## 6免疫荧光//荧光素酶报告检测//qRT-PCR//Western blot功能MTI ## pubmed_id类型## 1 19372139验证## 2 23622248验证## 3 23622248验证## 4 27292025验证## 5 23622248验证## 6 25963391验证
# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 mirecords MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 # # 6 mirtarbase MIMAT0002891 hsa-miR-18a-3p ATM 472 ENSG00000149311 # # 58 mirtarbase MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 # # 254 mirtarbase MIMAT0002891 hsa-miR-18a-3p CBX7 23492 ENSG00000100307 # #实验support_type pubmed_id # # 1免疫印迹/ /荧光素酶活性测定19372139 # # 6免疫荧光/ /荧光素酶报告化验//qRT-PCR//Western blot Functional MTI 25963391 ## 58荧光素酶报告化验//qRT-PCR//Western blot Functional MTI 19372139 ## 254荧光素酶报告化验//Western blot Functional MTI 28123848 ## type ## 1 validated ## 6 validated ## 58 validated ## 254 validated
17 MIMAT0002891 hsa-miR-18a-3p KRAS 3845 ENSG00000133703 mirtarbase tarbase已验证。和所有。总和# #171022

事实证明喀斯特是唯一通过荧光素酶试验验证的靶点。交互记录在miRecords和miRTarBase中,并得到相同文献的支持,列中为文献的PubMed IDpubmed_id.摘要(通过设置summary = TRUE当调用get_multimir ())显示每个外部数据库中的记录数量和支持该交互的数据库总数。

7.2例2:检索与给定药物或疾病相关的mirna -靶标相互作用

在这个例子中,我们想知道哪些miRNAs及其靶基因与顺铂相关,顺铂是一种用于多种癌症的化疗药物。

##搜索mir2疾病…##搜索pharmaco_mir…##搜索现象…
# #空
## [1] 45
## ##疾病。毒品## 45
# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 pharmaco_mir MIMAT0000772 hsa - mir - 345 - 5 - 4363 p ABCC1 ENSG00000103222 # # 2 pharmaco_mir MIMAT0000720 hsa - mir - 376 - c - 3 - p ALK7 # # 3 pharmaco_mir MIMAT0000423 hsa - mir - 125 - b - 578 - p BAK1 ENSG00000030110 # # 4 pharmaco_mir hsa-miR-34 BCL2 596 ENSG00000171791 # # 5 pharmaco_mir MIMAT0000318 hsa - mir - 200 - b - 596 - p BCL2 ENSG00000171791 # # 6 pharmaco_mir MIMAT0000617 hsa - mir - 200 - c - 596 - p BCL2 ENSG00000171791 # # disease_drugpaper_pubmedID类型## 1顺铂20099276疾病。药物## 2顺铂21224400疾病药物# 3顺铂21823019疾病。药物## 4顺铂18803879疾病。药物# 5顺铂21993663疾病。药物## 6顺铂21993663疾病。药物

get_multimir ()返回53个miRNA-target对。要了解更多信息,我们可以随时参考已发表的论文,在列中有PubMed idpaper_pubmedID

7.3例3:选择预测靶向某个基因的mirna

get_multimir ()同样以目标基因作为输入。在本例中,我们检索了预测靶向的mirnaGnb1在鼠标。对于预测的交互,默认是在每个外部数据库中查询前20%的预测,这相当于设置参数预测。截止=20.而且predict .cut .type = 'p'(按百分比计算)。在这里,我们在所有保护和非保护的目标站点中搜索前35%。

##搜索diana_microt…##搜索elmmo…##搜索微观世界…##搜索米兰达…##搜索mirdb…##搜索pictar…##搜索皮塔饼…##搜索目标可以…
# #空
## ##预测## 716
# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 diana_microt MIMAT0000663 mmu - mir - 218 - 5 - 14688 p Gnb1 ENSMUSG00000029064 # # 2 diana_microt MIMAT0017276 mmu - mir - 493 - 5 - 14688 p Gnb1 ENSMUSG00000029064 # # 3 diana_microt MIMAT0000656 mmu - mir - 139 - 5 - 14688 p Gnb1 ENSMUSG00000029064 # # 4 diana_microt MIMAT0014946 mmu - mir - 3074 - 2 - 14688 - p Gnb1 ENSMUSG00000029064 # # 5 diana_microt MIMAT0000144 mmu - mir - 132 - 3 - p Gnb1 14688 ENSMUSG00000029064 # # 6 diana_microtMIMAT0020608 mm - mir -5101 Gnb1 14688 ENSMUSG00000029064评分类型## 1 0.975预测## 2 0.964预测## 3 0.96预测## 4 0.921预测## 5 0.92预测## 6 0.918预测
# # mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl diana_microt # # 1 MIMAT0000133 mmu - mir - 101 - 14688 - 3 - p Gnb1 ENSMUSG00000029064 1 # # 2 MIMAT0000616 mmu - mir - 101 - b - 14688 - p Gnb1 ENSMUSG00000029064 1 # # 3 MIMAT0000663 mmu - mir - 218 - 5 - 14688 p Gnb1 ENSMUSG00000029064 1 # # 4 MIMAT0003476 mmu - mir - 669 - b - 14688 - p Gnb1 ENSMUSG00000029064 1 # # 5 MIMAT0017276 mmu - mir - 493 - 5 - 14688 p Gnb1 ENSMUSG00000029064 1 # # 6 MIMAT0000144 mmu - mir - 132 - 3 - p Gnb1 14688 ENSMUSG00000029064 1 # # elmmo微观世界米兰达mirdb pictar pita目标可以预测。和所有。总和# #1211020 0 5 5 ## 2 2 1 1 0 2 0 0 5 5 ## 3 4 0 0 1 0 2 1 5 5 ## 4 0 0 1 2 0 1 2 5 5 ## 5 4 0 0 2 2 0 1 5 5 ## 6 2 0 0 2 0 0 2 4 4

记录在example3@predicted在每个外部数据库中按分数从最好到最差进行排序。同样,summary选项允许我们检查每个外部数据库预测的目标站点的数量以及预测交互的数据库的总数。

最后,我们检查每个数据库有多少预测。

## diana_microt elmmo microcomiranda mirdb pictar pita ## 105 51 5 43 37 9 132 ## targetscan ## 177

7.4例4:选择预测目标大部分(如果不是全部)感兴趣的基因的miRNA

你可能有一个共同生物过程中涉及的基因列表。有趣的是,检查这些基因中的一些或全部是否被相同的miRNA靶向。在这里,我们有四个参与人类慢性阻塞性肺疾病(COPD)的基因,并希望通过搜索每个外部数据库中排名前50万的预测来了解哪些mirna靶向这些基因。

##数量预测截止(predict .cutoff) 500000大于表pictar中的记录总数。查询所有记录。
##数量预测截断(predict .cutoff) 500000比表目标中的记录总数要大。查询所有记录。
##搜索diana_microt…##搜索elmmo…##搜索微观世界…##搜索米兰达…##搜索mirdb…##搜索pictar…##搜索皮塔饼…##搜索目标可以…

然后我们计算每个miRNA的靶基因数量。

0 12 14 ## hsa-miR-144-3p 0 12 0 3 # hsa-miR-3180-5p 0 12 0 3 # hsa-miR-325-3p 1 1 0 1 3 # hsa-miR-34a-5p 0 12 0 3

7.5例5:检索一组mirna和一组基因之间的相互作用

在本例中,我们分别分析了低转移性膀胱癌细胞系T24和Luc及其转移衍生物FL4和Lul2中的miRNA和mRNA表达。我们鉴定了转移性和低转移性细胞之间差异表达的miRNAs和基因。让我们加载数据。

变量DE.miRNA.up包含9个上调的miRNAs和变量DE.entrez.dn在两个转移细胞系中有47个下调基因。假设这些mirna与表达方向相反的基因之间的相互作用可能在癌症转移中发挥作用。所以我们用multiMiR来检查这9种mirna中是否有任何一种可以靶向47种基因中的任何一种。

##搜索错误记录…
##警告:' as_data_frame() '在tibble 2.0.0中已弃用。##ℹ请使用“as_tibble()”代替。##ℹ签名和语义已经改变,请参阅' ?as_tibble '。##ℹ已弃用的功能可能用于multiMiR包。##请在报告问题。
##搜索mirtarbase…##搜索tarbase…##搜索diana_microt…##搜索elmmo…##搜索微观世界…##搜索米兰达…##搜索mirdb…##搜索pictar…##搜索皮塔饼…##搜索目标可以… ## Searching mir2disease ... ## Searching pharmaco_mir ... ## Searching phenomir ...
##警告矩阵(info[, !is.na(p.m.)], ncol = sum(!is.na(p.m.))):数据长度[917]不是行数[153]的子##倍数或倍数
##在cbind(info, expected . info .)总和= p.sum): number of rows of result is not a multiple of vector ## length (arg 2)
##联接,by = c("database", "mature_mirna_acc", "mature_mirna_id", "target_symbol", ## "target_entrez", "target_ensembl", "type") ##联接,by = c("database", "mature_mirna_acc", "mature_mirna_id", "target_symbol", ## "target_entrez", "target_ensembl", "type")
## ##疾病。药物预测验证## 442 160 98
## #小猫咪:98 × 13 database mature_m…¹matur…³target…^ target…exer…##             ## 1 mirtarbase MIMAT0000…hsa-mi…FDX1 2230 ENSG00…qRT-PCR Functi…"18668…vali…  ## 2 mirtarbase MIMAT0000…hsa-mi…CUL5 8065 ENSG00…Lucife…Functi…"24391…vali…  ## 4 mirtarbase MIMAT0000…hsa-mi…LIMCH1 22998 ENSG00…pSILAC…功能…"18668…vali…  ## 5 mirtarbase MIMAT0000…hsa-mi…SWAP70 23075 ENSG00…PAR-CL…功能…"20371…vali…  ## 6 mirtarbase MIMAT0000…hsa-mi…PEG10 23089 ENSG00…PAR-CL…功能…"20371…vali…  ## 8 mirtarbase MIMAT0000…hsa-mi…PEG10 23089 ENSG00…PAR-CL…功能…"20371…vali…  ## 9 tarbase MIMAT0000…hsa-mi…LIMA1 51474 ENSG00…“vali…  ## 10 tarbase MIMAT0000…hsa-mi…LIMA1 51474 ENSG00…Degrad…negati…”“vali…  ## #…有多88行,多1个变量:paper_pubmedID ,以及缩写变量名## #¹mature_mirna_acc,²mature_mirna_id,³target_symbol, ^ target_entrez, target_ensembl, ## #实验,⁷pubmed_type, pubmed_id,疾病药物。

结果,有85个独特的mirna -基因对已被验证。

# # #一个宠物猫:3×13 # #数据库mature_m¹成熟……²圆盾…³圆盾…⁴圆盾…⁵其实…⁶中…⁷pubme⁸类型得分disea……⁹# # <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> < >从而向# # 1 mir2disease MIMAT0000 hsa-mi……NA NA NA < NA > < NA > < NA > dise…< NA > bladde…# # 2 phenomir MIMAT0000 hsa-mi……NA NA NA < NA > < NA > < NA > dise…< NA > bladde…# # 3 phenomir MIMAT0000 hsa-mi……NA NA NA < NA > < NA > < NA > dise…< NA > bladde ... ## # ... 一个变量:paper_pubmedID ,和缩写变量名¹mature_mirna_acc, ## #²mature_mirna_id,³target_symbol, target_entrez, target_ensembl,实验,⁷support_type, ## #⁸pubmed_id, disease . drug

mir2疾病和PhenomiR中miRNAs与膀胱癌相关。

预测的数据库预测了9个mirna和47个基因中的28个之间的65个mirna基因对。

## [1]
## [1] 26
58
# # microrna。ID的目标。5 hsa-miR-30a-5p 22998 ## 7 hsa-miR-30b-5p 22998 ## 9 hsa-miR-30d-5p 22998 ## 11 hsa-miR-182-5p 5962

每个预测数据库的结果已经按照分数从好到坏进行了排序。

7.6使用AnnotationDbi访问器方法

AnnotationDbi访问器方法可用于选择和筛选返回的数据get_multimir ()

##[1]“database”“mature_mirna_acc”“mature_mirna_id”“score”“target_ensembl”##[6]“target_entrez”“target_symbol”“type”
# #[1]“hsa - mir - 4795 - 3 - p”“hsa - mir - 126 - 5 - p”“hsa - mir - 545 - 3 - p”“hsa - mir - 3944 - 5 - p”“hsa - mir - 5688”# #[6]“hsa - mir - 137 - 3 - p”
##[1]“database”“mature_mirna_acc”“mature_mirna_id”“score”“target_ensembl”##[6]“target_entrez”“target_symbol”“type”
## 1 diana_microt hsa-miR-4795-3p 1903 ## 2 diana_microt hsa-miR-126-5p 1903 ## 3 diana_microt hsa-miR-545-3p 253782 ## 4 diana_microt hsa-miR-3944-5p 55959 ## 63 diana_microt hsa-miR-4795-3p 253782 ## 423 elmmo hsa-miR-545-3p 253782
##[1]“database”“mature_mirna_acc”“mature_mirna_id”“score”“target_ensembl”##[6]“target_entrez”“target_symbol”“type”
# #[1]“mmu - mir - 218 - 5 - p”“mmu - mir - 493 - 5 - p”“mmu - mir - 139 - 5 - p”“mmu - mir - 3074 - 2 - 3 - p " # #[5]“mmu - mir - 132 - 3 - p”“mmu - mir - 5101”
##[1]“database”“mature_mirna_acc”“mature_mirna_id”“score”“target_ensembl”##[6]“target_entrez”“target_symbol”“type”
## 2 diana_microt mmu-miR-493-5p 14688 0.964 ## 3 diana_microt mmu-miR-139-5p 14688 0.96 ## 4 elmmo mmu-miR-218-5p 14688 0.849 ## 107 elmmo mmu-miR-218-5p 14688 0.849
##[1]“database”“mature_mirna_acc”“mature_mirna_id”“score”“target_ensembl”##[6]“target_entrez”“target_symbol”“type”
##[1]“database”“mature_mirna_acc”“mature_mirna_id”“score”“target_ensembl”##[6]“target_entrez”“target_symbol”“type”
##[1]“1903”“253782”“55959”“208”“286223”
##数据库target_entrez分数## 1 diana_microt 1903 1 ## 2 diana_microt 1903 0.998 ## 5 diana_microt 1903 0.994 ## 19 diana_microt 1903 0.98 ## 32 diana_microt 1903 0.964 ## 56 diana_microt 1903 0.934

8直接在multiMiR web服务器上查询数据库

如前所述,get_multimir主要功能是检索信息multiMiR数据库,它托管在http://multimir.org.该函数为用户要搜索的每个外部数据库构建一个SQL查询,将查询提交到web服务器,并解析、组合和总结来自web服务器的结果。对于高级用户,有几种方法可以查询multiMiR数据库,而不使用multiMiR包;但他们必须熟悉SQL查询。一般情况下,仍建议用户使用get_multimir ()中查询多个外部数据库时的multiMiR

8.1在web服务器上直接查询

multiMiR包与multiMiR通过脚本创建数据库http://multimir.org/cgi-bin/multimir_univ.pl在web服务器上。同样,来自每个外部数据库的数据存储在中的表中multiMiR.也有关于mirna的表格(tablemicrorna的)和靶基因(表目标)。

注意:虽然可以在浏览器中完成简短的查询,但通过在浏览器地址栏中输入来提交查询的限制很快就会达到(总共8192个字符)。如果你是一个开发人员,你应该使用你喜欢的方法来提交一个HTTP POST,这将允许更长的查询。要包括的字段是查询而且dbName查询是要提交的SQL查询。dbNameDBNAME列是否来自一个调用multimir_dbInfoVersions (),但如果排除此选项,则当前版本为默认版本。

了解表的结构(如表中的DIANA-microT数据)diana_microt),用户可使用URL

http://multimir.org/cgi-bin/multimir_univ.pl?query=describe diana_microt

与例1类似,下面的URL在miRecords中搜索hsa-miR-18a-3p的验证靶基因。

http://multimir.org/cgi-bin/multimir.pl?query=SELECT m.mature_mirna_acc, m.mature_mirna_id, t.target_symbol, t.target_entrez, t.target_ensembl, i.experiment, i.support_type, i.pubmed_id FROM mirna AS m INNER JOIN mirecords AS i INNER JOIN target AS t ON (m.mature_mirna_uid=i。m.mature_mirna_id= ' hsa-miR-18a-3p '

可以看到,该查询很长,并且只搜索其中三个验证过的表中的一个multiMiR.而在例1中,一行R命令使用get_multimir ()函数搜索、组合和汇总所有三个经过验证的外部数据库(miRecords、miRTarBase和TarBase)的结果。

8.2R中的直接查询

我们上面在web服务器上做的直接查询也可以在R中完成。如果您不熟悉HTTP POST,这是首选方法。如果您希望更改版本,请确保在调用之前设置正确的数据库版本search_multimir ()它使用当前设置的版本。

以显示表的结构diana_microt

##字段类型空键默认额外## 1 mature_mirna_uid int(10) unsigned NO MUL ## 2 target_uid int(10) unsigned NO MUL ## 3 miTG_score double NO MUL ## 4 UTR3_hit int(10) unsigned NO ## 5 CDS_hit int(10) unsigned NO

在miRecords中寻找hsa-miR-18a-3p的有效靶基因:

MIMAT0002891 hsa-miR-18a-3p KRAS 3845 ENSG00000133703实验support_type pubmed_id ## 1 Western blot//荧光素酶活性测定19372139

9会话信息

## R版本4.2.1(2022-06-23)##平台:x86_64-pc-linux-gnu(64位)##运行在Ubuntu 20.04.5 LTS ## ##矩阵产品:默认## BLAS: /home/biocbuild/bbs-3.16-bioc/R/lib/libRblas。/home/biocbuild/bbs-3.16-bioc/R/lib/libRlapack。所以## ## locale: ## [1] LC_CTYPE=en_US。UTF-8 LC_NUMERIC=C LC_TIME=en_GB ## [4] LC_COLLATE=C LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。UTF-8 ## [7] LC_PAPER=en_US。UTF-8 LC_NAME=C LC_ADDRESS= c# # [10] lc_phone =C LC_MEASUREMENT=en_US。UTF-8 LC_IDENTIFICATION=C ## ##附加的基本包:## [1]stats graphics grDevices utils datasets methods基础## ##其他附加包:## [1]edgeR_3.40.0 limma_3.54.0 multiMiR_1.20.0 knitr_1.40 BiocStyle_2.26.0 ## ##通过命名空间加载(且未附加):[1] KEGGREST_1.38.0 locfit_1.5-9.6 tidyselect_1.2.0 xfun_0.34 ## [5] bslib_0.4.0 purrr_0.3.5 splines_4.2.1 lattice_0.20-45 ## [9] vctrs_0.5.0 generics_0.1.3 htmltools_0.5.3 stats4_4.2.1 ## [13] yaml_2.3.6 utf8_1.2.2 blob_1.2.3 XML_3.99-0.12 ## [17] rlang_1.0.6 jquerylib_0.1.4 pillar_1.8.1 glue_1.6.2 ## [21] DBI_1.1.3 BiocGenerics_0.44.0 bit64_4.0.5 GenomeInfoDbData_1.2.9 ## [25] lifecycle_1.0.3 string_1 .4.1 Biostrings_2.66.0 ## [29] memoise_2.0.1 evaluate_0.17 Biobase_2.58.0iranges_ .32.0 ## [33] fastmap_1. 2.0 AnnotationDbi_1.60.0 fansi_1.0.3 ## [37] Rcpp_1.0.9 BiocManager_1.30.19 cachem_1.0.6 S4Vectors_0.36.0 ## [41] jsonlite_1.8.3 XVector_0.38.0 bit_4.0.4 png_0.1-7 ## [49] grid_4.2.1 cli_3.4.1 tools_4.2.1 bitops_1.0-7 ## [53] magrittr_2.0.3 sass_0.4.2 tibble_3.1.8 RCurl_1.98-1.9 ## [57] RSQLite_2.2.18 pkgconfig_2.0.3 crayon_1.5.2 assertthat_0.2.1 ## ## [37] Rcpp_1.0.9 BiocManager_1.30.19 cachem_1.0.6 s4vector_0.36.0 bb4 jsonlite_1.8.3 XVector_0.38.0 bit_4.0.4 png_0.1-7 ## [49] grid_4.2.1 cli_3.4.1 bookdown_0.29 dplyr_1.0.10 ## [49] grid_4.2.1 cli_3.4.1 tools_4.2.1 bitops_1.0-7 ## [57] RSQLite_2.2.18 pkgconfig_2.0.3 crayon_1.5.2 assertthat_0.2.1 ## # [61] rmarkdown_2.17 httr_1.4.4R6_2.5.1 compiler_4.2.1