1介绍

小分子核糖核酸(microrna)规范表达式通过促进退化或压抑的翻译目标记录。microrna的目标站点已经编目数据库基于实验验证和计算预测使用各种算法。一些在线资源提供的集合多个数据库,但需要导入到其他软件,如R,处理、制表、绘图和计算。目前R中的microrna的目标站点包的数量是有限的数据库类型的数据库和灵活性。

R包multiMiR与web服务器http://multimir.org,是一个全面的预测和验证miRNA-target相互作用及其对疾病和药物。multiMiR包括几个新颖的功能可能无法在现有R包:

编译的14种不同的数据库,比其他任何集合
扩大数据库基于疾病注释和药物反应,除了许多实验和计算数据库
为预测绑定定义的达标力量提供最自信的选择。

的multiMiR包允许检索miRNA-target来自14个R中的外部数据库的交互,而不需要访问这些数据库。高级用户还可以向web服务器提交SQL查询来检索结果。看到在PubMed出版数据库及其创造额外的细节。现在版本化数据库可以使用以前版本的数据库从当前R包,但是包默认为最新版本。

警告有问题合并目标从老没有维护的数据库id。数据库已更新最近(1 - 2年)使用当前版本的注释id。在每个更新这些旧目标ID进行由于缺乏一个可靠的方法来消除歧义的原始ID与当前ID。请牢记这一点,结果从老数据库,没有更新。我们继续观察的方法来解决这些歧义和提高目标数据库之间的协议。您可以使用唯一的()R函数来识别,然后删除多个目标基因。

2了解multiMiR数据库

的multiMiRweb服务器http://multimir.org从外部数据库主机数据库包含miRNA-target交互。这个包multiMiR提供了功能与通信multiMiRweb服务器和数据库。的multiMiR现在数据库版本。默认情况下multiMiR每一次将使用最新的版本multiMiR加载。不过现在可以切换数据库版本和得到的信息multiMiR数据库版本。multimir_dbInfoVersions ()返回一个dataframe可用的版本。

图书馆(multiMiR)

# #欢迎multiMiR。# # # # multiMiR数据库URL设置为# #默认值:http://multimir.org/ # # # #数据库版本:tripwire更新:2020-04-15

db.ver=multimir_dbInfoVersions()db.ver

公共# # # #版本更新RDA DBNAME模式1 tripwire 2020-04-15 multimir_cutoffs_2.3。rda multimir2_3 multiMiR_DB_schema。sql 1 # # 2 2.2.0 2017-08-08 multimir_cutoffs_2.2。rda multimir2_2 multiMiR_DB_schema。sql 1 # # 3 2.1.0 2016-12-22 multimir_cutoffs_2.1。rda multimir2_1 multiMiR_DB_schema。sql 1 # # 4 2.0.0 2015-05-01 multimir_cutoffs。rda multimir multiMiR_DB_schema。sql表1 # # # # 1 multiMiR_dbTables。txt multiMiR_dbTables # # 2。txt multiMiR_dbTables # # 3。txt multiMiR_dbTables.txt # # 4

我们可以使用切换版本multimir_switchDBVersion ()。

vers_table < -multimir_dbInfoVersions()vers_table

公共# # # #版本更新RDA DBNAME模式1 tripwire 2020-04-15 multimir_cutoffs_2.3。rda multimir2_3 multiMiR_DB_schema。sql 1 # # 2 2.2.0 2017-08-08 multimir_cutoffs_2.2。rda multimir2_2 multiMiR_DB_schema。sql 1 # # 3 2.1.0 2016-12-22 multimir_cutoffs_2.1。rda multimir2_1 multiMiR_DB_schema。sql 1 # # 4 2.0.0 2015-05-01 multimir_cutoffs。rda multimir multiMiR_DB_schema。sql表1 # # # # 1 multiMiR_dbTables。txt multiMiR_dbTables # # 2。txt multiMiR_dbTables # # 3。txt multiMiR_dbTables.txt # # 4

multimir_switchDBVersion(db_version =“2.0.0”)

# #现在使用数据库版本:2.0.0

curr_vers < -vers_table [1,“版本”]当前版本号multimir_switchDBVersion(db_version =curr_vers)

# #现在使用数据库版本:tripwire

剩下的功能将查询选中的版本,直到包重新加载或直到我们切换到另一个版本。

信息从每个外部数据库存储在一个表中multiMiR数据库。看表的列表,我们可以使用multimir_dbTables ()函数。

db.tables=multimir_dbTables()db.tables

# # [1]“diana_microt”“elmmo”“map_counts”“map_metadata”“缩影”“mir2disease”# #[7]“米兰达”“mirdb”“mirecords”“microrna的”“mirtarbase”“pharmaco_mir”# # [13]“phenomir”“pictar”“皮塔饼”“tarbase”“目标”“targetscan”

显示数据库模式,我们可以使用multimir_dbSchema ()函数。下面是只有部分的完整的输出。

# #- - -# #——表结构表的microrna的# #- - -# ## #下降表如果存在“microrna的”;# #创建表“microrna的”(# # mature_mirna_uid整数无符号AUTO_INCREMENT,——成熟的microrna的惟一ID# #组织VARCHAR(4)不零,——生物缩写# # mature_mirna_accVARCHAR(20.)默认的零,——成熟的microrna的加入# # mature_mirna_idVARCHAR(20.)默认的零,——成熟的microrna的ID /名称# #主关键(mature_mirna_uid),# #关键org(组织),# #关键mature_mirna_acc (mature_mirna_acc),# #关键mature_mirna_id (mature_mirna_id)# #);# ## #- - -# #“目标”——表结构表# #- - -# ## #下降表如果存在“目标”;# #创建表“目标”(# # target_uid整数无符号AUTO_INCREMENT,——目标基因的惟一ID# #组织VARCHAR(4)不零,——生物缩写# # target_symbolVARCHAR(80年)默认的零,——目标基因符号# # target_entrezVARCHAR(10)默认的零,——目标基因Entrez ID# # target_ensemblVARCHAR(20.)默认的零,——目标基因运用ID# #主关键(target_uid),# #关键org(组织),# #关键target_symbol (target_symbol),# #关键target_entrez (target_entrez),# #关键target_ensembl (target_ensembl)# #);# ## #- - -# #——表结构表“mirecords”# #- - -# ## #下降表如果存在“mirecords”;# #创建表“mirecords”(# # mature_mirna_uid整数无符号不零,——成熟的microrna的惟一ID# # target_uid整数无符号不零,——目标基因的惟一ID# # target_site_numberINT(10)默认的零,——目标站点数量# # target_site_positionINT(10)默认的零,——目标站点的位置# #实验VARCHAR(160年)默认的零,——支持实验# # support_typeVARCHAR(40)默认的零,——支持实验的类型# # pubmed_idVARCHAR(10)默认的零,——PubMed ID# #外国关键(mature_mirna_uid)# #引用microrna (mature_mirna_uid)# #在更新级联在删除限制,# #外国关键(target_uid)# #引用目标(target_uid)# #在更新级联在删除限制# #);# ## #……# ## #(请注意只有三个的的19表显示在这里为示范# #目的。)

这个函数multimir_dbInfo ()将显示的信息外部microrna和miRNA-target数据库multiMiR,包括版本、发布日期、链接下载数据,和相应的表中multiMiR。

db.info =multimir_dbInfo()db.info

# # 1 # # map_name source_name source_version source_date diana_microt DIANA-microT 5 9月,2013 # # 2 elmmo EIMMo 5 1月,2011 # # 3缩影缩影5 9月,2009 # # 4 mir2disease mir2disease 3月14日,8月2011 # # 5米兰达米兰达,2010 # # 6 mirdb mirdb 6月6日,2019 # # 7 mirecords mirecords 4 4月27日,2013 # # 8 mirtarbase mirtarbase 7.0 9月,2017 # # 9 pharmaco_mir Pharmaco-miR(验证集)# # 10 phenomir phenomir 2 2月15日,2011 # # 11 pictar pictar 2 12月21日,2012 # # 12皮塔饼皮塔饼6 8月31日2008 # # 13 tarbase tarbase 8 2018 # # 14 targetscan targetscan 7.2, 3月2018 # # 1 # # source_url http://diana.imis.athena-innovation.gr/DianaTools/index.php?r = microT_CDS /指数# # 2 http://www.mir2disease.org http://www.mirz.unibas.ch/miRNAtargetPredictionBulk.php http://www.ebi.ac.uk/enright-srv/microcosm/cgi-bin/targets/v5/download.pl # # # 3 # 4 # # 5 http://www.microrna.org/microrna/getDownloads.do http://mirecords.biolead.org/download.php http://mirdb.org # # # 6 # 7 # # 8 http://mirtarbase.mbc.nctu.edu.tw/php/download.php # # 9 http://www.pharmaco-mir.org/home/download_VERSE_db http://dorina.mdc-berlin.de http://mips.helmholtz-muenchen.de/phenomir/ # # # 10 # 11 # # 12 http://genie.weizmann.ac.il/pubs/mir07/mir07_data。html # # 13 http://carolina.imis.athena-innovation.gr/diana_tools/web/index.php?r = tarbasev8 % 2 findex # # 14 http://www.targetscan.org/cgi-bin/targetscan/data_download.cgi?db=vert_61

14外部数据库中,八个包含预测miRNA-target交互(DIANA-microT-CDS、ElMMo缩影,米兰达,miRDB PicTar,皮塔饼,和TargetScan),三个已经通过实验验证miRNA-target交互(miRecords、miRTarBase TarBase),其余三个包含miRNA-drug /疾病协会(miR2Disease、Pharmaco-miR和PhenomiR)。检查这些类别和数据库在R,我们有一组四个辅助函数:

predicted_tables()

# # [1]“diana_microt”“elmmo”“缩影”“米兰达”“mirdb”“pictar”# #[7]“皮塔饼”“targetscan”

validated_tables()

# # [1]“mirecords”“mirtarbase”“tarbase”

diseasedrug_tables()

# # [1]“mir2disease”“pharmaco_mir”“phenomir”

reverse_table_lookup(“targetscan”)

# #[1]“预测”

看到有多少记录这些14外部数据库我们参考multimir_dbCount函数。

db.count=multimir_dbCount()db.count

# # 1 # # map_name human_count mouse_count rat_count total_count diana_microt 7664602 3747171 0 3747171 # # 2 elmmo 3747171 7664602 547191 5955436 762987 534735 353378 1651100 # # # # 3缩影4 mir2disease米兰达2875 0 0 2875 # # 5 5429955 2379881 247368 2379881 # # 6 mirdb 2379881 5429955 199250 3280938 7 mirecords 2425 449 171 3045 # # # # 8 mirtarbase 544588 50673 652 308 595913 # # 9 pharmaco_mir 5 0 313 # # 10 phenomir 15138 491 0 15629 # # 11 pictar 404066 302236 706302 0 # # 12皮塔饼7710936 13 tarbase 433048 209831 1307 5163153 0 5163153 # # 644186 # # 14 targetscan 13906497 10442093 0 10442093

应用(db.count [,- - - - - -1),2,金额)

# # human_count mouse_count rat_count total_count # # 42826962 25371114 42826962 69547393

当前版本的multiMiR包含近5000万条记录。

3更改`包:multiMiR`- - - - - - S3和S4类

通过添加multiMiR Bioconductor,返回对象已经从一个S3 (mmquery)到一个S4类(mmquery_bioc)。新的S4对象之前的版本也有类似的结构,除了所有返回的数据集(验证、预测、disease.drug)现在合并成一个单一的数据集。只有一种类型,过滤类型变量使用AnnotationDbi方法或基础R方法稍后讨论子集(myqry@data myqry@data $ type = =“验证”))。向后兼容性,get_multimir ()将返回旧的S3对象如果论点吗的遗产。出= TRUE。

现在可以使用S4访问器操作符访问特性@。此外,AnnotationDbi访问器方法列,键,keytypes,选择所有的工作mmquery_bioc对象。参见7.6。

4列表microrna基因、药物和疾病multiMiR数据库中

除了功能显示数据库和表信息multiMiR包还提供了list_multimir ()目标函数列出所有独特的microrna基因,药物,和疾病multiMiR数据库。一个选择限制返回的数量记录已添加到帮助测试和探索。

microrna =list_multimir(“microrna的”,限制=10)基因=list_multimir(“基因”,限制=10)药物=list_multimir(“药物”,限制=10)疾病=list_multimir(“疾病”,限制=10)#执行2单独查询,给20个结果头(microrna)

7829 # # 1 # # mature_mirna_uid org mature_mirna_acc mature_mirna_id ath MIMAT0000184 ath-miR163 # # 2 7833 ath MIMAT0000201 ath-miR170-3p # # 3 7831 ath MIMAT0000206 ath-miR173-5p # # 4 7828 ath MIMAT0001001 ath-miR400 # # 5 7837 ath MIMAT0001004 ath-miR403-3p # # 6 7830 ath MIMAT0001011 ath-miR408-3p

头(基因)

# # target_uid org target_symbol target_entrez target_ensembl # # 112855 ath AT1G06180 112854 ath AT1G02860 # # 2 # # 112857 ath AT1G15125 112856 ath AT1G06580 # # 4 # 5 # 112868 ath At1g31280 # 6 # 112869 ath At1g50055

头(药物)

药物# # # # 1 3,3 ' -diindolylmethane # # 2 5-fluoroucil # # 3 abt - 737 # # 4 alitretinoin # # 5 arabinocytosine # # 6三氧化二砷

头(疾病)

# # 1 # #疾病ACTH-INDEPENDENT超肾上腺增生;AIMAH # # 2急性淋巴细胞白血病(ALL) # # 3急性MYELOGENEOUS白血病(AML) # # 4急性髓系白血病(AML) # # 5急性早幼粒细胞白血病(APL) # # 6腺瘤

当前版本的multiMiR97186年有5830个microrna和目标基因从人类,老鼠,老鼠,以及64种药品和223年疾病。取决于您的网络连接的速度,这可能需要几分钟来检索大量的目标基因。

5使用`get_multimir ()`查询multiMiR数据库

get_multimir ()包装的主要功能是获取预测和验证miRNA-target交互和他们的疾病和药物协会的吗multiMiR数据库。

熟悉的参数get_multimir (),你可以输入get_multimir ?或帮助(get_multimir)在r .在下一节中,许多例子说明参数的使用。

6的例子multiMiR Bioconductor工作流

这个例子显示了使用multiMiR与刨边机Bioconductor包。这里我们将微数据从空间站和ILS鼠标菌株和微分表达式进行分析。然后使用顶部不同微rna表达的multiMiR数据库搜索目标基因进行验证。

图书馆(磨边机)

# #加载所需的包:limma

图书馆(multiMiR)#加载数据counts_file < -执行(“extdata”,“counts_table.Rds”,包=“multiMiR”)strains_file < -执行(“extdata”,“strains_factor.Rds”,包=“multiMiR”)counts_table < -readRDS(counts_file)strains_factor < -readRDS(strains_file)#标准磨边机微分表达式分析设计< -model.matrix(~strains_factor)#使用趋于分散dge < -DGEList(数=counts_table)dge < -calcNormFactors(dge)dge美元样品美元菌株< -strains_factordge < -estimateGLMCommonDisp(dge设计)dge < -estimateGLMTrendedDisp(dge设计)dge < -estimateGLMTagwiseDisp(dge设计)#适合GLM模型应变效应符合< -glmFit(dge设计)轻轨交通< -glmLRT(适合)#未经调整的假定值表(PValue)和罗斯福的价值观p_val_DE_edgeR < -topTags(轻轨车调整。方法=“黑洞”,n =正)#让microrna的表达不同top_miRNAs < -rownames(p_val_DE_edgeR美元表)(1:10]# microrna的插入multiMiR和验证的目标multimir_results < -get_multimir(org =mmu的,microrna的=top_miRNAs,表=“验证”,摘要=真正的)

# #搜索mirecords……# #搜索mirtarbase……# #搜索tarbase……

头(multimir_results@数据)

# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 mirecords MIMAT0000233 mmu - mir - 200 - b - 24136 - p Zeb2 ENSMUSG00000026872 # # 2 mirecords MIMAT0000153 mmu - mir - 141 - 3 - p Dlx5 13395 ENSMUSG00000029755 # # 3 mirecords MIMAT0000519 mmu - mir - 200 - 13395 - 3 - p Dlx5 ENSMUSG00000029755 # # 4 mirecords MIMAT0000541 mmu - mir - 96 - 5 - 11830 p Aqp5 ENSMUSG00000044217 # # 5 mirecords MIMAT0000541 mmu - mir - 96 - 5 - 53883 p Celsr2 ENSMUSG00000068740 # # 6 mirecords MIMAT0000541 mmu - mir - 96 - 5 - 245049 p Myrip ENSMUSG00000041794 # #实验support_type pubmed_id类型# # 1 # # 2免疫印迹免疫印迹17585049验证/ /荧光素酶活性测定19454767验证# # 3免疫印迹/ /荧光素酶活性测定19454767验证4 # # 19454767 # # # # 5 19363478验证验证6 19363478验证

7multiMiR查询的例子

在本节中各种各样的例子描述了如何查询multiMiR数据库。

7.1示例1:检索所有给定microrna的目标基因进行验证

在第一个示例中,我们问什么基因验证hsa-miR-18a-3p的目标。

#默认搜索验证在人类的交互例二< -get_multimir(microrna的=“hsa-miR-18a-3p”,摘要=真正的)

# #搜索mirecords……# #搜索mirtarbase……# #搜索tarbase……

的名字(例二)

# #空

#检查返回哪些类型的协会表(例二@数据美元类型)

# # # # # # 803进行验证

#验证miRNA-target交互的详细信息头(例二@数据)

# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 mirecords MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 # # 2 mirtarbase MIMAT0002891 hsa-miR-18a-3p ac 47 ENSG00000131473 # # 3 mirtarbase MIMAT0002891 hsa-miR-18a-3p AP1B1 162 ENSG00000100280 # # 4 mirtarbase MIMAT0002891 hsa-miR-18a-3p ALDOA 226 ENSG00000149925 # # 5 mirtarbase MIMAT0002891 hsa-miR-18a-3p ARF5 381 ENSG00000004059 # # 6 mirtarbase MIMAT0002891 hsa-miR-18a-3p ATM 472 ENSG00000149311 support_type # # 1 # #实验免疫印迹/ /荧光素酶活性测定# # 2冲突功能MTI(弱)# # 3冲突功能MTI(弱)# # 4 PAR-CLIP功能MTI(弱)# # 5冲突功能MTI(弱)# # 6免疫荧光试验/ / / /荧光素酶记者存在/ /免疫印迹功能MTI # # pubmed_id类型# # 1 # # 19372139验证2 23622248验证3 # # 23622248 # # # # 4 27292025验证验证5 23622248验证# # 6 23622248验证

#那一个交互作用是由荧光素酶检测吗?例二@数据(grep(“荧光素酶”例二,@数据(“实验”)))

# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 mirecords MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 # # 6 mirtarbase MIMAT0002891 hsa-miR-18a-3p ATM 472 ENSG00000149311 # # 58 mirtarbase MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 # # 254 mirtarbase MIMAT0002891 hsa-miR-18a-3p CBX7 23492 ENSG00000100307 # #实验support_type pubmed_id # # 1免疫印迹/ /荧光素酶活性测定19372139 # # 6免疫荧光试验/ / / /荧光素酶记者存在/ /免疫印迹功能MTI 25963391 # # 58荧光素酶记者分析/ /存在/ /免疫印迹功能MTI 254 # # 19372139测定荧光素酶记者/ /免疫印迹功能MTI 28123848 # # # # 1 # #验证6型验证58 # # # # 254验证进行验证

例二@总结(例二@(总结,“target_symbol”]= =“喀斯特”,)

# # mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl mirecords # # 17 MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 1 # # mirtarbase tarbase验证。和所有。总和# #171022

事实证明,喀斯特是唯一的目标通过荧光素酶试验进行验证。交互是记录在miRecords miRTarBase和支持同样的文学作品,其PubMed ID列pubmed_id。摘要(通过设置摘要= TRUE当调用get_multimir ())显示记录的数量在每一个外部数据库和数据库支持交互的总数。

7.2示例2:检索miRNA-target交互与给定的药物或疾病有关

在本例中,我们想知道microrna和目标基因与顺铂相关联,在几个癌症化疗药物使用。

example2 < -get_multimir(疾病。药物=顺铂的,表=“disease.drug”)

# #搜索mir2disease……# #搜索pharmaco_mir……# #搜索phenomir……

的名字(example2)

# #空

nrow(example2@数据)

45 # # [1]

表(example2@数据美元类型)

# # # #的疾病。药物# # 45

头(example2@数据)

# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 pharmaco_mir MIMAT0000772 hsa - mir - 345 - 5 - 4363 p ABCC1 ENSG00000103222 # # 2 pharmaco_mir MIMAT0000720 hsa - mir - 376 - c - 3 - p ALK7 # # 3 pharmaco_mir MIMAT0000423 hsa - mir - 125 - b - 578 - p BAK1 ENSG00000030110 # # 4 pharmaco_mir hsa-miR-34 BCL2 596 ENSG00000171791 # # 5 pharmaco_mir MIMAT0000318 hsa - mir - 200 - b - 596 - p BCL2 ENSG00000171791 # # 6 pharmaco_mir MIMAT0000617 hsa - mir - 200 - c - 596 - p BCL2 ENSG00000171791 # # disease_drug paper_pubmedID类型# # 1顺铂20099276疾病。药物# # 2顺铂21224400疾病。药物# # 3顺铂21823019疾病。药物# # 4顺铂18803879疾病。药物# # 5顺铂21993663疾病。药物# # 6顺铂21993663 disease.drug

get_multimir ()返回53 miRNA-target双。更多的信息,我们可以参考发表论文在PubMed id列paper_pubmedID。

7.3示例3:选择目标基因microrna预测

get_multimir ()也需要目标基因(s)作为输入。在这个例子中,我们检索microrna预测目标Gnb1在鼠标。对于预测交互,默认查询前20%的预测在每个外部数据库,相当于设置参数预测。截止=20.和predicted.cutoff。类型=“p”(截止百分比)。这里我们搜索前35%在所有守恒和nonconserved目标网站。

青年们< -get_multimir(org =“mmu”,目标=“Gnb1”,表=“预测”,摘要=真正的,预测。截止=35,predicted.cutoff。类型=“p”,预测。网站=“所有”)

# #搜索diana_microt……# #搜索elmmo……# #搜索缩影……# #搜索米兰达……# #搜索mirdb……# #搜索pictar……# #搜索皮塔饼……# #搜索targetscan……

的名字(青年们)

# #空

表(青年们@数据美元类型)

# # # # # #预测716年

头(青年们@数据)

# #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl # # 1 diana_microt MIMAT0000663 mmu - mir - 218 - 5 - 14688 p Gnb1 ENSMUSG00000029064 # # 2 diana_microt MIMAT0017276 mmu - mir - 493 - 5 - 14688 p Gnb1 ENSMUSG00000029064 # # 3 diana_microt MIMAT0000656 mmu - mir - 139 - 5 - 14688 p Gnb1 ENSMUSG00000029064 # # 4 diana_microt MIMAT0014946 mmu - mir - 3074 - 2 - 14688 - p Gnb1 ENSMUSG00000029064 # # 5 diana_microt MIMAT0000144 mmu - mir - 132 - 3 - p Gnb1 14688 ENSMUSG00000029064 # # 6 diana_microt MIMAT0020608 mmu - mir - 5101 Gnb1 14688 ENSMUSG00000029064 # # # # 1 # # 0.975预测2型得分0.964预测预测# 0.96 # # 3 # 4 # # 0.921预测5 0.92预测# # 6 0.918预测

头(青年们@总结)

# # mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl diana_microt # # 1 MIMAT0000133 mmu - mir - 101 - 14688 - 3 - p Gnb1 ENSMUSG00000029064 1 # # 2 MIMAT0000616 mmu - mir - 101 - b - 14688 - p Gnb1 ENSMUSG00000029064 1 # # 3 MIMAT0000663 mmu - mir - 218 - 5 - 14688 p Gnb1 ENSMUSG00000029064 1 # # 4 MIMAT0003476 mmu - mir - 669 - b - 14688 - p Gnb1 ENSMUSG00000029064 1 # # 5 MIMAT0017276 mmu - mir - 493 - 5 - 14688 p Gnb1 ENSMUSG00000029064 1 # # 6 MIMAT0000144 mmu - mir - 132 - 3 - p Gnb1 14688 ENSMUSG00000029064 1 # # elmmo缩影米兰达mirdb pictar pita targetscan预测。和所有。总和# #12110200 5 5 ## 2 2 1 1 0 2 0 0 5 5 ## 3 4 0 0 1 0 2 1 5 5 ## 4 0 0 1 2 0 1 2 5 5 ## 5 4 0 0 2 2 0 1 5 5 ## 6 2 0 0 2 0 0 2 4 4

的记录example3@predicted分数从最好到最差下令在每个外部数据库。summary选项允许我们再次检查目标站点的数量预测的每个外部数据库和数据库的总数预测的相互作用。

最后,我们检查每个数据库都有多少的预测。

应用(青年们@(总结,6:13),2,函数(x)总和(x>0))

# # diana_microt elmmo缩影米兰达mirdb pictar pita 43 # # 105 51 5 37 9 132 # # targetscan # # 177

7.4示例4:选择microrna (s)预测目标大部分,如果不是全部,感兴趣的基因的

你可能有一个共同的生物过程的基因列表。有趣的是检查是否一些或所有的这些基因的目标相同的microrna的(s)。这里有四个基因参与了慢性阻塞性肺疾病(COPD)在人类和想知道microrna目标这些基因通过搜索排名前500000的预测在每个外部数据库。

example4 < -get_multimir(org =“保险公司”,目标=c(AKT2的,“CERS6”,“S1PR3”,“SULF2”),表=“预测”,摘要=真正的,predicted.cutoff。类型=“n”,预测。截止=500000年)

# #数量预测截止(predicted.cutoff) 500000大于表pictar记录的总数。将查询所有记录。

# #数量预测截止(predicted.cutoff) 500000大于表targetscan记录的总数。将查询所有记录。

# #搜索diana_microt……# #搜索elmmo……# #搜索缩影……# #搜索米兰达……# #搜索mirdb……# #搜索pictar……# #搜索皮塔饼……# #搜索targetscan……

然后我们计算目标的数量为每个microrna基因。

example4。计数< -addmargins(表(example4@(总结,2:3)))example4。计数< -example4.counts [- - - - - -nrow(example4.counts))example4。计数< -example4.counts [订单(example4.counts [,5),减少=真正的),)头(example4.counts)

# # # # target_symbol mature_mirna_id AKT2 CERS6 S1PR3 SULF2和# # hsa - mir - 129 - 5 - p 0 1 2 1 4 # # hsa - mir - 330 - 3 - p 0 1 2 1 4 # # hsa - mir - 144 - 3 - p 0 1 2 0 3 # # hsa - mir - 3180 - 5 - p 0 1 2 0 3 # # hsa - mir - 325 - 3 - p 1 1 0 1 3 # # hsa-miR-34a-5p 0 1 2 0 3

7.5示例5:检索一组microrna和之间的相互作用的一组基因

在这个例子中,我们描绘microrna和mRNA表达在低转移性膀胱癌细胞株T24和卢克,分别和转移性衍生品FL4 Lul2。我们确定了差异表达microrna基因和基因之间的转移性和转移性细胞。加载数据。

负载(url(“http://multimir.org/bladder.rda”))

变量DE.miRNA.up包含9上调microrna和变量DE.entrez.dn有47个下调基因的两个转移细胞株。的假设是,这些microrna基因的表达变化之间的相互作用在相反的方向可能在癌症转移中发挥作用。所以我们使用multiMiR检查是否有九个microrna的目标的任何47个基因。

#搜索所有表&前10%的预测example5 < -get_multimir(org =“保险公司”,microrna的=DE.miRNA.up,目标=DE.entrez.dn,表=“所有”,摘要=真正的,predicted.cutoff。类型=“p”,预测。截止=10,使用。宠物猫=真正的)

# #搜索mirecords……

# #警告:“as_data_frame()”是宠物猫2.0.0弃用。# #请使用“as_tibble ()”。# #签名和语义已经改变,看到“? as_tibble”。# #显示这个警告每8小时一次。# #称之为“生命周期::last_lifecycle_warnings()”来看看生成此警告。

# #搜索mirtarbase……# #搜索tarbase……# #搜索diana_microt……# #搜索elmmo……# #搜索缩影……# #搜索米兰达……# #搜索mirdb……# #搜索pictar……# #搜索皮塔饼……# #搜索targetscan…… ## Searching mir2disease ... ## Searching pharmaco_mir ... ## Searching phenomir ...

# #警告在矩阵(信息[! is.na(点)],ncol =总和(! is.na(点))):数据长度[917]不是子——# #的多个或多个[153]的行数

# #警告cbind(信息,预测。总和= p.sum): number of rows of result is not a multiple of vector ## length (arg 2)

# #加入,= c(“数据库”、“mature_mirna_acc”、“mature_mirna_id”、“target_symbol”、“target_entrez”、“target_ensembl”、“类型”)加入,# # = c(“数据库”、“mature_mirna_acc”、“mature_mirna_id”、“target_symbol”、“target_entrez”、“target_ensembl”、“类型”)

表(example5@数据美元类型)

# # # #的疾病。药物预测验证# # 442 160 98

结果< -选择(example5keytype =“类型”,键=“验证”,列=列(example5))unique_pairs < -结果(!复制(结果,c(“mature_mirna_id”,“target_entrez”))))结果

# # #一个宠物猫:98×13 # #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl实验# # <空空的> <空空的> <科> <科> <空空的> <空空的> <科> # # 1 mirtarbase MIMAT0000087 hsa-miR-30a-5p FDX1 2230 ENSG000001377…蛋白质组学# # 2 mirtarbase MIMAT0000259 hsa - mir - 182 - 5 - 8065 P CUL5 ENSG000001662…存在# # 3 mirtarbase MIMAT0000418 hsa-miR-23b-3p RRAS2 22800 ENSG000001338…Luciferas…# # 4 mirtarbase MIMAT0000087 hsa-miR-30a-5p LIMCH1 22998 ENSG000000640…pSILAC / / P…# # 5 mirtarbase MIMAT0000418 hsa-miR-23b-3p SWAP70 23075 ENSG000001337…PAR-CLIP # # 6 mirtarbase MIMAT0000087 hsa-miR-30a-5p PEG10 23089 ENSG000002422…PAR-CLIP # # 7 mirtarbase MIMAT0000245 hsa-miR-30d-5p PEG10 23089 ENSG000002422…PAR-CLIP # # 8 mirtarbase MIMAT0000420 hsa-miR-30b-5p PEG10 23089 ENSG000002422…PAR-CLIP # # 9 tarbase MIMAT0000418 hsa-miR-23b-3p LIMA1 51474 ENSG000000504…Degradome…# # 10 tarbase MIMAT0000449 hsa - mir - 146 - 51474 - 5 - P LIMA1 ENSG000000504…Degradome…# # #…88多行,和6更多的变量:support_type <科>,pubmed_id <科>、<科>类型,# # #分数<科>,disease_drug <科>,paper_pubmedID <空空的>

在结果中,有85个独特的miRNA-gene对已验证。

mykeytype < -“disease_drug”mykey < -键(example5keytype =mykeytype)mykey < -mykey [grep(“膀胱”mykey,忽视。情况下=真正的)]结果< -选择(example5keytype =“disease_drug”,键=mykey,列=列(example5))结果

# # #一个宠物猫:3×13 # #数据库mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl实验# # <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <科> # # 1 mir2disease MIMAT0000418 hsa-miR-23b-3p NA NA NA < NA > # # 2 phenomir MIMAT0000418 hsa-miR-23b-3p NA NA NA < NA > # # 3 phenomir MIMAT0000449 hsa - mir - 146 A NA NA NA - 5 - p < NA >与6 # # #…更多的变量:support_type <科>,pubmed_id <科>、<科>类型,分数<科>,# # # disease_drug <科>,paper_pubmedID <空空的>

2 microrna与膀胱癌miR2Disease和PhenomiR相关联。

之间的预测数据库预测65 miRNA-gene双9 microrna和28的47个基因。

预测< -选择(example5keytype =“类型”,键=“预测”,列=列(example5))长度(独特的(预测美元mature_mirna_id))

# # 8 [1]

长度(独特的(预测美元target_entrez))

# # 26 [1]

独一无二的。对< -独特的(data.frame(microrna。ID =as.character(预测美元mature_mirna_id),目标。Entrez =as.character(预测美元target_entrez)))nrow(unique.pairs)

# #[1]58岁

头(unique.pairs)

# # microrna。ID的目标。Entrez # # 1 hsa - mir - 182 - 5 - 1112页# # 2 hsa - mir - 182 - 5 - 2017页hsa-miR-30a-5p hsa-miR-30b-5p # # 22998 # 22998 # 22998 # # 11 # 7 hsa-miR-30d-5p hsa - mir - 182 - 5 - 5962页

结果从每个预测数据库已经下令他们的分数从最好到最差。

example5。将< -分裂(预测,预测美元数据库)

7.6AnnotationDbi访问器方法的使用

AnnotationDbi访问器方法可以用来选择和筛选返回的数据get_multimir ()。

# example4的结果列(example4)

# #[1]“数据库”“mature_mirna_acc”“mature_mirna_id”“分”“target_ensembl”# # [6]“target_entrez”“target_symbol”“类型”

头(键(example4))

# # [1]“hsa - mir - 4795 - 3 - p”“hsa - mir - 126 - 5 - p”“hsa - mir - 545 - 3 - p”“hsa - mir - 5688”“hsa - mir - 3944 - 5 - p " # # [6]“hsa - mir - 137 - 3 - p”

keytypes(example4)

# #[1]“数据库”“mature_mirna_acc”“mature_mirna_id”“分”“target_ensembl”# # [6]“target_entrez”“target_symbol”“类型”

mykey < -键(example4) [1:4]头(选择(example4键=mykey,列=c(“数据库”,“target_entrez”)))

# # 1 # #数据库mature_mirna_id target_entrez diana_microt hsa - mir - 4795 - 3 - p 1903 # # 2 diana_microt hsa - mir - 126 - 5 - 1903页# # 3 diana_microt hsa - mir - 545 - 3 - p 253782 # # 4 diana_microt hsa - mir - 5688 1903 # # 67 diana_microt hsa - mir - 4795 - 3 - p 253782 # # 68 diana_microt hsa - mir - 5688 253782

#青年们的结果列(青年们)

# #[1]“数据库”“mature_mirna_acc”“mature_mirna_id”“分”“target_ensembl”# # [6]“target_entrez”“target_symbol”“类型”

头(键(青年们))

# # [1]“mmu - mir - 218 - 5 - p”“mmu - mir - 493 - 5 - p”“mmu - mir - 139 - 5 - p”“mmu - mir - 3074 - 2 - 3 - p " # # [5]“mmu - mir - 132 - 3 - p”“mmu - mir - 5101”

keytypes(青年们)

# #[1]“数据库”“mature_mirna_acc”“mature_mirna_id”“分”“target_ensembl”# # [6]“target_entrez”“target_symbol”“类型”

mykey < -键(青年们)[1:4]头(选择(青年们,键=mykey,列=c(“数据库”,“target_entrez”,“分数”)))

# # 1 # #数据库mature_mirna_id target_entrez得分diana_microt mmu - mir - 218 - 5 - 14688页0.975 # # 2 diana_microt mmu - mir - 493 - 5 - 14688页0.964 # # 3 diana_microt mmu - mir - 139 - 5 - 14688页0.96 # # 4 diana_microt mmu - mir - 3074 - 2 - 3 - p 14688 0.921 # # 106 elmmo mmu - mir - 218 - 5 - 14688页0.849 # # 107 elmmo mmu - mir - 218 - 5 - 14688页0.849

#搜索在example4基因的结果列(example4)

# #[1]“数据库”“mature_mirna_acc”“mature_mirna_id”“分”“target_ensembl”# # [6]“target_entrez”“target_symbol”“类型”

keytypes(example4)

# #[1]“数据库”“mature_mirna_acc”“mature_mirna_id”“分”“target_ensembl”# # [6]“target_entrez”“target_symbol”“类型”

头(键(example4keytype =“target_entrez”))

# # [1]“1903”“253782”“55959”“208”“286223”

mykey < -键(example4keytype =“target_entrez”)[1]头(选择(example4键=mykey,keytype =“target_entrez”,列=c(“数据库”,“target_entrez”,“分数”)))

# #数据库target_entrez得分diana_microt # # 1903 0.998 # # 1 # # 2 diana_microt 1903 1903 0.994 # # 18 diana_microt diana_microt 1903 0.98 # # 32 diana_microt # # 56 diana_microt 1903 0.964 1903 0.934

8上直接查询数据库multiMiR web服务器

正如先前所显示的,get_multimir是主要的函数来检索信息multiMiR数据库,主持http://multimir.org。函数构建一个SQL查询每一个外部数据库,用户搜索,提交查询到web服务器,并解析,结合,总结了结果从web服务器。对于高级用户,有几个方法来查询multiMiR数据库不使用multiMiR包;但他们必须熟悉SQL查询。一般来说,用户仍建议使用get_multimir ()当查询多个外部数据库的函数multiMiR。

8.1在web服务器上直接查询

的multiMiR包与multiMiR数据库通过脚本http://multimir.org/cgi-bin/multimir_univ.pl在web服务器上。再次,从每个外部数据库的数据存储在一个表中multiMiR。microrna还有表(表microrna的(表)和目标基因目标)。

注意:虽然可以从浏览器完成短查询,提交查询的限制通过在浏览器的地址栏输入正迅速达到(8192个字符)。如果你是一个开发人员应该使用您的首选方法提交HTTP POST将允许更长时间查询。包括的字段查询和dbName。查询是提交的SQL查询。dbName从调用是DBNAME列multimir_dbInfoVersions ()然而,如果这是排除当前版本是默认的。

了解一个表的结构(例如DIANA-microT表中的数据diana_microt),用户可以使用URL

http://multimir.org/cgi-bin/multimir_univ.pl?查询=描述diana_microt

与例1类似,下面的URL搜索验证靶基因miRecords hsa-miR-18a-3p。

http://multimir.org/cgi-bin/multimir.pl?查询=选择m。mature_mirna_acc, m。mature_mirna_id, t。target_symbol, t。target_entrez, t。目标_ensembl, i.experiment, i.support_type, i.pubmed_id FROM mirna AS m INNER JOIN mirecords AS i INNER JOIN target AS t ON (m.mature_mirna_uid=i.mature_mirna_uid and i.target_uid=t.target_uid) WHERE m.mature_mirna_id=‘hsa-miR-18a-3p’

如您所见,长,搜索查询的一个三表进行验证multiMiR。在例1,R的一行命令使用get_multimir ()搜索函数,结合和总结结果从所有三个验证外部数据库(miRecords, miRTarBase和TarBase)。

8.2在R中直接查询

上面的直接查询我们一样在web服务器上可以通过R。这是首选方法,如果你不熟悉HTTP POST。一定要设置正确的数据库版本,如果你想更改版本,在调用之前search_multimir ()它使用当前设置版本。

显示表的结构diana_microt:

direct2 < -search_multimir(查询=“描述diana_microt”)direct2

# #字段类型零键默认额外# # 1 mature_mirna_uid int(10)无符号没有MUL # # 2 target_uid int(10)无符号没有MUL # # 3 miTG_score双MUL # # 4 UTR3_hit int(10)无符号不# # 5 CDS_hit int(10)无符号

搜索验证靶基因的hsa-miR-18a-3p miRecords:

qry < -“选择m。mature_mirna_acc, m。mature_mirna_id, t。目标_symbol,t。target_entrez, t。目标_ensembl, i.experiment, i.support_type,i.pubmed_id从microrna的m内连接mirecords一样我内连接目标t(m.mature_mirna_uid =我。mature_mirna_uid和i.target_uid = t.target_uid)m.mature_mirna_id = hsa-miR-18a-3p”direct3 < -search_multimir(查询=qry)direct3

# # 1 # # mature_mirna_acc mature_mirna_id target_symbol target_entrez target_ensembl MIMAT0002891 hsa-miR-18a-3p喀斯特3845 ENSG00000133703 # #实验support_type pubmed_id # # 1免疫印迹/ /荧光素酶活性测定19372139

9会话信息

sessionInfo()

# # R版本以下4.4.1(2021-08-10)# #平台:x86_64-pc-linux-gnu(64位)# #下运行:Ubuntu 20.04.3 LTS # # # #矩阵产品:默认# #布拉斯特区:/home/biocbuild/bbs - 3.14 - bioc / R / lib / libRblas。所以# # LAPACK: /home/biocbuild/bbs - 3.14 - bioc / R / lib / libRlapack。# # # #语言环境:# # [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC = C而= en_GB # # [4] LC_COLLATE = C LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # # [7] LC_PAPER = en_US。utf - 8 LC_NAME C = C LC_ADDRESS = # # [10] LC_TELEPHONE = C LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C附加基本包:# # # # # #[1]统计图形grDevices跑龙套数据集方法基础# # # #其他附加包:# # [1]edgeR_3.36.0 limma_3.50.0 multiMiR_1.16.0 knitr_1.36 BiocStyle_2.22.0 # # # #通过加载一个名称空间(而不是附加):# # [1]Rcpp_1.0.7 locfit_1.5 - 9.4 lattice_0.20-45 png_0.1-7 # # [5] Biostrings_2.62.0 assertthat_0.2.1 digest_0.6.28 utf8_1.2.2 # # [9] R6_2.5.1 GenomeInfoDb_1.30.0 stats4_4.1.1 RSQLite_2.2.8 # # [13] evaluate_0.14 httr_1.4.2 pillar_1.6.4 zlibbioc_1.40.0 # # [17] rlang_0.4.12 jquerylib_0.1.4 blob_1.2.2 S4Vectors_0.32.0 # # [21] rmarkdown_2.11 splines_4.1.1 stringr_1.4.0 rcurl_1.98 - 1.5 # # [25] bit_4.0.4 compiler_4.1.1 xfun_0.27 pkgconfig_2.0.3 # # [29] BiocGenerics_0.40.0 htmltools_0.5.2 tidyselect_1.1.1 KEGGREST_1.34.0 # # [33] tibble_3.1.5 GenomeInfoDbData_1.2.7 bookdown_0.24 IRanges_2.28.0 # # [37] xml_3.99 - 0.8 fansi_0.5.0 crayon_1.4.1 dplyr_1.0.7 # # [41] bitops_1.0-7 grid_4.1.1 jsonlite_1.7.2 lifecycle_1.0.1 # # [45] DBI_1.1.1 magrittr_2.0.1 cli_3.0.1 stringi_1.7.5 # # [49] cachem_1.0.6 XVector_0.34.0 bslib_0.3.1 ellipsis_0.3.2 # # [53] generics_0.1.1 vctrs_0.3.8 tools_4.1.1 bit64_4.0.5 # # [57] Biobase_2.54.0 glue_1.4.2 purrr_0.3.4 fastmap_1.1.0 # # [61] yaml_2.2.1 AnnotationDbi_1.56.0 BiocManager_1.30.16 memoise_2.0.0 # # [65] sass_0.4.0

警告()

multiMiR用户指南

2021年10月26日

包

1介绍

2了解multiMiR数据库

3更改`包:multiMiR`- - - - - - S3和S4类

4列表microrna基因、药物和疾病multiMiR数据库中

5使用`get_multimir ()`查询multiMiR数据库

6的例子multiMiR Bioconductor工作流

7multiMiR查询的例子

7.1示例1:检索所有给定microrna的目标基因进行验证

7.2示例2:检索miRNA-target交互与给定的药物或疾病有关

7.3示例3:选择目标基因microrna预测

7.4示例4:选择microrna (s)预测目标大部分,如果不是全部,感兴趣的基因的

7.5示例5:检索一组microrna和之间的相互作用的一组基因

7.6AnnotationDbi访问器方法的使用

8上直接查询数据库multiMiR web服务器

8.1在web服务器上直接查询

8.2在R中直接查询

9会话信息

multiMiR用户指南

2021年10月26日

包

1介绍

2了解multiMiR数据库

3更改包:multiMiR- - - - - - S3和S4类

4列表microrna基因、药物和疾病multiMiR数据库中

5使用get_multimir ()查询multiMiR数据库

6的例子multiMiR Bioconductor工作流

7multiMiR查询的例子

7.1示例1:检索所有给定microrna的目标基因进行验证

7.2示例2:检索miRNA-target交互与给定的药物或疾病有关

7.3示例3:选择目标基因microrna预测

7.4示例4:选择microrna (s)预测目标大部分,如果不是全部,感兴趣的基因的

7.5示例5:检索一组microrna和之间的相互作用的一组基因

7.6AnnotationDbi访问器方法的使用

8上直接查询数据库multiMiR web服务器

8.1在web服务器上直接查询

8.2在R中直接查询

9会话信息

3更改`包:multiMiR`- - - - - - S3和S4类

5使用`get_multimir ()`查询multiMiR数据库