Bioconductor构建系统没有安装MEME套件,因此这些小插图将不包含任何R输出。要查看完整的小插图,请访问meme网站上的文章页面gydF4y2Ba在此链接gydF4y2Ba
#gydF4y2Ba请注意gydF4y2Ba:通常不建议设置为“1”。gydF4y2Bafasta文件只有1个序列gydF4y2Ba#以保持文件大小较小,并让示例快速运行。gydF4y2Ba#我设置value = 39,因为dreme不能从一个序列中检测到高置信度的motif。gydF4y2Badreme_out < -gydF4y2BarunDremegydF4y2Ba(足总,gydF4y2Ba“洗牌”gydF4y2Ba,gydF4y2Ba安勤科技=gydF4y2Ba39gydF4y2Ba,gydF4y2Baoutdir =gydF4y2BatempdirgydF4y2Ba())gydF4y2Ba
模因的别名gydF4y2Ba | DREME国旗gydF4y2Ba | 描述gydF4y2Ba |
---|---|---|
nmotifsgydF4y2Ba | 米*gydF4y2Ba | 最大数量的主题发现gydF4y2Ba |
证券交易委员会gydF4y2Ba | tgydF4y2Ba | 最大运行秒数gydF4y2Ba |
安勤科技gydF4y2Ba | egydF4y2Ba | 最大e值截止gydF4y2Ba |
种子gydF4y2Ba | *gydF4y2Ba | 如果使用“shuffle”作为控制,则随机播种gydF4y2Ba |
ngengydF4y2Ba | ggydF4y2Ba | 要泛化的REs数量gydF4y2Ba |
*标记为*的标志必须使用它们的别名来分配gydF4y2Ba
#相当于以上gydF4y2BarunDremegydF4y2Ba(足总,gydF4y2Ba“洗牌”gydF4y2Ba,gydF4y2Ba安勤科技=gydF4y2Ba39gydF4y2Ba,gydF4y2Baoutdir =gydF4y2BatempdirgydF4y2Ba())gydF4y2BarunDremegydF4y2Ba(足总,gydF4y2Ba“洗牌”gydF4y2Ba,gydF4y2Bae =gydF4y2Ba39gydF4y2Ba,gydF4y2Baoutdir =gydF4y2BatempdirgydF4y2Ba(),gydF4y2Banmotifs =gydF4y2Ba2gydF4y2Ba)gydF4y2Ba
梦的结果是一个gydF4y2Badata.framegydF4y2Ba
.的gydF4y2Ba主题gydF4y2Ba
列包含gydF4y2BauniversalmotifgydF4y2Ba
对象中包含每个对象的PCM信息gydF4y2Ba新创gydF4y2Ba发现了主题。这样,对结果对象的任何过滤也可以简单地过滤可用的图案。有关每列的详细信息,请参阅的“值”部分gydF4y2BarunDreme ?gydF4y2Ba
.gydF4y2Ba
结果可以转换回gydF4y2BauniversalmotifgydF4y2Ba
格式使用gydF4y2Bato_list ()gydF4y2Ba
.的gydF4y2Baview_motifs ()gydF4y2Ba
函数接受gydF4y2BauniversalmotifgydF4y2Ba
列表,并可用于可视化的主题。gydF4y2Ba
图书馆gydF4y2Ba(universalmotif)gydF4y2Ba图书馆gydF4y2Ba(dplyr)gydF4y2Badreme_outgydF4y2Ba% > %gydF4y2Bato_listgydF4y2Ba()gydF4y2Ba% > %gydF4y2Baview_motifsgydF4y2Ba()gydF4y2Ba
使用的主要优点是gydF4y2Badata.framegydF4y2Ba
输出允许与基本子集设置、管道和gydF4y2BatidyversegydF4y2Ba
.gydF4y2Ba
dreme_outgydF4y2Ba% > %gydF4y2Ba#使用dplyr过滤后,只有长度为3的motif将被绘制gydF4y2Ba过滤器gydF4y2Ba(长度gydF4y2Ba= =gydF4y2Ba3.gydF4y2Ba)gydF4y2Ba% > %gydF4y2Bato_listgydF4y2Ba()gydF4y2Ba% > %gydF4y2BauniversalmotifgydF4y2Ba::gydF4y2Baview_motifsgydF4y2Ba()gydF4y2Ba
universalmotifgydF4y2Ba
操作也可以很容易地在主题上执行。例如:gydF4y2Ba
dreme_outgydF4y2Ba% > %gydF4y2Bato_listgydF4y2Ba()gydF4y2Ba% > %gydF4y2Bamerge_motifsgydF4y2Ba()gydF4y2Ba% > %gydF4y2Baview_motifsgydF4y2Ba()gydF4y2Ba
有时,更新与已发现主题相关的元数据(例如,为denovo主题分配新名称)是有用的。Memes提供了一些实用工具来实现这一点。gydF4y2Ba
update_motifs ()gydF4y2Ba
属性的属性将搜索特定的列名gydF4y2Ba主题gydF4y2Ba
列中更新元数据gydF4y2Ba主题gydF4y2Ba
列来反映这些值。看到gydF4y2Baupdate_motifs ?gydF4y2Ba
获取详细信息。gydF4y2Ba
as_universalmotif ()gydF4y2Ba
将这些特殊的universalmotif data.frames转换为universalmotif列表后更新元数据,以反映值如gydF4y2Baupdate_motifs ()gydF4y2Ba
.gydF4y2Ba
# update_motifs将更新motif列中的值gydF4y2Ba#到data.frame中的值gydF4y2Badreme_edit < -gydF4y2Badreme_outgydF4y2Ba% > %gydF4y2BadplyrgydF4y2Ba::gydF4y2Ba变异gydF4y2Ba(gydF4y2Baname =gydF4y2BacgydF4y2Ba(gydF4y2Ba“一”gydF4y2Ba,gydF4y2Ba“两个”gydF4y2Ba,gydF4y2Ba“三”gydF4y2Ba,gydF4y2Ba“四”gydF4y2Ba,gydF4y2Ba“五”gydF4y2Ba))gydF4y2Ba% > %gydF4y2Baupdate_motifsgydF4y2Ba()gydF4y2Ba# to_list()将首先更新主题信息gydF4y2Ba然后只返回主题列gydF4y2Baedit_motifs < -gydF4y2Badreme_outgydF4y2Ba% > %gydF4y2BadplyrgydF4y2Ba::gydF4y2Ba变异gydF4y2Ba(gydF4y2Baname =gydF4y2BacgydF4y2Ba(gydF4y2Ba“一”gydF4y2Ba,gydF4y2Ba“两个”gydF4y2Ba,gydF4y2Ba“三”gydF4y2Ba,gydF4y2Ba“四”gydF4y2Ba,gydF4y2Ba“五”gydF4y2Ba))gydF4y2Ba% > %gydF4y2Bato_listgydF4y2Ba()gydF4y2Ba#以下输出完全相同gydF4y2Ba# where edit_motifs是一个motifs列表gydF4y2Ba#和dreme_edit是一个带有motif列表列的data.framegydF4y2Ba相同的gydF4y2Ba(edit_motifsgydF4y2Ba$gydF4y2Ba1、dreme_editgydF4y2Ba$gydF4y2Ba主题gydF4y2Ba$gydF4y2Ba一个)gydF4y2Ba
设置gydF4y2BaControl = "shuffle"gydF4y2Ba
将使用dreme的随机数生成器来打乱输入序列。默认情况下,dreme将使用gydF4y2Ba1gydF4y2Ba
作为随机种子,因此重复运行相同的shuffle命令将产生相同的输出。要更改随机种子,passgydF4y2Ba种子=[你随机的种子]gydF4y2Ba
来gydF4y2BarunDreme ()gydF4y2Ba
.gydF4y2Ba注意:gydF4y2Ba注意系统特定的差异。从MEME v5开始,dreme将使用系统上的默认python安装(python2.7或python3)进行编译。随机数生成器在python2.7和python3之间发生了变化,因此在使用python2.7和python3的系统之间,结果将不可重现gydF4y2Ba即使设置相同的随机种子gydF4y2Ba.gydF4y2Ba
克服这个问题的一种方法是手动打乱r中的序列。这可以很容易地使用gydF4y2Bauniversalmotif: shuffle_sequences ()gydF4y2Ba
.集gydF4y2BaK = 2gydF4y2Ba
以保持二核苷酸频率(类似于dreme的内置洗牌),并设置gydF4y2Barng.seedgydF4y2Ba
任意数字来创造可重复的洗牌。该函数的输出可以直接用作控制序列。gydF4y2Ba
通常,用户希望对多组序列进行motif分析。例如,这里我们有转录因子E93的ChIP-seq峰。对E93峰染色质可达性的分析揭示了E93结合后可达性增加、可达性减少或保持静态的位点。gydF4y2Ba
suppressPackageStartupMessagesgydF4y2Ba(gydF4y2Ba图书馆gydF4y2Ba(GenomicRanges))gydF4y2BasuppressPackageStartupMessagesgydF4y2Ba(gydF4y2Ba图书馆gydF4y2Ba(plyranges))gydF4y2Ba数据gydF4y2Ba(gydF4y2Ba“example_chip_summits”gydF4y2Ba,gydF4y2Ba包=gydF4y2Ba“模因”gydF4y2Ba)gydF4y2Ba山峰< -gydF4y2Baexample_chip_summitsgydF4y2Ba
为了检验增加位点、减少位点和静态位点的基序含量是否存在差异,我们将这些峰按它们对E93的响应划分为一个列表。gydF4y2Ba
by_behavior < -gydF4y2Ba山峰gydF4y2Ba% > %gydF4y2Baanchor_centergydF4y2Ba()gydF4y2Ba% > %gydF4y2Ba变异gydF4y2Ba(gydF4y2Ba宽度=gydF4y2BaOne hundred.gydF4y2Ba)gydF4y2Ba% > %gydF4y2Ba分裂gydF4y2Ba(gydF4y2BamcolsgydF4y2Ba(.)gydF4y2Ba$gydF4y2Bae93_sensitive_behavior)gydF4y2Ba
接下来,这个列表可以直接用于gydF4y2Baget_sequences ()gydF4y2Ba
为每组峰值生成序列列表。gydF4y2Ba
dm.genome < -gydF4y2BaBSgenome.Dmelanogaster.UCSC.dm3gydF4y2Ba::gydF4y2BaBSgenome.Dmelanogaster.UCSC.dm3gydF4y2Baseq_by_behavior < -gydF4y2Baby_behaviorgydF4y2Ba% > %gydF4y2Baget_sequencegydF4y2Ba(dm.genome)gydF4y2Ba
要在每一集上运行DREME,使用打乱的输入序列作为背景,运行:gydF4y2Ba
然而,在本分析中,我们最感兴趣的是识别不涉及E93结合的与增加和减少相关的基序。因此,更合适的控制方法是使用静态站点作为背景。gydF4y2Ba
一如既往,gydF4y2BaXStringSetgydF4y2Ba
对象可以用作控制区域。然而,以这种方式运行dream将运行3个作业:gydF4y2Ba
这将浪费时间,因为作业#3将检测不到任何图案(因为输入和控制是相同的),但仍然需要很长时间才能运行。gydF4y2BarunDreme ()gydF4y2Ba
具有额外的功能来帮助避免这些问题,并促进更复杂的分析设计。gydF4y2Ba
runDremegydF4y2Ba(seq_by_behaviorgydF4y2Ba控制=gydF4y2Baseq_by_behaviorgydF4y2Ba$gydF4y2Ba静态)gydF4y2Ba
如果输入为gydF4y2BarunDremegydF4y2Ba
名单是什么gydF4y2BaXStringSetgydF4y2Ba
对象,gydF4y2Ba控制gydF4y2Ba
可以设置为一个或多个值gydF4y2Ba名称(输入)gydF4y2Ba
使用这些区域作为背景。它将跳过运行这些区域作为输入。下面的代码将导致这些比较:gydF4y2Ba
名称中使用了多个名称gydF4y2Ba控制gydF4y2Ba
节中,它们将被组合在一起,形成一个用于所有比较的控制集。在这里,我们使用“静态”和“减少”站点作为对照,这将导致只运行1个比较:增加vs静态+减少。gydF4y2Ba
importDremeXML ()gydF4y2Ba
可以用来导入gydF4y2Badreme.xmlgydF4y2Ba
之前在MEME服务器上或命令行上运行的文件。关于如何从DREME web服务器保存数据的详细信息如下。gydF4y2Ba
要从MEME服务器下载XML数据,右键单击DREME XML输出链接并“另存目标为”或“另存链接为”(见下图示例),并另存为gydF4y2Ba<文件名> . xmlgydF4y2Ba
.该文件可以使用gydF4y2BaimportDremeXML ()gydF4y2Ba
MEME是MEME Suite中一些精选工具的包装器,这些工具是由另一个小组开发的。除了引用模因外,请引用与您使用的工具相对应的MEME Suite工具。gydF4y2Ba
如果你使用gydF4y2BarunDreme ()gydF4y2Ba
在你的分析中,请引用:gydF4y2Ba
李文杰,“转录因子基因序列的研究进展”,生物信息学杂志,27(12):1653-1659,2011。gydF4y2Ba全文gydF4y2Ba
MEME Suite对于非营利性用户是免费的,但营利性用户需要购买许可证。看到gydF4y2BaMEME Suite版权页面gydF4y2Ba获取详细信息。gydF4y2Ba