Bioconductor构建系统没有安装MEME套件,因此这些小插曲不会包含任何R输出。要查看完整的装饰图案,迷因网站上访问这篇文章页面在这个链接
suppressPackageStartupMessages(图书馆(GenomicRanges))suppressPackageStartupMessages(图书馆(magrittr))suppressPackageStartupMessages(图书馆(universalmotif))图书馆(文化)
搜索输入序列喘振的一个主题。runFimo ()
有两个必需的输入:fasta-format序列,可选的基因组坐标标题,和一组图案在输入序列检测。
序列的输入runFimo ()
可以作为一个路径.fasta格式化的文件,或作为一个吗Biostrings: XStringSet
对象。与其他文化基因功能,runFimo ()
不接受一个Biostrings: BStringSetList
作为输入。这是简化远程连接操作(见连接在输出数据)。
默认情况下,runFimo ()
将解析基因组坐标从fasta序列条目标题。这些都是如果使用自动生成get_sequences ()
生成序列的输入农庄
对象。
数据(“example_chip_summits”,包=“模因”)dm.genome < -BSgenome.Dmelanogaster.UCSC.dm3::BSgenome.Dmelanogaster.UCSC.dm3# 100 bp windows ChIP-seq峰会summit_flank < -example_chip_summits% > %plyranges::anchor_center()% > %plyranges::变异(宽度=One hundred.)#获取序列在山峰Biostring: BStringSet序列< -summit_flank% > %get_sequence(dm.genome)# get_sequence包括基因组协调fasta标题名称的名字(序列)1:2]
主题输入runFimo ()
可以作为一个路径.meme格式化的文件,一个列表的universalmotif
对象,或一个单一的universalmotif
对象。runFimo ()
不会使用任何主题数据库的默认搜索路径的行为在吗runAme ()
或runTomTom ()
。
runFimo ()
配置为使用不同的默认行为相对于命令行和MEME-Suite服务器版本。默认情况下,runFimo ()
运行使用文本
模式,极大地提高速度和允许返回所有匹配检测输入主题。默认情况下runFimo ()
将序列匹配的区域添加到输出数据;然而,这个操作会非常缓慢的地区和大型集可以大大提高输出数据的大小。加快操作和减少数据大小,设置skip_matched_sequence = TRUE
。稍后再序列信息可以添加使用add_sequence ()
。
的plyranges
包提供了一个扩展的框架,用于执行基于范围操作在r .几个有用的实用程序基于范围分析join_
功能是特别有用的积分结果与输入峰值信息。一些常见的例子简要强调如下:
plyranges: join_overlap_left ()
可用于峰值水平元数据添加到主题位置信息:
fimo_results_with_peak_info < -fimo_results% > %plyranges::join_overlap_left(summit_flank)fimo_results_with_peak_info [1:5]
plyranges: intersect_ ()
同时可以用来输入峰值范围重叠子集主题击中而附加motif-level元数据重叠。
当设置skip_match_sequence = TRUE
,FIMO不会自动返回匹配的序列在每个打击。这些序列在R中可以很容易地恢复使用add_sequence ()
FIMO结果农庄
对象。
fimo_results_with_seq < -fimo_results% > %plyranges::join_overlap_left(summit_flank)% > %add_sequence(dm.genome)
返回序列匹配的区域可以用来推导pwm不同匹配类别如下(这里做不同的绑定类别):
motifs_by_binding < -fimo_results_with_seq% > %#分裂感兴趣的参数分裂(mcols(.)美元peak_binding_description)% > %# GRangesList转换为常规的列表()使用“purrr”as.list()% > %# imap通过列表条目的方式和.y该对象的名称purrr::imap(~{#通过序列列create_motif生成一个PCMcreate_motif(以下方式美元序列,#添加绑定描述主题的名称name =paste0(“E93_”,.y))})
从每个类别可以可视化主题universalmotif: view_motifs ()
为了更好地参考主题相比,我们可以将它添加到列表如下:
可视化icm的主题揭示的细微差别E93主题每个类别之间的序列。
可视化结果作为position-probability矩阵(PPM)更好地证明了每个类别之间的主要差异是来自职位匹配序列1 - 4。
最后,sequence-level信息可用于可视化所有序列及其贡献最后的PWM使用plot_sequence_heatmap
。
importFimo ()
可以用来导入一个吗fimo.tsv
文件从先前的MEME服务器或在命令行上运行。细节如何保存数据从网络服务器低于。
下载TSV FIMO服务器的数据,右键单击FIMO TSV输出链接和“目标另存为”或“链接另存为”(见下图)例子,并保存<文件名> . tsv
。这个文件可以阅读使用importFimo ()
。
模因是一个包装器从模因选择一些工具套件,这是由另一组。除了引用模因,请引用相对应的MEME套件工具的工具使用。
如果你使用runFimo ()
在你的分析,请列举:
查尔斯·e·格兰特,蒂莫西·l·贝利和威廉·斯塔福德高贵,“FIMO:扫描给定主题的出现”,生物信息学,27(7):1017 - 1018年,2011年。全文
非营利性使用MEME套件是免费的,但以营利为目的的用户应该购买一个许可证。看到MEME套件版权页获取详细信息。