图案扫描使用FIMO

看到包网站完整的装饰图案

Bioconductor构建系统没有安装MEME套件,因此这些小插曲不会包含任何R输出。要查看完整的装饰图案,迷因网站上访问这篇文章页面在这个链接

suppressPackageStartupMessages(图书馆(GenomicRanges))suppressPackageStartupMessages(图书馆(magrittr))suppressPackageStartupMessages(图书馆(universalmotif))图书馆(文化)

输入

搜索输入序列喘振的一个主题。runFimo ()有两个必需的输入:fasta-format序列,可选的基因组坐标标题,和一组图案在输入序列检测。

序列的输入:

序列的输入runFimo ()可以作为一个路径.fasta格式化的文件,或作为一个吗Biostrings: XStringSet对象。与其他文化基因功能,runFimo ()接受一个Biostrings: BStringSetList作为输入。这是简化远程连接操作(见连接在输出数据)。

默认情况下,runFimo ()将解析基因组坐标从fasta序列条目标题。这些都是如果使用自动生成get_sequences ()生成序列的输入农庄对象。

主题输入:

主题输入runFimo ()可以作为一个路径.meme格式化的文件,一个列表的universalmotif对象,或一个单一的universalmotif对象。runFimo ()不会使用任何主题数据库的默认搜索路径的行为在吗runAme ()runTomTom ()

注意默认设置

runFimo ()配置为使用不同的默认行为相对于命令行和MEME-Suite服务器版本。默认情况下,runFimo ()运行使用文本模式,极大地提高速度和允许返回所有匹配检测输入主题。默认情况下runFimo ()将序列匹配的区域添加到输出数据;然而,这个操作会非常缓慢的地区和大型集可以大大提高输出数据的大小。加快操作和减少数据大小,设置skip_matched_sequence = TRUE。稍后再序列信息可以添加使用add_sequence ()

数据集成的连接操作

plyranges包提供了一个扩展的框架,用于执行基于范围操作在r .几个有用的实用程序基于范围分析join_功能是特别有用的积分结果与输入峰值信息。一些常见的例子简要强调如下:

plyranges: join_overlap_left ()可用于峰值水平元数据添加到主题位置信息:

plyranges: intersect_ ()同时可以用来输入峰值范围重叠子集主题击中而附加motif-level元数据重叠。

识别匹配的序列

当设置skip_match_sequence = TRUE,FIMO不会自动返回匹配的序列在每个打击。这些序列在R中可以很容易地恢复使用add_sequence ()FIMO结果农庄对象。

返回序列匹配的区域可以用来推导pwm不同匹配类别如下(这里做不同的绑定类别):

从每个类别可以可视化主题universalmotif: view_motifs ()

为了更好地参考主题相比,我们可以将它添加到列表如下:

可视化icm的主题揭示的细微差别E93主题每个类别之间的序列。

可视化结果作为position-probability矩阵(PPM)更好地证明了每个类别之间的主要差异是来自职位匹配序列1 - 4。

最后,sequence-level信息可用于可视化所有序列及其贡献最后的PWM使用plot_sequence_heatmap

导入数据从之前运行

importFimo ()可以用来导入一个吗fimo.tsv文件从先前的MEME服务器或在命令行上运行。细节如何保存数据从网络服务器低于。

保存数据的Web服务器

下载TSV FIMO服务器的数据,右键单击FIMO TSV输出链接和“目标另存为”或“链接另存为”(见下图)例子,并保存<文件名> . tsv。这个文件可以阅读使用importFimo ()

引用

模因是一个包装器从模因选择一些工具套件,这是由另一组。除了引用模因,请引用相对应的MEME套件工具的工具使用。

如果你使用runFimo ()在你的分析,请列举:

查尔斯·e·格兰特,蒂莫西·l·贝利和威廉·斯塔福德高贵,“FIMO:扫描给定主题的出现”,生物信息学,27(7):1017 - 1018年,2011年。全文

许可限制

非营利性使用MEME套件是免费的,但以营利为目的的用户应该购买一个许可证。看到MEME套件版权页获取详细信息。

会话信息

sessionInfo()