1动机

该软件包旨在:

  • 替换使用命令行工具进行大多数对齐后处理,例如。bedtools而且deeptools
  • 易于使用和安装,不需要外部依赖,例如hitslib或者UCSC基因组浏览器里的肯特源代码工具
  • 允许用户将常见的分析管道与简单、快速运行的一行程序串在一起
  • 通过提供经过测试和验证的代码来避免代码重复
  • 利用基对分辨率数据的特性来优化性能和增加用户友好性
  • 使用进程分叉来利用多核处理器
  • 除了利用R在统计和数据可视化方面的传统优势外,还最大限度地与Bioconductor丰富的分析软件生态系统兼容
  • 完全替换有重大影响的人R包

2特性

  • 快速、轻松地处理和导入bedGraph、bigWig和bam文件,并为典型用途预先配置了几个默认值
  • 计数和过滤插入读数
  • 使用几种方法和选项计算峰值归一化因子,包括批处理归一化的选项
  • 按感兴趣的区域计数
  • Count读取感兴趣区域内的位置,单基分辨率或更大的容器,并生成用于热图的计数矩阵
  • 计算带有置信区间的引导信号(例如readcount)配置文件(即元配置文件)
  • 使用一个简单直接的功能修改基因区域(例如提取启动子或基因体区域)
  • 方便高效的呼叫DESeq2以对全局变化具有鲁棒性的方式计算微分表达式1避免在所有样本上计算基因离散度的默认行为,如果任何实验条件导致广泛的变化,这种行为是无效的
    • 使用非连续基因DESeq2分析,例如从分析中排除特定的站点/峰值(通常不被DESeq2支持)
    • 在比较列表中有效地生成结果
  • 支持全面列入黑名单,并在相关计算中对列入黑名单的站点进行适当的核算
  • 用户与直观且计算高效的数据结构(“基对分辨率”)交互农庄对象),它已经得到了一套丰富的、用户友好的工具的支持,这些工具极大地简化了数据集和注释的工作

3.即将到来的

数据处理:

  • 总结并绘制复制相关性
  • 函数使用随机读采样来评估排序深度是否足以稳定任意计算(因此用户可以提供匿名函数来计算诸如排序表达式、幂分析或DESeq2的微分表达式、暂停指数等)。

信号计数与分析:

  • 双链元概要计算
  • 使用所有可能的组合自动生成DESeq2比较列表;所有可能的排列;或者通过定义一个简单的一对一比较层次结构