DNA测序已成为生物医学和生物学的重要组成部分。通常,使用自动化管道来分析数据。然而,研究人员的目测检查通常在基本质量控制水平和作为分析结果的确认方面都是有用的。高效的可视化在指导分析、设计和解释结果方面也常常起着重要的作用。为了为用户提供简单有效的基因组区域可视化,我们开发了一个复制驱动工具RepViz。RepViz允许同时查看所研究条件的测序计数的组内和组间变化,以及它们与用户选择的数据分析方法的输出特征(如识别的峰值)的比较。RepViz工具主要设计用于染色质数据,如ChIP-seq和ATAC-seq,但也可以用于其他测序数据,如RNA-seq,或不同类型的基因组数据的组合。
在执行这些命令之前,需要将示例文件复制到一个临时文件中,然后将工作目录移到该文件中:
该工具接受两个CSV文件作为输入。这些CSV文件包含RepViz所需的不同文件的路径。第一个CSV文件包含BAM文件的文件路径和关于组名的信息。第二个CSV文件包含到BED文件的文件路径。下面是一个BAM输入文件BAM_input.csv的示例,其中包含两列,BAM文件的路径和组名。
bam文件 | 集团 |
---|---|
rep1_1.bam | 正常的 |
rep2_1.bam | 正常的 |
rep3_1.bam | 正常的 |
rep4_1.bam | 正常的 |
rep5_1.bam | 正常的 |
rep1_2.bam | 肿瘤 |
rep2_2.bam | 肿瘤 |
rep3_2.bam | 肿瘤 |
rep4_2.bam | 肿瘤 |
rep5_2.bam | 肿瘤 |
下面是包含两列的BED_input.csv的示例;床上文件的路径和名称将出现在传奇。对于本例的目的,该文件只包含一行,但它可以包含多行。
床上的文件 | 传说 |
---|---|
consensus.bed | 苹果电脑 |
注意,相应的BAI文件需要与BAM文件放在同一个文件夹中。BAI文件是BAM文件的索引文件。它采用与BAM文件相同的名称,只是增加了后缀“.bai”。
## [1] "rep1_1。砰”“rep1_1.bam。白”“rep1_2。砰”“rep1_2.bam。Bai“##[5]”rep2_1。砰”“rep2_1.bam。白”“rep2_2。砰”“rep2_2.bam。Bai“##[9]”rep3_1。砰”“rep3_1.bam。白”“rep3_2。砰”“rep3_2.bam。Bai“##[13]”rep4_1。砰”“rep4_1.bam。白”“rep4_2。砰”“rep4_2.bam。Bai“##[17]”rep5_1。砰”“rep5_1.bam。白”“rep5_2。bam" "rep5_2.bam.bai"
CSV输入文件准备好之后,用户需要声明将与BAM和BED文件匹配的基因组一起可视化的区域。在这个例子中,我们使用VPS29基因附近的区域。目前实施的基因组是hg19, hg38和mm10。avgTrack和geneTrack逻辑可以控制是否绘制基因轨迹和平均轨迹。
地区< -农庄(“chr12:110938000 - 110940000”)RepViz::RepViz(地区=地区,基因组=“hg19”,BAM =“BAM_input.csv”,床上=“BED_input.csv”,avgTrack =真正的,geneTrack =真正的,verbose =假)
下面是可视化的输出。上面的两个面板显示了每组内的不同复制,面板的数量取决于组的数量。第三个面板显示的是组别平均值。第四个面板显示BED文件中指定的基因组区域,而最低的面板显示基因组轨迹。
##警告:ensemble将很快强制使用https。确保'host'参数包含"https://"