DNA测序已经成为生物医学和生物学的重要组成部分。通常,数据是通过自动化管道进行分析的。然而,研究人员的视觉检查通常在基本质量控制和对分析结果的确认两方面都很有用。高效的可视化在指导分析设计和结果解释方面通常也具有重要作用。为了为用户提供简单有效的基因组区域可视化,我们开发了一个复制驱动工具RepViz。RepViz允许同时查看所研究条件的测序计数的组内和组间变化,以及它们与用户选择的数据分析方法的输出特征(例如已识别的峰值)的比较。RepViz工具主要用于染色质数据,如ChIP-seq和ATAC-seq,但也可以用于其他测序数据,如RNA-seq,或不同类型的基因组数据的组合。
在执行命令之前,需要将示例文件复制到一个临时文件中,然后将工作目录移动到该文件中:
file.copy(从=list.files(执行(“extdata”,包=“RepViz”),full.names =真正的),=tempdir())setwd(tempdir())
该工具以两个CSV文件作为输入。这些CSV文件包含RepViz所需的不同文件的路径。第一个CSV文件包含BAM文件的文件路径和关于组名的信息。第二个CSV文件包含到BED文件的文件路径。下面是BAM输入文件BAM_input.csv的示例,其中包含两列,BAM文件的路径和组名。
bam文件 | 集团 |
---|---|
rep1_1.bam | 正常的 |
rep2_1.bam | 正常的 |
rep3_1.bam | 正常的 |
rep4_1.bam | 正常的 |
rep5_1.bam | 正常的 |
rep1_2.bam | 肿瘤 |
rep2_2.bam | 肿瘤 |
rep3_2.bam | 肿瘤 |
rep4_2.bam | 肿瘤 |
rep5_2.bam | 肿瘤 |
下面是包含两列的BED_input.csv的示例;BED文件的路径和将出现在图例中的名称。在本例中,文件只包含一行,但可以包含多行。
床上的文件 | 传说 |
---|---|
consensus.bed | 苹果电脑 |
注意,对应的BAI文件需要与BAM文件出现在同一个文件夹中。BAI文件是BAM文件的索引文件。它具有与BAM文件相同的名称,只是增加了后缀“.bai”。
## [1] "rep1_1。砰”“rep1_1.bam。白”“rep1_2。砰”“rep1_2.bam。Bai“##[5]”rep2_1。砰”“rep2_1.bam。白”“rep2_2。砰”“rep2_2.bam。Bai“##[9]”rep3_1。砰”“rep3_1.bam。白”“rep3_2。砰”“rep3_2.bam。Bai“##[13]”rep4_1。砰”“rep4_1.bam。白”“rep4_2。砰”“rep4_2.bam。Bai“##[17]”rep5_1。砰”“rep5_1.bam。白”“rep5_2。bam" "rep5_2.bam.bai"
CSV输入文件准备好后,用户需要声明将与BAM和BED文件匹配的基因组一起显示的区域。在这个例子中,我们使用的是VPS29基因附近的区域。目前实施的基因组是hg19、hg38和mm10。avgTrack和geneTrack逻辑能够控制是否绘制基因轨迹和平均轨迹。
农庄(“chr12:110938000 - 110940000”) 地区< -::RepViz(地区=地区, RepViz基因组=“hg19”,BAM =“BAM_input.csv”,床上=“BED_input.csv”,avgTrack =真正的,geneTrack =真正的,verbose =假)
下面是可视化的输出。上面的两个面板显示了每个组内的不同重复,面板的数量取决于组的数量。第三个面板显示了组平均值。第四个面板显示了BED文件中指定的基因组区域,而最低的面板显示了基因组轨迹。
##警告:Ensembl将很快强制使用https。##确保“host”参数包含“https://”