Compare 2 Sequences为两个输入序列或两组序列生成所有可能的引导rna (gRNAs),并为另一个序列的潜在脱靶率生成分数。
这两个输入文件包含要搜索潜在grna的两个序列。Compare 2 Sequences为两个输入序列的每个gRNA分配相对切割分数,便于识别专门针对两个输入序列之一的gRNA,并便于识别针对两个输入序列的gRNA。
它返回一个包含两个序列中所有潜在grna的数据帧。此外,一个以制表符分隔的文件scoresFor2InputSequences.xls也保存在outputDir中,按scoreDiff降序排序。输出的gRNAs为fasta或genbank格式,成对配置,并带有限制性内切酶切割位点。
脱靶分析是通过自动调用findgRNAs, filtergRNAs, searchHits, buildFeatureVectorForScoring, getOfftargetScore, filterOfftarget,计算gRNA裂解效率,并生成报告,为CRISPR-Cas9系统设计靶向导向rna (gRNAs)。
该程序为输入序列寻找潜在的gRNA,搜索和评分每个gRNA的脱靶位点,并检索脱靶位点两侧的基因组序列。然后判断脱靶位点是否位于基因的关键区域(如外显子),输出脱靶细节,包括错配位置、解理评分、具有topN脱靶切割评分的gRNAs。
在输出目录中生成四个以制表符分隔的文件:OfftargetAnalysis.xls (off targets的详细信息)、summary .xls (gRNA的摘要)、REcutDetails.xls(每个gRNA的酶切位点)和pairedgRNAs.xls(潜在的成对gRNA)
GUIDE-seq分析工作流包括获取唯一插入位点(裂解位点的代理)的函数,估计插入位点的位置,也就是峰值,合并从正链和负链估计的插入位点,并执行插入位点周围扩展区域的脱靶搜索。
该方法依赖于错误的nhej介导的DNA修复,在基因组内cas9诱导的断点捕获共引入的钝端双链寡核苷酸(dsODNs)。在Cas9诱导的dsb上,GUIDE-seq dsODNs显示高插入频率(高达测量的插入率的50% (Tsai et al., 2015)),因此标记这些位点进行选择性扩增和随后的深度测序。该方法非常敏感,因为可以检测到>0.1% indel频率的脱靶位点,而且dsODN插入的频率似乎与每个位点cas9诱导病变的频率相关(Tsai et al., 2015)。该方法已成功用于评估Cas9及其变体(trui - sgrnas (Tsai等人,2015)或PAM变体(kleinver等人,2015)的精度。由于其良好的性能,GUIDE-seq可能成为核酸酶脱靶分析领域的标准。虽然GUIDE-seq方法使用起来很简单,但迄今为止还没有向社区发布生物信息工具来支持对该数据的分析。
我们开发了GUIDEseq软件包,以方便对GUIDE-seq数据集进行分析,包括每个唯一分子标识符(UMI)保留一个read,过滤reads缺乏整合寡核苷酸序列(dsODNs),识别峰值位置(解理位点)和高度,合并正链和负链的解理位点,以及对输入gRNA进行目标和脱靶搜索。该分析利用我们的ChIPpeakAnno包(Zhu等人,2010)合并正链和负链的裂解位点,利用CRISPRseek包(Zhu等人,2014)定义任何已识别的脱靶位点与引导序列的同源性和Cas9 PAM特异性。
用户界面上的CRISPRSeek允许控制offTargetAnalysis和compare2Sequences,允许您根据您的数据文件更改预设默认值。
首先,选择您想要做的分析,是脱靶分析,比较两个序列,还是GUIDE-seq分析。然后,使用文件上传器上传文件。如果您没有任何文件要上传,则将在分析中使用默认的演示文件。默认输出目录是一个临时目录。
接下来,在主面板和高级设置面板中相应地更改submission面板下的默认设置。单击“提交”继续分析,或单击“将所有字段重置为默认值”重置您更改的所有设置。
分析完成后,您可以通过单击左下方的“download”按钮,并选择要将其保存的位置,以zip文件的形式下载输出数据。
在数据表面板下,在完成对数据的分析之后,将提供示例数据表。对于脱靶分析,示例数据表用于“RE Cut Details”输出。对于比较2个序列,显示的数据表是“2个输入序列的得分”输出文件。最后,对于GUIDE-seq,输出数据表是来自“gRNA Peaks”输出文件的数据。
支持上传的最大文件大小为1gb。应用程序将不接受任何较大的数据。如果没有上传任何文件,演示文件将用于分析。添加大文件可能需要一段时间来上传和分析。参考屏幕顶部的提示,它将告知文件是否仍在被分析,或者分析是否已经完成。