库(NanoMethViz)库(dplyr)
# # # #附加包:“dplyr”
# #以下对象是蒙面的包:OrganismDbi: # # # #选择
# #以下对象是蒙面的包:GenomicRanges: # # # #相交,setdiff,联盟
# #以下对象是蒙面的包:GenomeInfoDb: # # # #相交
# #以下对象是蒙面的包:AnnotationDbi: # # # #选择
# #以下对象是蒙面的包:IRanges: # # # #崩溃,desc,相交,setdiff,切片,联盟
# #以下对象是蒙面的包:S4Vectors: # # # #首先,相交,重命名,setdiff setequal、工会
# #以下对象是蒙面的包:Biobase: # # # #结合
# #以下对象是蒙面的包:BiocGenerics: # # # #结合,相交,setdiff,联盟
# #以下对象是蒙面的包:统计数据:# # # #过滤器,滞后
# #以下对象从包:基地的蒙面:# # # #相交,setdiff setequal、工会

进口的注释

这个包与进口外显子辅助函数注释来自Bioconductor包Homo.sapiensMus.musculus。的函数get_exons_homo_sapiens ()get_exons_mus_musculus ()简单的把数据从各自的包和重组的列,这样我们有7个列

这是用来提供基因注释的基因或地区的情节。

对于其他注解,他们最有可能能够被导入使用rtracklayer:进口()和操作所需的格式。作为一个例子,我们可以使用一个小样本提供的秀丽隐杆线虫基因注释的运用。rtracklayer将进口的注释吗农庄对象,这可以强迫data.frame以内写上使用dplyr

伊斯兰教纪元< - rtracklayer:进口(系统。文件(包= " NanoMethViz”、“c_elegans.gtf.gz”))头(伊斯兰教纪元)
与6 # #农庄对象范围和13元数据列:# # seqnames范围链|源类型分阶段# # < Rle > < IRanges > < Rle > | <因素> <因素> <数字> <整数> # #第四[1]9601517 - 9601695 | WormBase外显子NA < NA > # #第四[2]9601040 - 9601345 | WormBase外显子NA < NA > # #第四[3]9600828 - 9600953 | WormBase外显子NA < NA > # #第四[4]9600627 - 9600780 | WormBase外显子NA < NA > # #第四[5]9600002 - 9600392 | WormBase外显子NA < NA > # #第四[6]9599702 - 9599873 | WormBase外显子NA < NA > # # gene_id transcript_id exon_number gene_name gene_source # # <人物> <人物> <人物> <人物> <人物> # # [1]WBGene00000002 F27C8.1.1 1 aat-1 WormBase # # [2] WBGene00000002 F27C8.1.1 2 aat-1 WormBase # # [3] WBGene00000002 F27C8.1.1 3 aat-1 WormBase # # [4] WBGene00000002 F27C8.1.1 4 aat-1 WormBase # # [5] WBGene00000002 F27C8.1.1 5 aat-1 WormBase # # [6] WBGene00000002 F27C8.1.1 6 aat-1 WormBase # # gene_biotype transcript_source transcript_biotype exon_id # # <人物> <人物> <人物> <人物> # # [1]protein_coding WormBase protein_coding F27C8.1.1。e1 # # [2] protein_coding WormBase protein_coding F27C8.1.1。e2 # # [3] protein_coding WormBase protein_coding F27C8.1.1。e3 # # [4] protein_coding WormBase protein_coding F27C8.1.1。e4 # # [5] protein_coding WormBase protein_coding F27C8.1.1。e5 # # [6] protein_coding WormBase protein_coding F27C8.1.1。e6 # # - - - - - - - # # seqinfo: 3因基因组序列;没有seqlengths
庵野< -伊斯兰教纪元% > % as.data.frame () % > % dplyr::重命名(= seqnames,从而向符号= gene_name) % > % dplyr::选择(gene_id,空空的,链,开始、结束transcript_id,符号)头(伊斯兰教纪元)
# # gene_id对应链开始结束transcript_id符号# # 1 WBGene00000002 IV - 9601517 9601695 F27C8.1.1 aat-1 # # 2 WBGene00000002 IV - 9601040 9601345 F27C8.1.1 aat-1 # # 3 WBGene00000002 IV - 9600828 9600953 F27C8.1.1 aat-1 # # 4 WBGene00000002 IV - 9600627 9600780 F27C8.1.1 aat-1 # # 5 WBGene00000002 IV - 9600002 9600392 F27C8.1.1 aat-1 # # 6 WBGene00000002 IV - 9599702 9599873 F27C8.1.1 aat-1

选择注释

注释可以简化如果全外显子和同种型信息不是必需的。例如,genebody注释可以表示成单外显子基因。例如我们可以Peg3同种型注释的示例数据集和变换成一个genebody块。辅助函数exons_to_genes ()可以帮助这种常见的转换。

核磁共振< - load_example_nanomethresult () plot_gene(核磁共振,“Peg3”)

new_exons < - NanoMethViz:外显子(nmr) % > % exons_to_genes() % > %变异(transcript_id = gene_id) NanoMethViz::外显子(nmr) < - new_exons plot_gene(核磁共振,“Peg3”)