内容

1概述

“间隔的投影(扫描)”是使用相对代表生物序列的方法,它使用spacedwords概念通过扫描序列和生成索引创建higherdimensional面向随机向量后投射到一个更小的标准正交基。这个函数是适合做高质量的对比序列允许分析不可能由于计算传统技术的局限性。可用的方法扫描(PIERRI, 2019)。这个工具主要速度增益constanci处理时间。响应时间线性输入的数量增长,而在其他方法生长exponencial。

1.1功能

包有两个功能:orthBase,生成一个正交矩阵的选择大小,扫描,一个函数,应用扫描方法

2快速启动

orthBase函数可以创建一个quasi-orthonormal矩阵任意大小。这是用来创建一个矩阵项目扫描方法,所以它必须160.000行和列的大小希望投影。

库(rSWeeP) baseMatrix < - orthBase(160000年,10)

exdna.fas数据集由三个字符串列表的模拟DNA序列仅用于演示目的。

路径< -系统。文件(包=“rSWeeP”、“extdata”、“exdna.fas”)

然后扫描法和返回一个矩阵表示序列相比,矢量方法。然后可以看到种系发生树中的图示法

返回< -扫描(路径,baseMatrix) distancia < -区域(返回、方法=“欧几里得”)树< - hclust (distancia、方法=“ward.D”)情节(树,挂= 1,cex = 1)

3会话信息

# # R正在开发的(不稳定的)(2022-10-25 r83175) # #平台:x86_64-pc-linux-gnu(64位)# #下运行:Ubuntu 22.04.1 LTS # # # #矩阵产品:默认# #布拉斯特区:/home/biocbuild/bbs - 3.17 - bioc / R / lib / libRblas。所以# # LAPACK: /usr/lib/x86_64-linux-gnu / LAPACK liblapack.so.3.10.0 # # # #语言环境:# # [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC = C # #[3]而= en_GB LC_COLLATE = C # # [5] LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # # [7] LC_PAPER = en_US。utf - 8 LC_NAME = C # # [9] LC_ADDRESS C = C LC_TELEPHONE = # # [11] LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C附加基本包:# # # # # #[1]统计图形grDevices跑龙套数据集方法基础# # # #其他附加包:# # [1]rSWeeP_1.11.0 BiocStyle_2.27.0 # # # #通过加载一个名称空间(而不是附加):# # [1]crayon_1.5.2 cli_3.4.1 knitr_1.40 # # [4] magick_2.7.3 rlang_1.0.6 xfun_0.34 # # [7] highr_0.9 stringi_1.7.8 jsonlite_1.8.3 # # [10] S4Vectors_0.37.0 rcurl_1.98 - 1.9 Biostrings_2.67.0 # # [13] htmltools_0.5.3 pracma_2.4.2 stats4_4.3.0 # # [16] sass_0.4.2 rmarkdown_2.17 evaluate_0.17 # # [19] jquerylib_0.1.4 bitops_1.0-7 fastmap_1.1.0 # # [22] GenomeInfoDb_1.35.0 IRanges_2.33.0 yaml_2.3.6 # # [25] bookdown_0.29 BiocManager_1.30.19 stringr_1.4.1 # # [28] compiler_4.3.0 Rcpp_1.0.9 XVector_0.39.0 # # [31] digest_0.6.30 R6_2.5.1 GenomeInfoDbData_1.2.9 # # [34] magrittr_2.0.3 bslib_0.4.0 tools_4.3.0 # # [37] zlibbioc_1.45.0 BiocGenerics_0.45.0 cachem_1.0.6

4引用