在本文档中,我们提出一个工作流的保留时间对齐多个Targeted-MS(例如DIA, SWATH-MS、人口、难民和移民事务局、SRM)使用DIAlignR运行。这个工具需要一份色谱和提供了一个混合方法的全局和局部比对山峰之间建立对应关系。

0.1安装DIAlignR

如果(!requireNamespace (“BiocManager”,悄悄地= TRUE)) install.packages (“BiocManager”) BiocManager::安装(“DIAlignR”)
库(DIAlignR)

0.2输入文件准备对齐

质谱仪文件主要包含光谱。针对蛋白质组学工作流identifyies色谱洗脱剖面的分析物。DIAlignR扩展相同的概念对保留时间(RT)对齐,因此,依靠一份色谱图。DIAlignR预计原始色谱文件(.chrom.mzML)和FDR-scored特性(.osw)文件。
示例文件可以用这个包,可以使用这个命令:

dataPath公司< -系统。文件(“extdata”,包=“DIAlignR”)
(可选)来获取文件对齐,需要三个步骤:
  • 第一步从特定于供应商的光谱文件格式转换成标准mzMl格式使用ProteoWizard-MSConvert
  • 步骤2中提取特征和生extracted-ion色谱分析物(XICs)图书馆。使用的详细教程OpenSWATH这个步骤是可用的。简而言之,后bash可以使用命令:
OpenSwathWorkflow——Filename.mzML。广州tr图书馆。药品资格预审规划-tr_irt iRTassays。TraML -out_osw文件名。osw-out_chrom Filename.chrom.mzML
输出文件Filename.oswFilename.chrom.mzML需要下一个步骤。目前一些色谱以压缩的形式存储并inaccesiblemzR。在这种情况下mzR抛出一个错误指示吗无效的cvParam加入“1002746”。为了避免这个问题,解压使用OpenMS色谱。
FileConverter——Filename.chrom。mzML -in_type mzML治疗Filename.chrom.mzML
  • 步骤3:分数特性和计算他们的q值。基于机器学习的工作流是可用的PyProphet。建议对multiplt-runs experiment-wide罗斯福。的一个实例上运行pyprophet OpenSWATH结果如下所示:
pyprophet合并——模板=图书馆。药品资格预审规划——=合并。osw *。oswpyprophet score --in=merged.osw --classifier=XGBoost --level=ms2 --xeval_num_iter=3 \ --ss_initial_fdr=0.05 --ss_iteration_fdr=0.01 pyprophet peptide --in=merged.osw --context=experiment-wide
恭喜!现在我们有原始色谱文件和相关的功能合并。osw文件。将所有.chrom。mzML文件xics目录和合并。osw文件osw目录中。作为父文件夹dataPath公司DIAlignR功能。

0.3在DIA运行执行对齐

alignTargetedRuns将蛋白质组学和代谢组学DIA运行功能。预计两个目录“osw”和“xics”dataPath公司。它输出一个强度表行指定每个分析物和列指定运行。使用参数saveFiles = TRUE要对齐retetion时间和强度保存在当前目录。

< - c (“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”、“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”)参数< - paramsDIAlignR () params[[“上下文”]]< -“experiment-wide”#为特定的运行提供他们的名字。alignTargetedRuns (dataPath公司= dataPath公司外部档案=”测试。csv”=运行,运行oswMerged = TRUE, params = params) #所有分析物在所有运行时,保持为零。alignTargetedRuns (dataPath公司= dataPath公司外部档案=”测试。csv”,运行= NULL, oswMerged = TRUE, params =参数)

0.4调查分析物的一致性

获得对齐对象对齐的XICs指数getAlignObjs可以使用函数。像以前的功能,预计两个目录“osw”和“xics”dataPath公司。它执行对齐为2分。在的情况下refRun不提供,m-score从osw文件用于选择参考。

< - c (“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”、“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”) AlignObjLight < - getAlignObjs(分析物= 4618 l =运行运行,dataPath公司= dataPath公司objType =“轻”,params = params) # > [1]“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”# > [2]“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”# >[1]“找到参考使用SCORE_PEPTIDE表运行”#第一个元素包含运行的名字,光谱文件、色谱文件和特性文件。AlignObjLight [[1]] [c (“runName”、“spectraFile”)] # > runName # > run1 hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt # > run2 hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt # > spectraFile # > /生/ hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt.mzML run1数据。广州# > /生/ hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt.mzML run2数据。广州obj < - AlignObjLight [[2]] [[4618]] [[1]] [[“AlignObj”]] slotNames (obj) # > [1]“indexA_aligned”“indexB_aligned”“分数”名称(as.list (obj)) # > [1]“indexA_aligned”“indexB_aligned”“分数”AlignObjMedium < - getAlignObjs(分析物= 4618 l =运行运行,dataPath公司= dataPath公司objType =“媒介”,params = params) # > [1]“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”# > [2]“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”# >[1]“找到参考使用SCORE_PEPTIDE表运行”obj < - AlignObjMedium [[2]] [[4618]] [[1]] [[“AlignObj”]] slotNames (obj) # > [1]“s”“路径”“indexA_aligned”“indexB_aligned”# >[5]“分数”

对齐对象有槽* indexA_aligned一致指数参考色谱。* indexB_aligned一致指数实验色谱*分数累积分数的对齐到一个索引。* s相似性得分矩阵。*一致通过的路径路径相似性得分矩阵。

0.5图可视化对齐的色谱图

我们可以想象色谱使用对齐plotAlignedAnalytes。数字实验unaligned-XICs顶端,中间一个是参考XICs,最后图是实验运行对齐参考。

< - c (“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”、“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”) AlignObj < - getAlignObjs(分析物= 4618 l =运行运行,dataPath公司= dataPath公司,params = params) # > [1]“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”# > [2]“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”# >[1]“找到参考使用SCORE_PEPTIDE表运行”plotAlignedAnalytes (AlignObj annotatePeak = TRUE) # >警告:删除30行(s)含有缺失值(geom_path)。

0.6可视化对齐路径

我们也可以使用可视化定位路径plotAlignemntPath函数。

运行库(晶格)< - c (“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”、“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”) AlignObjOutput < - getAlignObjs(分析物= 4618 l =运行,运行params = params, dataPath公司= dataPath公司objType =“介质”)# > [1]“hroest_K120809_Strep0%PlasmaBiolRepl2_R04_SW_filt”# > [2]“hroest_K120809_Strep10%PlasmaBiolRepl2_R04_SW_filt”# >[1]“找到参考使用SCORE_PEPTIDE表运行”plotAlignmentPath (AlignObjOutput)

0.7引用

古普塔年代,阿哈迪年代,周W,罗斯特h .“DIAlignR提供了精确的遥远的印度和保留时间的一致性目标蛋白质组学。“摩尔细胞蛋白质组学。2019年4月,18 (4):806 - 817。doi:https://doi.org/10.1074/mcp.TIR118.001132

0.8会话信息

以下4.4.1 sessionInfo () # > R版本(2021-08-10)# >平台:x86_64-pc-linux-gnu(64位)# >下运行:Ubuntu 20.04.3 LTS # > # >矩阵产品:默认# >布拉斯特区:/home/biocbuild/bbs - 3.14 - bioc / R / lib / libRblas。所以# > LAPACK: /home/biocbuild/bbs - 3.14 - bioc / R / lib / libRlapack。所以# > # >语言环境:# > [1]LC_CTYPE = en_US。utf - 8 LC_NUMERIC c# = >[3]而= en_GB LC_COLLATE = c# > [5] LC_MONETARY = en_US。utf - 8 LC_MESSAGES = en_US。utf - 8 # > [7] LC_PAPER = en_US。utf - 8 LC_NAME c# = > [9] LC_ADDRESS = C LC_TELEPHONE = C # > [11] LC_MEASUREMENT = en_US。utf - 8 LC_IDENTIFICATION = C # > # >附加基本包:# >[1]统计图形grDevices跑龙套数据集方法基础# > # >其他附加包:# > [1]lattice_0.20-45 DIAlignR_2.2.0 BiocStyle_2.22.0 # > # >加载通过名称空间(而不是附加):# > [1]Rcpp_1.0.7 ape_5.5 tidyr_1.1.4 # > [4] png_0.1-7 zoo_1.8-9 assertthat_0.2.1 # > [7] digest_0.6.28 utf8_1.2.2 R6_2.5.1 # > [10] signal_0.7-7 RSQLite_2.2.8 evaluate_0.14 # > [13] pracma_2.3.3 highr_0.9 ggplot2_3.3.5 # > [16] pillar_1.6.4 rlang_0.4.12 data.table_1.14.2 # > [19] jquerylib_0.1.4 blob_1.2.2 phangorn_2.7.1 # > [22] magick_2.7.3 Matrix_1.3-4 reticulate_1.22 # > [25] rmarkdown_2.11 labeling_0.4.2 stringr_1.4.0 # > [28] igraph_1.2.7 bit_4.0.4 munsell_0.5.0 # > [31] compiler_4.1.1 xfun_0.27 pkgconfig_2.0.3 # > [34] RMSNumpress_1.0.1 htmltools_0.5.2 tidyselect_1.1.1 # > [37] gridExtra_2.3 tibble_3.1.5 bookdown_0.24 # > [40] quadprog_1.5-8 codetools_0.2-18 fansi_0.5.0 # > [43] crayon_1.4.1 dplyr_1.0.7 MASS_7.3-54 # > [46] grid_4.1.1 nlme_3.1 - 153 jsonlite_1.7.2 # > [49] gtable_0.3.0 lifecycle_1.0.1 DBI_1.1.1 # > [52] magrittr_2.0.1 scales_1.1.1 stringi_1.7.5 # > [55] cachem_1.0.6 farver_2.1.0 latticeExtra_0.6-29 # > [58] bslib_0.3.1 ellipsis_0.3.2 generics_0.1.1 # > [61] vctrs_0.3.8 fastmatch_1.1-3 RColorBrewer_1.1-2 # > [64] tools_4.1.1 bit64_4.0.5 glue_1.4.2 # > [67] purrr_0.3.4 jpeg_0.1-9 parallel_4.1.1 # > [70] fastmap_1.1.0 yaml_2.2.1 colorspace_2.0-2 # > [73] BiocManager_1.30.16 memoise_2.0.0 knitr_1.36 # > [76] sass_0.4.0