内容

1背景

的目的mimager是简化成像微阵列的过程,并通过提供单一的可视化功能(mimage ()),它与Bioconductor的许多微阵列对象类一致工作。目前,mimager支持AffyBatch对象的affy包,PLMset对象的affyPLM包,ExpressionFeatureSetExonFeatureSetGeneFeatureSet而且SnpFeatureSet类的oligoClasses包,oligoPLM类的益生元包中。

2安装

您可以从Bioconductor安装最新版本的mimager:

如果(!("BiocManager", quiet =TRUE)) install.packages("BiocManager")

3.基本的可视化

在这个小插图中,我们将与稀释affydata包中。

库(mimager)库(affydata)数据(“稀释”)

最基本的功能mimage ()是根据它们在芯片上的物理位置,产生探头级强度的可视化排列:

mimage(稀释,select = 1)

请注意

对于具有完全匹配(PM)和不匹配(MM)探针的微阵列平台,例如本文使用的Affymetrix Human Genome U95v2芯片,默认情况下只包括PM探针。然而,类型参数只能用于选择MM探测(探针=“毫米”)或两者皆可(探针= "所有").由于排除了特定探针类型而导致的大量缺失值会在微阵列图像中产生栅格化伪影,从而降低了图像的信息量。为了弥补这一点,mimage ()用相邻行的值填充空行。默认情况下,如果一行缺少超过60%的值,则认为该行为空。该阈值可以通过设置进行更改empty.thresh或者可以通过更改来完全禁用行填充空的。行=“填满”空的。行= "忽略"

4可视化多个数组

之一mimager的最佳特性是能够同时可视化多个微阵列。简单地通过稀释对象mimage ()将生成一个图像网格,每个图像代表样本中的一个芯片。

mimage(稀释)

图像的顺序由微阵列数据对象中样本的顺序决定。方法可以覆盖此顺序或指定要包含的样本子集选择参数,该参数接受与每个样本的索引对应的数值向量或者是样本名称的字符向量。

mimage ()是否根据当前图形设备的尺寸为图像网格计算合理的布局,或者可以通过设置手动指定nrowncol或两者兼而有之。

mimage(稀释,select = c("10A", "20A", "10B", "20B"), nrow = 1)

5Probe-level线性模型

fitPLM ()函数的affyPLM方案和fitProbeLevelModel ()函数的益生元包都可以用来拟合探测级线性模型(PLMs)。正如Ben Bolstad所演示的(2004),用plm的残差或权重替换原始探测强度可以揭示可能无法检测到的空间伪影。mimager支持可视化由两个包生成的PLM对象。在使用PLM对象(与微阵列对象相反)时,一个显著的区别是类型参数是指模型值类型(即残差或权重)而不是探测类型

库(affyPLM)稀释plm <- fitPLM(稀释)mimage(稀释plm)

6转换

在进行可视化之前,提供的微阵列对象被转换为\(m \乘以n \乘以k\)数组,\ \(米)而且\ (n \)对应于微阵列芯片的物理尺寸和\ (k \)是数据集中的芯片(或样本)的数量。数组值然后由传递给变换论点。例如,默认的ForAffyBatch对象是变换= log2对探测强度进行对数变换。

mimager提供两个转换函数,已证明在识别微阵列上的空间偏差方面很有用。第一,arank (),计算三维数组的每个矩阵中的值的秩益生元包的装饰图案.第二个,arle (),计算相对日志表达式(RLE)值,其中每个值与“标准参考”进行比较,“标准参考”是通过计算每个值在所有样本中的位置的中值来构建的。这种方法在识别空间工件方面的效用首先由Reimers & Weinstein证明(2005)通常会产生与plm类似的结果:

div.colors <- scales::brewer_pal(调色板= "RdBu")(9) mimage(稀释,变换= arle,图例。label = "RLE", colors = div.colors)

任何函数都可以被传递到变换前提是它期望并返回一个三维数组。的arank ()函数是必要的,因为基地:等级()违反这个假设,返回一个数字向量。使用自定义转换函数进行实验marray ()将生物导体微阵列对象转换为三维矩阵阵列。

稀释数组<- marray(稀释)dim(稀释数组)
## [1] 640 640
DilutionRank <- arank(DilutionArray) dim(DilutionRank)
## [1] 640 640

参考文献

Bolstad B.M. 2004。高密度寡核苷酸数据的低水平分析:背景、归一化和总结。加州大学伯克利分校博士论文。

马克·兰斯和约翰·韦恩斯坦,2005。微阵列的质量评估:空间伪影的可视化和区域偏差的量化。BMC生物信息学6(7): 166。https://doi.org/10.1186/1471-2105-6-166