本实验的目的是研究疟疾寄生虫恶性疟原虫在整个生命周期中基因表达的进化。RNA在生命周期的几个关键阶段提取:早期环,晚期环,早期滋养体,晚期滋养体,早期裂殖体,晚期裂殖体和裂殖子。这项实验是由加州斯克里普斯研究所的伊丽莎白·温泽勒实验室完成的。
CEL文件可以从http://carrier.gnf.org/publications/CellCycle和(感谢Ken Simpson), CDF包可以从http://bioinf.wehi.edu.au/affylmGUI/malaria.
要开始使用affylmGUI,您需要创建一个RNA Targets文件,这是一个以制表符分隔的文本文件,有三列:Name, FileName和Target:
affylmGUI的主窗口如下所示。
点击File菜单中的“New”开始新的分析。
选择包含CEL文件和Targets文件的目录。
使用“Select Targets file”按钮指定目标文件。
为数据集输入名称。
从“正常化”菜单中选择“正常化”。
选择“RMA”作为归一化方法。要做到这一点,必须在R中安装CDF包。
现在通过从“线性模型”菜单中选择“计算线性模型拟合”来计算线性模型拟合。对于Affymetrix(单通道)芯片,设计矩阵是自动确定的,因此您不会被问及任何关于线性模型的问题。
从“线性模型”菜单中选择“计算对比度”。
定义对比,可以使用下拉组合框,也可以单击“高级”,手动输入对比矩阵,或者从制表符分隔的文本文件中加载。
给这组对比起个名字。
在“TopTable”菜单中选择“基因差异表达排序表”。
选择“按时间顺序”对比参数化。
选择裂殖子与晚期裂殖子的对比。
让基因排序选项保持默认设置。
这种差异表达的基因如下表所示。可以使用“文件”菜单将它们保存为制表符分隔的文本,然后在Excel中打开。
在“Plot”菜单中,选择“MA Plot”(作为一个对比)。
再次选择“按时间顺序”对比参数化。
再次选择裂殖子和晚期裂殖子的对比。
使用探针集id标记前10个差异表达最多的基因,因为我们没有这个芯片的注释包,所以我们不能使用Gene Symbols。
您可以自定义图的标题和轴标签。
结果图如下所示。被选为差异表达的基因可能没有最极端的折叠变化,因为线性建模技术考虑了复制芯片之间的可变性以及平均折叠变化。
我们现在演示如何创建HTML报告。这是我们之前准备的:
在“文件”菜单中选择“导出HTML报告”。
选择要包含在HTML报告中的内容。
选择要包含在HTML报告中的图像的大小、字体大小和背景颜色。
为HTML报告指定一个名称。
果不其然!