BRGenomics 1.11.0
DESeq2对数据的默认处理依赖于这样一个假设,即基因方面的离散度估计在样本中基本没有变化。虽然这一假设适用于典型的RNA-seq数据,但如果在样本范围内存在样本,则可能违反这一假设DESeqDataSet
对象,对于该对象,在大多数感兴趣的区域都有有意义的信号变化。
BRGenomics的功能getDESeqDataSet ()
而且getDESeqResults ()
是简单而灵活的包装器,用于在单个样本之间进行成对比较,而不依赖于全球相似的分散估计假设。特别是,getDESeqResults ()
遵循数据集存在的逻辑\ \ (X)在DESeqDataSet
对象将不会影响数据集的比较\ (Y \)而且\ (Z \).
虽然上面的直觉很吸引人,但用户应该注意,如果全球相似的分散假设做如果保持不变,那么DESeq2的默认行为在估计基因离散度时应该更加敏感。在这种情况下,用户仍然可以利用BRGenomics功能的便利getDESeqDataSet ()
,但他们应该随后打电话DESeq2: DESeq ()
而且DESeq2:结果()
直接。
如果违反了全局相似色散假设,但需要进行简单的成对比较(例如组比较或额外的模型术语)之外的东西,我们注意到,通过一些窥探,可以使用DESeq2而不需要“盲色散估计”(参见DESeq2手册)。
就像生成批处理规范化尖峰规范化因子的函数一样,面向deseq的函数要求输入数据集的名称以“rep1”
,“rep2”
等。
让我们先制作一个包含多个数据集的玩具列表进行比较:
库(BRGenomics)数据(“PROseq”)
ps_list < -拉普(1:6,函数(i) PROseq (seq(我、长度(PROseq), 6)])名称(ps_list) < - c(“A_rep1”、“A_rep2”、“B_rep1”、“B_rep2”、“C_rep1”、“C_rep2”)
ps_list [1:2]
## seqnames ranges strand | score ## | ## [1] chr4 1295 + | 1 ## [2] chr4 42595 + b| 1 ## [3] chr4 42622 + | 2 ## [4] chr4 42718 + | 1 ## [5] chr4 42789 + | 1 ## ... ... ... ... . ...# # [7893] chr4 1295277 - | 1 # # [7894] chr4 1306500 - | 1 # # [7895] chr4 1306889 - | 1 # # [7896] chr4 1307122 - | 1 # # [7897] chr4 1316537 - | 1 ## ------- ## seqinfo: 7因基因组序列# # # # 7897 A_rep2 # #农庄组织对象范围和1元数据列:# # seqnames范围链|得分# # < Rle > < IRanges > < Rle > | <整数> # # [1]chr4 41428 + | 1 # # [2] chr4 42596 + | 1 # # [3] chr4 42652 + | 3 # # [4] chr4 42733 + | 1 # # [5] chr4 42794 + | 2 ## ... ... ... ... . ...## [7893] chr4 1305972 - | 1 ## [7894] chr4 1306514 - | 1 ## [7895] chr4 1307032 - | 1 ## [7896] chr4 1307126 - | 1 ## [7897] chr4 1318960 - | 1 ## ------- # seqinfo:来自未指定基因组的7个序列
名(ps_list)
# #[1]“A_rep1”“A_rep2”“B_rep1”“B_rep2”“C_rep1”“C_rep2”
如您所见,这些名称都以“repX”结尾,其中X表示复制。复制将按照“rep”后面的任何内容进行分组。如果样品名称不符合本标准,将予以处理sample_names
参数可用于将调用中的示例重命名为getDESeqDataSet ()
.
数据(“txs_dm6_chr4”)
dds <- getDESeqDataSet(ps_list, txs_dm6_chr4, gene_names = txs_dm6_chr4$gene_id, ncores = 1
##类:DESeqDataSet ## dim: 111 6 ##元数据(1):版本## assays(1):计数## rownames(111): FBgn0267363 FBgn0266617…FBgn0039924 FBgn0027101 ## rowData names(2): tx_name gene_id ## colnames(6): A_rep1 A_rep2…C_rep1 C_rep2 ## colData names():条件复制
注意昏暗的
属性。DESeqDataSet
对象是c (111 6)
.有6个样本,但是长度(txs_dm6_chr4)
不是111。这是因为我们提供了基因名称getDESeqDataSet ()
,它们不是唯一的。这里利用的特性是用于不连续基因区,而不是多重重叠的转录异构体.
默认情况下,getDESeqDataSet ()
将结合属于一个基因的所有范围的计数,但如果它们重叠,它们将被计数两次。有关处理与重叠相关的问题,请参见reduceByGene ()
而且intersectByGene ()
功能。
我们可以在调用中添加标准化因子,DESeq2称之为“大小因子”getDESeqDataSet ()
,或者我们可以提供给getDESeqResults ()
在下面。(提供两次将覆盖之前的大小因子)。
关于归一化因子的重要说明:DESeq2“大小因子”是逆的归一化因子。如果你计算归一化因子- getSpikeInNFs(…)
,设置sizeFactors <- 1/NF
.
生成DESeq2结果很简单:
getDESeqResults (dds,对比。count = "B",对比度.denom = "A", quiet = TRUE, ncores = 1)
log2倍变化(MLE):条件B vs A Wald测试p值:条件B vs数据帧111行6列## baseMean log2FoldChange lfcSE stat pvalue padj ## <数字> <数字> <数字> <数字> <数字> <数字> <数字> > ## FBgn0267363 0.252443 -1.4201507 4.997269 -0.2841853 0.776268 0.990374 ## FBgn0266617 9.648855 -0.4357749 0.983164 -0.4432374 0.657594 0.990374 ## FBgn0264617 67.131764 0.0245325 0.451334 0.0543584 0.853819 0.990374 ## FBgn0085432 4688.232636 -0.04698120.270431 -0.1737268 0.862080 0.990374 ## ... ... ... ... ... ... ...## FBgn0039928 653.783 -0.00994936 0.262637 -0.0378825 0.969781 0.990374 ## FBgn0052017 114.906 0.02350299 0.369082 0.3636796 0.949225 0.990374 ## FBgn0002521 168.778 0.05777885 0.347249 0.1663903 0.867850 0.990374 ## FBgn0039924 170.213 -0.20850730 0.409865 -0.5087219 0.610947 0.990374 ## FBgn0027101 343.009 -0.21151750 0.290061 -0.7292177 0.65868 0.990374
我们也可以通过忽略contrast.numer
而且contrast.denom
参数,而不是使用比较
论点。结果列表根据比较来命名:
comparison_list <- list(c("B", "A"), c(" c ", "A"), c(" c ", "B")) dsres <- getDESeqResults(dds, comparison = comparison_list, quiet = TRUE, ncores = 1) names(dsres)
## [1] "B_vs_A" "C_vs_A" "C_vs_B"
安全域C_vs_B美元
log2倍变化(MLE):条件C vs b# # Wald测试p值:条件C vs B ##数据帧111行6列## baseMean log2FoldChange lfcSE stat pvalue padj ## <数字> <数字> <数字> <数字> <数字> <数字> ## FBgn0267363 0.00000 NA NA NA NA NA NA NA ## FBgn0266617 9.38822 0.3938871 0.901764 0.662259 0.998692 ## fbgn0266633 2.28968 -0.3206785 1.718554 -0.186598 0.851976 0.998692 ## FBgn0264617 65.30695 -0.0773192 0.415908 -0.185905 0.852520 0.998692 ## FBgn0085432 4281.29059 -0.1902162 0.229704 - 0.407617 0.998692 ##... ... ... ... ... ... ...## FBgn0039928 696.482 0.2150507 0.248408 0.386646 0.998692 ## FBgn0052017 133.743 0.4160583 0.333948 1.2458762 0.258762 0.998692 ## fbgn002521 171.141 0.0159143 0.323995 0.0491188 0.960825 0.998692 ## FBgn0027101 347.104 0.2699312 0.271542 0.9940675 0.320190 0.998692