介绍nanostringccset类

从.RCC文件构建nanostringccset

下一步是使用readnanostringccset函数加载RCC、RLF和示例注释文件。您可以将RCC、RLF和示例注释文件保存在一个文件夹中，以便于访问，并将此位置设置为您的datadir。

#设置文件位置datadir < -执行（“extdata”，“3 d_bio_example_data”，包=“NanoStringNCTools”）#读取RCC文件rcc_files < -dir(datadir模式=“SKMEL *。\ \.RCC $”，full.names =真正的）#读取RLF文件rlf_file < -file.path(datadir“3 d_solidtumor_sig.rlf”）#读取示例注释sample_annotation < -file.path(datadir“3 d_solidtumor_phenodata.csv”）#加载所有输入文件到demoData (S4对象)demoData < -readNanoStringRccSet(rcc_filesrlfFile =rlf_file,phenoDataFile =sample_annotation)类(demoData)#> [1] " nanostringccset "# > attr(“包”)#> [1] "NanoStringNCTools"isS4(demoData)#>[1]是真的是(demoData“ExpressionSet”）#>[1]是真的demoData#> nanostringccset (storageMode: lockedEnvironment)#> assayData: 397个特征，12个样本#>元素名称:exprs# > protocolData#> samplnames: SKMEL2-DMSO-8h-R1_04。RCC SKMEL2-DMSO-8h-R2_04。碾压混凝土……# > SKMEL28-VEM-8h-R3_10。RCC(共12个)#> varLabels: FileVersion SoftwareVersion…CartridgeBarcode (17# >总)#> varMetadata: labelDescription# > phenoData#> samplnames: SKMEL2-DMSO-8h-R1_04。RCC SKMEL2-DMSO-8h-R2_04。碾压混凝土……# > SKMEL28-VEM-8h-R3_10。RCC(共12个)#> varLabels:治疗brafgentype#> varMetadata: labelDescription# > featureData#> featurename: Endogenous_TP53_NM_000546.2#> Endogenous_IL22RA2_NM_181310.1…SNV_REF_PIK3CA Ref(外显子#> 10)|hg19|+|chr3:178936060-178936141_nRef_00032.1 (397 total)#> fvarLabels: CodeClass GeneName…BarcodeComments(共10个)#> fvarMetadata: labelDescription#>实验数据:使用'实验数据(对象)'#>注释:3D_SolidTumor_Sig#>签名:无

访问和分配nanostringccset数据成员

加载所有输入文件后，将它们存储在名为demoData的S4对象中。除了与ExpressionSet类相关的访问器外，nanostringccset对象还具有独特的附加赋值和访问器方法，以方便查看nCounter数据和相关标签的通用方法。如果需要，可以将其保存为csv文件。

dimLabels插槽提供列名，分别用作图中的特征和示例的标签。
签名槽包含签名定义
experimentData插槽存储关于实验的结构化信息。
assayData插槽存储表达式值。它可以存储多个计数矩阵。
phenoData插槽存储关于样本的注释数据。您可以将它们作为列添加到注释文件中。
featureData插槽存储有关所使用面板的目标或探测的信息。
注释槽存储RLF数据的名称。
protocolData槽位用于存储测试运行的信息。该信息从RCC文件和您在protocolData参数中指定的注释列中读取。

#访问count矩阵的前两行头（assayData(demoData) [[“exprs”]],2）# > SKMEL2-DMSO-8h-R1_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 347#> Endogenous_IL22RA2_NM_181310.1# > SKMEL2-DMSO-8h-R2_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 601#> Endogenous_IL22RA2_NM_181310.1# > SKMEL2-DMSO-8h-R3_04。RCC SKMEL2-VEM-8h-R1_10。碾压混凝土#> Endogenous_TP53_NM_000546.2 270 588#> Endogenous_IL22RA2_NM_181310.1 2# > SKMEL2-VEM-8h-R2_10。碾压混凝土SKMEL2-VEM-8h-R3_10.RCC#> Endogenous_TP53_NM_000546.2 810 519#> Endogenous_IL22RA2_NM_181310.1 3# > SKMEL28-DMSO-8h-R1_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 609#> Endogenous_IL22RA2_NM_181310.1# > SKMEL28-DMSO-8h-R2_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 722#> Endogenous_IL22RA2_NM_181310.1# > SKMEL28-DMSO-8h-R3_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 608#> Endogenous_IL22RA2_NM_181310.1# > SKMEL28-VEM-8h-R1_10。碾压混凝土#> Endogenous_TP53_NM_000546.2 603#> Endogenous_IL22RA2_NM_181310.1# > SKMEL28-VEM-8h-R2_10。碾压混凝土#> Endogenous_TP53_NM_000546.2 618#> Endogenous_IL22RA2_NM_181310.1# > SKMEL28-VEM-8h-R3_10。碾压混凝土#> Endogenous_TP53_NM_000546.2 519#> Endogenous_IL22RA2_NM_181310.1#访问pheno数据的前两行头（pData(demoData),2）braf基因型# > SKMEL2-DMSO-8h-R1_04。RCC DMSO重量/重量# > SKMEL2-DMSO-8h-R2_04。RCC DMSO重量/重量#访问协议数据protocolData(demoData)注释dataframe类的对象#> samplnames: SKMEL2-DMSO-8h-R1_04。RCC SKMEL2-DMSO-8h-R2_04。碾压混凝土……# > SKMEL28-VEM-8h-R3_10。RCC(共12个)#> varLabels: FileVersion SoftwareVersion…CartridgeBarcode (17# >总)#> varMetadata: labelDescription#访问探测信息的前三行fData(demoData) [1：3.,)#> CodeClass GeneName接入IsControl内源性TP53 NM_000546.2错误#> Endogenous_IL22RA2_NM_181310.1内生IL22RA2 NM_181310.1错误#>内生IL2 NM_000586.2错误# > ControlConc#> Endogenous_TP53_NM_000546.2#> Endogenous_IL22RA2_NM_181310.1 NA#> Endogenous_IL2_NM_000586.2 NA# > TargetSeqggggagcagggccagccacctgaagtccaaaaagggtcagtacctcccgccataaaaaactcatgttcaagacagaagggcctgactcagac#> Endogenous_IL22RA2_NM_181310.1 cacttgcaaccatgatgcctaaacattgctttctaggcttcctcatcagtttcttccactggtagcaggaactcagtcaacgcatgagtctctgaa#> Endogenous_IL2_NM_000586.2 AGGATGCAACTCCTGTCTTGCATTGCACTAAGTCTTGCACTTGTCACAAACAGTGCACCTACTTCAAGTTCTACAAAGAAAACACAGCTACAACTGGAGC#>条形码ProbeID物种BarcodeComments#>内生的BGBRBR NM_181310.1:290 Hs内生的BGBRGR NM_000586.2:300 Hs内生的#访问可用的pheno和协议数据变量svarLabels(demoData)#>[1]“治疗”“BRAFGenotype”“FileVersion”“SoftwareVersion”#>[5]“SystemType”“SampleID”“SampleOwner”“SampleComments”#>[9]“SampleDate”“SystemAPF”“AssayType”“LaneID”#>[13]“FovCount”“FovCount”“ScannerID”“StagePosition”#>[17] "绑定密度" "墨盒id " "墨盒条形码"头（sData(demoData),2）braf基因型FileVersion软件版本# > SKMEL2-DMSO-8h-R1_04。RCC DMSO重量/重量1.7 4.0.0.3# > SKMEL2-DMSO-8h-R2_04。RCC DMSO重量/重量1.7 4.0.0.3#> SystemType SampleID# > SKMEL2-DMSO-8h-R1_04。碾压混凝土Gen2 SKMEL2-DMSO-8hr DNA-RNA-Protein# > SKMEL2-DMSO-8h-R2_04。碾压混凝土Gen2 SKMEL2-DMSO-8hr DNA-RNA-Protein#> SystemAPF AssayType LaneID FovCount# > SKMEL2-DMSO-8h-R1_04。碾压混凝土2017-01-13 n6_vDV1  4 280# > SKMEL2-DMSO-8h-R2_04。碾压混凝土2017-02-07 n6_vDV1  4 280#> fovcounts ScannerID StagePosition绑定密度# > SKMEL2-DMSO-8h-R1_04。RCC 268 1207c0049 3 0.80# > SKMEL2-DMSO-8h-R2_04。RCC 280 1207c0049 6 1.03#>卡带条码# > SKMEL2-DMSO-8h-R1_04。RCC AGBT-3DBio-C1-SKMEL2# > SKMEL2-DMSO-8h-R2_04。碾压混凝土AGBT-3DBio-3-C1-SKMEL2#访问RLF信息注释(demoData)#> [1] "3D_SolidTumor_Sig"

设计信息可以分配给nanostringccset对象，以及用于nanostringccset绘图方法的特征和示例标签。

#分配设计信息设计(demoData) < -～｀治疗｀设计(demoData)# > ~治疗#检查列名，分别用作特征和示例的标签dimLabels(demoData)#>[1]“GeneName”“SampleID”#更改SampleID为SampleIDprotocolData(demoData) [[“样本ID”]] < -sampleNames(demoData)dimLabels(demoData) [2) < -“样本ID”dimLabels(demoData)#> [1] "GeneName" "样本ID"

汇总NanoString nCounter数据

用户可以使用汇总方法轻松地汇总计数结果。数据摘要可以跨特征或样本生成。标签可用于生成基于特征或样本分组的摘要。

裕度:1(循环遍历特征)或2(循环遍历样本)。
GROUP:按组总结。
log2=TRUE:汇总统计数据为阈值为0.5的几何平均值，大小因子(2^(MeanLog2意思是(MeanLog2))，阈值为0.5的Log2的平均值，阈值为0.5的Log2的标准差，最小值，第一四分位数，中位数，第三四分位数和最大值。
log2=FALSE:汇总统计数据是平均值，标准偏差，偏度，过剩峰度，最小值，第一四分位数，中位数，第三四分位数和最大值。

# summary log2为每个特性计数头（总结(demoData利润=1)，2）#> GeomMean SizeFactor MeanLog2 SDLog2 Min#> Endogenous_TP53_NM_000546.2 547.134439 5.88657439 9.095752 0.4357479#> Endogenous_IL22RA2_NM_181310.1 4.842601 0.05210115 2.275782 1.1326693#> Q1中位数Q3最大值#> Endogenous_TP53_NM_000546.2 519.00 602 611.25 81011 . #> Endogenous_IL22RA2_NM_181310.1 2.75 6 9.25# summary log2为每个样本计数头（总结(demoData利润=2)，2）#> GeomMean SizeFactor MeanLog2 SDLog2 Min Q1中位数# > SKMEL2-DMSO-8h-R1_04。碾压混凝土81.91473 0.8813138 6.356051 3.548682 0 11 42# > SKMEL2-DMSO-8h-R2_04。碾压混凝土111.61733 1.2008817 6.802417 3.571600 2 13 54#> Q3 Max# > SKMEL2-DMSO-8h-R1_04。RCC 525 30467# > SKMEL2-DMSO-8h-R2_04。RCC 786 79362#检查治疗组的唯一水平独特的（sData(demoData)＄“治疗”）#>[1]“dmso”“vem”对于每个VEM样本，# summary log2计数头（总结(demoData利润=2，组=“治疗”）＄, VEM2）#> GeomMean SizeFactor MeanLog2 SDLog2 Min Q1中位数# > SKMEL2-VEM-8h-R1_10。碾压混凝土105.0406 1.113396 6.714804 3.543809 0 14 52# > SKMEL2-VEM-8h-R2_10。碾压混凝土105.2725 1.115854 6.717985 3.652488 1 11 56#> Q3 Max# > SKMEL2-VEM-8h-R1_10。RCC 789 40330# > SKMEL2-VEM-8h-R2_10。RCC 1004 44614对于每个DMSO样本，# summary log2计数头（总结(demoData利润=2，组=“治疗”）＄“DMSO”，2）#> GeomMean SizeFactor MeanLog2 SDLog2 Min Q1中位数# > SKMEL2-DMSO-8h-R1_04。碾压混凝土81.91473 0.8945544 6.356051 3.548682 0 11 42# > SKMEL2-DMSO-8h-R2_04。碾压混凝土111.61733 1.2189233 6.802417 3.571600 2 13 54#> Q3 Max# > SKMEL2-DMSO-8h-R1_04。RCC 525 30467# > SKMEL2-DMSO-8h-R2_04。RCC 786 79362# summary为每个DMSO样本计数，不包含log2转换头（总结(demoData利润=2，组=“治疗”，log2 =假）＄“DMSO”，2）#>平均SD偏度峰度最小Q1中位数Q3# > SKMEL2-DMSO-8h-R1_04。碾压混凝土13.3.5.766 3763.740 4.327986 21.46799 0 11 42 525# > SKMEL2-DMSO-8h-R2_04。碾压混凝土1828.778 6226.835 7.636919 75.77340 2 13 54 786# >马克斯# > SKMEL2-DMSO-8h-R1_04。碾压混凝土30467# > SKMEL2-DMSO-8h-R2_04。碾压混凝土79362

Subsetting nanostringccset对象

nanostringccset对象提供了常见的子集设置方法，包括从控件中分离内生特征的方法。此外，用户可以使用子集或选择参数分别按特征或样本进一步进行子集。

#检查数据集中样本的数量长度（sampleNames(demoData))#> [1]#检查数据集中VEM样本的数量长度（sampleNames（子集(demoData选择=phenoData(demoData) [[“治疗”]]= =“VEM”）））#> [1]#检查表达式矩阵的维数昏暗的（exprs(demoData))#> [1] 397 12仅检查VEM样本和内源性基因的表达矩阵的尺寸昏暗的（exprs（endogenousSubset(demoData选择=phenoData(demoData) [[“治疗”]]= =“VEM”）））#> [1] 180# housekeeping子集()只选择管家基因与（housekeepingSubset(demoData),表格(CodeClass))# > CodeClass# >家政# > 12# negativecontrol子集()只选择负探测与（negativeControlSubset(demoData),表格(CodeClass))# > CodeClass# >负# > 6# positivecontrol子集()只选择正探测与（positiveControlSubset(demoData),表格(CodeClass))# > CodeClass# >积极# > 6# control子集()选择所有的控件探测与（controlSubset(demoData),表格(CodeClass))# > CodeClass#>家政阴性蛋白细胞正常蛋白阴性#> 12 6 12#>阳性SNV_INPUT_CTL SNV_NEG SNV_PCR_CTL#> 6 3 6 3#> snv_pos snv_udg_ctl#> 6# noncontrol子集()选择所有非控件探测与（nonControlSubset(demoData),表格(CodeClass))# > CodeClass内源蛋白SNV_REF SNV_VAR#> 180 26 40 104

negativecontrol子集函数对数据对象进行了子集化，只包括具有Negative Code Class的探测。
您可以在featureData插槽中看到代码类信息。

neg_set < -negativeControlSubset(demoData)类(neg_set)#> [1] " nanostringccset "# > attr(“包”)#> [1] "NanoStringNCTools"

应用功能跨分析数据

类似于ExpressionSet的esApply函数，nanostringccset对象也有一个等效的方法。函数可以应用于分析数据特征或样本。

使用assayDataApply函数将作为计数矩阵的对数计算的demoElem数据添加到demoData中。来自eSet的访问函数assayDataElement返回对象的assayData槽中的矩阵元素。

边距:1(在特征上循环)或2(在样本上循环)。
FUN:你想要应用在数据上的函数，例如log, mean等。
elt:指的是你想在demoData中应用的元素。

#计算每个样本的基因表达的对数计数assayDataElement(demoData“demoElem”) < -assayDataApply(demoData利润=2，有趣的=日志,基础=10，英语教学=“exprs”）assayDataElement(demoData“demoElem”) [1：3.，1：2］# > SKMEL2-DMSO-8h-R1_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 2.540329#> Endogenous_IL22RA2_NM_181310.1 0.698970#> Endogenous_IL2_NM_000586.2 0.301030# > SKMEL2-DMSO-8h-R2_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 2.7788745#> Endogenous_IL22RA2_NM_181310.1 0.9542425#> Endogenous_IL2_NM_000586.2 0.9030900#计算每个特性的日志计数的平均值assayDataApply(demoData利润=1，有趣的=的意思是,英语教学=“demoElem”) [1：5］#> Endogenous_TP53_NM_000546.2 Endogenous_IL22RA2_NM_181310.1#> 2.7380941 0.6850787#> Endogenous_IL2_NM_000586.2 Endogenous_CCR5_NM_000579.1#> 0.5595554 -Inf# > Endogenous_PRLR_NM_001204318.1# > 0.9411847#按Treatment分割数据，并计算每个特征的日志计数的平均值头（里(demoData组=“治疗”，有趣的=函数(x) {assayDataApply(x,利润=1，有趣的=的意思是,英语教学=“demoElem”）}))#> dmso vem#> Endogenous_TP53_NM_000546.2 2.6962710 2.7799171#> Endogenous_IL22RA2_NM_181310.1 0.5927171 0.7774403#> Endogenous_IL2_NM_000586.2 0.4808935 0.6382173#> Endogenous_CCR5_NM_000579.1 -Inf 0.7821118#> Endogenous_PRLR_NM_001204318.1 1.0082754 0.8740940#> Endogenous_LIF_NM_002309.3 1.8067671 1.4661876

nanostringccset类中还有一个预加载的nCounter归一化方法。这包括nSolver中执行的默认归一化。

Type:对象的数据类型。可能是RNA，蛋白质。
fromELT:要规范化的assayDataElement的名称。
toELT:存储规范化值的assayDataElement的名称。

demoData < -正常化(demoData类型=“nSolver”，fromELT =“exprs”，toELT =“exprs_norm”）assayDataElement(demoData英语教学=“exprs_norm”) [1：3.，1：2］# > SKMEL2-DMSO-8h-R1_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 8.753132#> Endogenous_IL22RA2_NM_181310.1 2.895151#> Endogenous_IL2_NM_000586.2 1.895151# > SKMEL2-DMSO-8h-R2_04。碾压混凝土#> Endogenous_TP53_NM_000546.2 8.983110#> Endogenous_IL22RA2_NM_181310.1 3.071419#> Endogenous_IL2_NM_000586.2 2.919416

下面是nanostringccset自动绘图方法生成的无监督聚类树状图的对数规范化数据的热图。热图的每一行代表一个基因，每一列代表一个样本。用户可以通过设置不同的参数自定义热图。

类型:参考要生成的图的类型，在本例中为“热图-基因”。
Elt:表达式矩阵的名称，即用于生成图形的数据。
heatmapGroup:将pData列引用到热图中的颜色样本中。
Show_colnames_gene_limit:确定要按列显示的特征数量。在这种情况下，样本数量大于限制，将不显示列名。
Show_rownames_gene_limit:决定按行显示的特征数量。在这种情况下，基因数量大于限制，将不显示行名。
Log2scale:表示表达式数据以log2为刻度

autoplot(demoData类型=“heatmap-genes”，英语教学=“exprs_norm”，heatmapGroup =c（“治疗”，“BRAFGenotype”)，show_colnames_gene_limit =10，show_rownames_gene_limit =40，log2scale =假）

将nanostringccset数据转换为数据帧

nanostringccset munge函数帮助用户生成用于下游建模和可视化的数据帧。这将可用的特性和示例组合成一个长格式。还有一个transform方法，其功能类似于基本转换函数。

#将负探测和表达式结合在一起neg_ctrls < -munge(neg_set～exprs)头(neg_ctrls2）#> FeatureName SampleName exprs#> 1 Negative_NEG_C(0)_ERCC_00019.1 SKMEL2-DMSO-8h-R1_04。RCC 9#> 2 Negative_NEG_D(0)_ERCC_00076.1 SKMEL2-DMSO-8h-R1_04RCC 9类(neg_ctrls)#> [1] "data.frame"#将表达式与所有特征组合头（munge(demoData～exprs),2）#> FeatureName SampleName exprsSKMEL2-DMSO-8h-R1_04碾压混凝土347SKMEL2-DMSO-8h-R1_04碾压混凝土5#结合映射数据集，将基因表达式存储为矩阵munge(demoData映射=～｀BRAFGenotype｀+GeneMatrix)#>数据帧12行2列#> brafgenematrix#> <字符> <矩阵># > SKMEL2-DMSO-8h-R1_04。RCC wt/wt 37:5:2:…# > SKMEL2-DMSO-8h-R2_04。RCC wt/wt 601:9:8:…# > SKMEL2-DMSO-8h-R3_04。RCC wt/wt 270:2:1:…# > SKMEL2-VEM-8h-R1_10。RCC wt/wt 588:10:5:…# > SKMEL2-VEM-8h-R2_10。RCC wt/wt 810:3:5:…#> ... ... ...# > SKMEL28-DMSO-8h-R2_04。RCC mut/mut 722:5:3:…# > SKMEL28-DMSO-8h-R3_04。RCC mut/mut 608:1:4:…# > SKMEL28-VEM-8h-R1_10。RCC mut/mut 603:11:6:…# > SKMEL28-VEM-8h-R2_10。RCC mut/mut 618:10:9:…# > SKMEL28-VEM-8h-R3_10。RCC mut/mut 519:7:1:…#将基因表达转化为标准化计数exprs_df < -变换（assayData(demoData) [[“exprs_norm”]])类(exprs_df)#> [1] "data.frame"exprs_df [1：3.，1：2］# > SKMEL2.DMSO.8h.R1_04.RCC#> Endogenous_TP53_NM_000546.2 8.753132#> Endogenous_IL22RA2_NM_181310.1 2.895151#> Endogenous_IL2_NM_000586.2 1.895151# > SKMEL2.DMSO.8h.R2_04.RCC#> Endogenous_TP53_NM_000546.2 8.983110#> Endogenous_IL22RA2_NM_181310.1 3.071419#> Endogenous_IL2_NM_000586.2 2.919416

内置质量控制评估

在一项研究中，质量控制指标被用于评估nCounter分析的技术性能。用户可以根据管家和ERCC表达、成像质量、结合密度标记未达到QC阈值的样本或具有边缘结果。首先，管家基因通过比较观察值与数据分析适用性的预定阈值来评估样本的完整性。机器的性能是通过尝试的视场与成功分析的视场的百分比来评估的。探针在成像区域内的结合密度、ERCC线性度和检测极限被用作测定化学效率和特异性的读数。任何被认为不合格的样品将被从分析中移除。

此外，可以使用nanostringccset自动绘图方法可视化QC结果。

类型:引用要生成的图的类型。
qcCutoffs:你也可以在autoplot函数中设置qcCutoffs。由于它已在setQCFlags函数中设置，因此不需要在自动绘图中再次设置此参数。

#使用setSeqQCFlags函数来设置数据集的排序QC标志。函数中显示默认的截止时间。demoData < -setQCFlags(demoDataqcCutoffs =列表（管家=c（failingCutoff =32，passingCutoff =One hundred.)，成像=c（fovCutoff =０．７５)，BindingDensity =c（minimumBD =0．1，maximumBD =2.25，maximumBDSprint =1．8)，ERCCLinearity =c（correlationValue =0.95)，ERCCLoD =c（standardDeviations =2）））#显示数据中最后6个列名尾巴（svarLabels(demoData))#>[1] "绑定密度" "墨盒id " "墨盒条形码"#> [4] "Sample ID" "QCFlags" "QCBorderlineFlags"#显示QC标志结果的前两行头（protocolData(demoData) [[“QCFlags”]],2）#>成像绑定线性LoD管家# > SKMEL2-DMSO-8h-R1_04。碾压混凝土假假假假假# > SKMEL2-DMSO-8h-R2_04。碾压混凝土假假假假假#显示QC Borderline Flags结果的前两行头（protocolData(demoData) [[“QCBorderlineFlags”]],2）#>成像绑定线性LoD管家# > SKMEL2-DMSO-8h-R1_04。碾压混凝土假假假假假# > SKMEL2-DMSO-8h-R2_04。碾压混凝土假假假假假

管家基因QC

HK基因QC图显示了每个样本中管家基因的几何平均值。每个点代表这个图中的一个样本。样本id标记在x轴上。管家基因对应的几何均值在y轴上。如果您将鼠标悬停在一个点上，您可以找到示例名称及其几何平均值。管家信号低的样品要么输入量低，要么反应效率低。理想情况下，所有样品的计数几何平均值应在100以上，分析需要至少32个计数的几何平均值。介于这两个阈值之间的样本在分析中被考虑，但来自这些“边缘”样本的结果应谨慎对待。在这种情况下，所有的样品都在100以上，所以他们都通过了Housekeeping Genes QC。

#设置字体为Arialtheme_set（theme_gray（base_family =“天线”）)girafe（ggobj =autoplot(demoData类型=“housekeep-geom”）)

您可以使用子集函数使用数据的子集生成QC图。下面的HK基因QC图只包含处理DMSO的样本。

subData < -子集(demoData选择=phenoData(demoData) [[“治疗”]]= =“DMSO”）girafe（ggobj =autoplot(subData类型=“housekeep-geom”）)

装订密度QC

结合密度表示仪器测量到的每平方微米条形码的浓度。QC图中的每个点代表一个样本。x轴标记样品的巷号，y轴标记样品的结合密度。如果您将鼠标悬停在一个点上，它将显示其Sample ID, lane ID和绑定密度。如果存在太多探针，数字分析仪可能无法将每个探针与其他探针区分开来。在nCounter MAX或FLEX系统上运行的分析的理想范围是0.1 - 2.25点每平方微米，在nCounter SPRINT系统上运行的分析应该有0.1 - 1.8点每平方微米的范围。在这种情况下，所有的样品都在理想范围内，所以它们都通过了Binding Density QC。

girafe（ggobj =autoplot(demoData类型=“lane-bindingDensity”）)

成像质量控制

成像QC度量报告了数字分析仪或SPRINT能够捕获的视场(fov)的百分比。每个点代表一个样本。车道id标记在x轴上，计算的FOV在y轴上。如果你将鼠标悬停在一个点上，它将显示它的样本ID，车道ID和计算FOV。至少75%的fov应该成功获得可靠的数据。在本例中，所有样品都通过了75%的阈值，因此它们都通过了Imaging QC。

girafe（ggobj =autoplot(demoData类型=“lane-fov”）)

线性度QC

ERCC线性QC度量在表达式值的Log(2)转换后执行相关分析。图中的每条线代表一个样本。x轴表示浓度，y轴表示基因表达量。如果将鼠标悬停在一条线上，它将显示样品ID，浓度，基因表达和相关性。通过NanoString添加的阳性对照目标分子的已知浓度与结果Log(2)计数之间的相关性进行了测试。相关值低于0.95可能表明杂交反应和/或检测性能存在问题。在这种情况下，所有样本的相关值都大于或等于0.95，因此它们都通过了ERCC线性QC。

girafe（ggobj =autoplot(demoData类型=“ercc-linearity”）)

Ercc lod qc

比较了阳性对照探针和阴性对照探针的ERCC检测限。具体来说，预计0.5 fM阳性控制探针(Pos_E)产生的原始计数至少比阴性控制探针的平均值高两个标准差(由箱线图表示)。图中的每个点代表一个样本。x轴显示样本id, y轴显示Pos_E的原始计数。如果您将鼠标悬停在一个点上，它将显示示例ID及其Pos_E计数。每个样本的临界值用红色水平线表示。在这种情况下，所有样品都通过了LOD QC。

girafe（ggobj =autoplot(subData类型=“ercc-lod”）)

数据探索

进一步的数据探索可以通过可视化选定特征的表情或通过无监督聚类树状图自动生成的表情热图来进行鸟瞰。

girafe（ggobj =autoplot(demoData，“boxplot-feature”，指数=featureNames(demoData) [3.),英语教学=“exprs”))

autoplot(demoData， "heatmap-genes"， elt = " exps_norm ") #> log2t中的警告(scores): NaNs在网格中生成#>警告。调用(C_textBounds, as.graphicsAnnot(x$label)， x$x, x$y，: font #>家族'Arial'没有在PostScript字体数据库中找到# >Warning in grid.Call(C_textBounds, as.graphicsAnnot(x$label), x$x, x$y, : font #> family 'Arial' not found in PostScript font database

sessionInfo（）#> R正在开发中(不稳定)(2022-10-25 r83175)#>平台:x86_64-pc-linux-gnu(64位)运行在Ubuntu 22.04.1 LTS下# >矩阵产品:默认值#> BLAS: /home/biocbuild/bbs-3.17-bioc/R/lib/libRblas.so#> LAPACK: /usr/lib/x86_64-linux-gnu/ LAPACK /liblapack.so.3.10.0# ># >语言环境:#> [1] LC_CTYPE=en_US。utf - 8 LC_NUMERIC = C#> [3] LC_TIME=en_GB LC_COLLATE=C#> [5] LC_MONETARY=en_US。utf - 8 LC_MESSAGES = en_US。utf - 8#> [7] LC_PAPER=en_US。utf - 8 LC_NAME = C#> [9] lc_address = c lc_phone = c#> [11] LC_MEASUREMENT=en_US。utf - 8 LC_IDENTIFICATION = C# >#>附加基础包:#> [1] stats4 stats graphics grDevices utils数据集方法#>[8]基地# >#>其他附加包:#> [1] pheatmap_1.0.12 ggiraph_0.8.3 ggthemes_4.2.4#> [4] NanoStringNCTools_1.7.0 ggplot2_3.3.6 S4Vectors_0.37.0#> [7] Biobase_2.59.0 BiocGenerics_0.45.0# >#>通过命名空间加载(并且没有附加):#> [1] gtable_0.3.1 beeswarm_0.4.0 xfun_0.34#> [4] bslib_0.4.0 htmlwidgets_1.5.4 vctrs_0.5.0#> [7] tools_4.3.0 bitops_1.0-7 generics_0.1.3#> [10] tibble_1 .1.8 fansi_1.0.3 highr_0.9 . ##> [13] pkgconfig_2.0.3 RColorBrewer_1.1-3 assertthat_0.2.1#> [16] uuid_1.1-0 lifecycle_1.0.3 GenomeInfoDbData_1.2.9 . ##> [19] farver_2.1.1 compiler_4.3.0 string_1 .4.1#> [22] Biostrings_2.67.0 munsell_0.5.0 vipor_0.4.5#> [25] GenomeInfoDb_1.35.0 htmltools_0.5.3 sass_0.4.2#> [28] RCurl_1.98-1.9 yaml_2.3.6 pillar_1.8.1#> [31] crayon_1.5.2 jquerylib_0.1.4 cachem_1.0.6#> [34] tidyselect_1.2.0 digest_0.6.30 stringi_1.7.8#> [37] dplyr_1.0.10 purrr_0.3.5 labeling_0.4.2#> [40] fastmap_1.1.0 grid_4.3.0 colorspace_2.0-3#> [43] cli_3.4.1 magrittr_2.0.3 utf8_1.2.2#> [46] withthr_2 .5.0 scales_1.2.1 ggbeeswarm_0.6.0#> [49] rmarkdown_2.17 XVector_0.39.0 evaluate_0.17#> [52] knitr_1.40 IRanges_2.33.0 rlang_1.0.6#> [55] Rcpp_1.0.9 glue_1.6.2 DBI_1.1.3#> [58] jsonlite_1.8.3 R6_2.5.1 systemfonts_1.0.4#> [61] zlibbioc_1.45.0

David Henderson, Patrick Aboyoun, Nicole Ortogero, zhiyang, Jason Reeves, Kara Gorman, Rona Vitancol, Thomas Smith, Yuqi Ren

2022-11-01

简介

装包