库(BiocStyle)库(HPAanalyze)图书馆(宠物猫)图书馆(dplyr)库(ggplot2)

1总结

  • 背景:人类的蛋白质图谱计划旨在通过多种技术,包括成像映射人类蛋白质,蛋白质组学、转录组。
  • 结果:HPAanalyze是一个R包从HPA检索和执行探索性数据分析。它提供了功能导入数据表和xml文件从HPA,出口和可视化数据,以及下载所有染色图像感兴趣的。这个包是免费的,开放源码,可以通过Github。
  • 结论:HPAanalyze集到R工作流通过tidyverse哲学和数据结构,可用于结合Bioconductor包方便HPA数据的分析。

关键词:人类蛋白质图谱,蛋白质组学,智人,可视化,软件

2背景

人类的蛋白质图谱(HPA)是一个全面的资源勘探的人类蛋白质组包含大量的蛋白质组学、转录组数据生成的基于抗体的组织微阵列分析和RNA深度排序。

程序生成的蛋白质表达谱在人体正常组织细胞特定类型表达模式,癌症和通过一个创新的immunohistochemistry-based方法细胞系。这些资料都伴随着大量的高质量的组织学染色图片,带注释的临床数据和量化。蛋白质的数据库还包括分类功能类(如转录因子或激酶)和项目相关类(如癌症)的候选基因。从4.0版开始,HPA包括亚细胞位置概要文件生成的基于共焦图像immunofluorescent染色细胞。在一起,这些数据提供了一个详细的图片的蛋白表达在人类细胞和组织,促进组织的诊断和研究。

HPA通过proteinatlas.org网站免费提供的数据,允许科学家访问和数据合并到他们的研究。在此之前,R包hpar已经创建了HPA数据的快速和容易的编程访问。在这里,我们介绍HPAanalyze,R包旨在简化探索性数据分析与数据,以及提供其他辅助功能hpar

2.1不同的下丘脑-垂体-肾上腺轴的数据格式

人类蛋白质图谱计划提供数据主要通过两种机制:完整的数据集的形式下载压缩制表符分隔的文件(. tsv)和单独的条目在XML、RDF和TSV格式。完整的下载数据集包括正常组织,病理(癌症),亚细胞位置和RNA表达数据。单个条目的XML格式是最全面的,提供信息在目标蛋白质,抗体,总结为每个组织从每个样本包括临床数据和详细的数据,包含IHC得分和图像下载链接。

2.2HPAanalyze概述

HPAanalyze设计完成了三个主要任务:(1)进口,构造子集和导出下载数据集;(2)下载数据集的可视化的探索性分析;(3)使用单独的XML文件。这个方案的目的是为研究人员提供编程经验,但也允许高级用户使用导入的数据。

HPAanalyze工作流。

图1:HPAanalyze工作流

2.2.1获得HPAanalyze

稳定的版本HPAanalyze应该从Bioconductor下载:

如果(!requireNamespace (“BiocManager”,悄悄地= TRUE)) install.packages (“BiocManager”) BiocManager::安装(“HPAanalyze”)

的开发版本HPAanalyze可以在Github可以安装:

devtools: install_github (“anhtr / HPAanalyze”)

请列举:Tran, Dussaq, Kennell T,开松机C, Hjelmeland。HPAanalyze: R包,促进了人类的蛋白质图谱数据的检索和分析。bioRxiv 355032;doi:https://doi.org/10.1101/355032

3完整的数据集进口、构造子集和出口

hpaDownload ()从下丘脑-垂体-肾上腺轴功能下载完整的数据集(具体地说,上述. tsv格式)和进口成R的宠物猫,标准的对象tidyverse随后,子集hpaSubset ()和出口到.xlsx文件hpaExport ()。标准对象允许导入的数据进一步处理在传统的R工作流。快速和导出数据子集的能力让研究人员可以选择使用其他模拟下游工具,比如GraphPad创造可发布图形,或共享数据的一个子集只包含感兴趣的蛋白质。

你可以跳过这一节如果你只关心可视化,除非你需要一个特定版本的下丘脑-垂体-肾上腺轴的数据集,或RNA表达数据集。

3.1下载并导入数据hpaDownload ()

这个函数应该首先使用。它给你一个列表,包含指定的数据集的数据帧,然后可以给其他函数在这个包中。

#这应该给你最新的东西,但是,除非你有大量的内存和处理能力,我不会推荐它。downloadedData < - hpaDownload (downloadList = '所有')总结(downloadedData) # >长度类模式# > normal_tissue 6 # tbl_df列表>病理学11 tbl_df列表14 # > subcellular_location tbl_df # >…

3.1.1“组织学”数据集

大多数时候,你只需要“组织学”数据集,其中包含normal_tissue,病理学(基本上癌症)subcellular_location

downloadedData < - hpaDownload (downloadList =组织学,version =“示例”)# version =“例子”将负载内置的数据集。满足正常使用,节省您的一些时间。

normal_tissue数据集包含蛋白质表达谱信息基于包含IHC染色的人体组织。数据集包含六个列:运用(运用基因标识符);基因(HGNC符号),组织(组织名称);cell_type(带注释的细胞类型);水平(表达式值);可靠性(基因表达值的可靠性)。

宠物猫::一瞥(downloadedData normal_tissue美元,give.attr = FALSE) # >行:1193218 # >列:6 # >运用美元<科>“ENSG00000000003”、“ENSG00000000003”、“ENSG00000000003”,“…# > $基因”<科> TSPAN6”、“TSPAN6”、“TSPAN6”、“TSPAN6”、“TSPAN6”、“TSPAN6“…# >组织<科>美元”脂肪组织”、“肾上腺”、“附件”、“附录”,cell_type美元…# > <科>“组织”、“腺体细胞、腺体细胞”、“淋巴…# >美元水平<科>“不检测”、“不检测”、“中等”、“不检测”,…# >美元可靠性<科>“批准”,“批准”、“批准”、“批准”、“批准”…

病理学数据集包含的信息在人类肿瘤组织蛋白表达谱基于包含IHC染色。数据集包含11列:运用(运用基因标识符);基因(HGNC符号);癌症(癌症类型);,媒介,,not_detected(带注释的不同染色水平的患者数量);prognostic_favorable,unprognostic_favorable,prognostic_unfavorable,unprognostic_unfavorable病人生存和信使rna (log-rank p值相关性)。

宠物猫::一瞥(downloadedData病理学美元,give.attr = FALSE) # >行:401800 # >列:11 # >运用美元<科>“ENSG00000000003”、“ENSG00000000003”、“ENSG00…# >美元基因”<科> TSPAN6”、“TSPAN6”、“TSPAN6”、“TSPAN6”、“TSPA…# >美元癌症<科>“乳腺癌”、“良性肿瘤”、“颈通过…# > < int >高1美元,0,0,10 0,0,4,8,0,0,8日,11日,5日…# >中的< int > 7美元,1,1,,2,0,3,5,4 0,1,3,1、6、4…# > < int >低2美元,1 0 2 0,0,1,1,0,0,0,0,0,1,not_detected美元…# > < int > 2 2 0 2 0, 0, 0, 0, 11日9,0,0,0,5美元…# > prognostic_favorable <科>钠,钠,钠,钠,钠,钠,钠,钠,钠,钠,钠,N…# >美元unprognostic_favorable <科>”7.712依照“,NA,“依照8.967”、“3.562依照“,NA,“…# >美元prognostic_unfavorable <科>钠,钠,钠,钠,钠,钠,钠,钠,钠,钠,钠,N…# >美元unprognostic_unfavorable <科> NA, NA, NA, NA,“2.567 e 1”, NA,“5.932依照“N…

subcellular_location数据集包含的蛋白质亚细胞定位信息基于如果起动正常细胞。数据集包含11列:运用(运用基因标识符);基因(HGNC符号);可靠性(基因可靠性得分);增强(增强位置);支持(支持位置);批准(批准的位置);不确定的(不确定位置);single_cell_var_intensity(位置与单细胞的变化强度);single_cell_var_spatial(位置与空间单细胞变化);cell_cycle_dependency(位置观察到细胞周期依赖性);go_id(基因本体蜂窝组件标识符)。

宠物猫::一瞥(downloadedData subcellular_location美元,give.attr = FALSE) # >行:13041 # >列:14 # >运用美元<科>“ENSG00000000003”、“ENSG00000000457”、“ENSG0…# >美元基因”<科> TSPAN6”、“SCYL3”、“C1orf112”、“FGR”、“CFH”…# > $可靠性<空空的> "批准”、“不确定”、“批准”、“Approv main_location美元…# > <科>“细胞连接;胞质”,“微”、“M…# >美元additional_location <科>”核仁纤维中心”、“核身体…# >美元extracellular_location <科> NA, NA, NA, NA,分泌的“预测”,…# >美元增强<科> NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,支持美元…# > <科> NA, NA, NA, NA, NA, NA,“核浆”,NA, N…# >美元批准<科>“细胞连接,细胞溶质,核仁纤维c…# >美元不确定<科> NA,“微管;核体”,NA, NA, N…# >美元single_cell_var_intensity <科>”胞质”,NA, NA, NA, NA,“胞质;Nucleopl…# >美元single_cell_var_spatial <科>钠,钠,钠,钠,钠,钠,钠,钠,钠,钠,钠,…# >美元cell_cycle_dependency <科> NA, NA, NA, NA, NA, NA, NA, NA, NA NA NA,…# > $ go_id <科>”细胞连接(去:0030054);细胞溶质(000年:…

3.1.2RNA的数据集

HPA提供大量的RNA表达数据集。可以找到更多细节https://www.proteinatlas.org/about/download。如何下载这些数据集,请参阅帮助页面hpaDownload:

hpaDownload ?

有快捷键下载多个RNA的数据集,例如:

downloadedData < - hpaDownload (downloadList =组织rna)宠物猫::一瞥(downloadedData give.attr = FALSE) # >列表4 # > $ rna_tissue_consensus:宠物猫(1180464 * 4)(S3: tbl_df /台/ data.frame) # > . .运用:美元对应[1:1180464]“ENSG00000000003”“ENSG00000000003”“ENSG00000000003”“ENSG00000000003”…# > . .吉恩:美元对应[1:1180464]“TSPAN6”“TSPAN6”“TSPAN6”“TSPAN6”…# > . .组织:美元对应[1:1180464]“脂肪组织”“肾上腺”“杏仁核”“附录”…# > . .$ nx:科(1:1180464)“27.0”“9.8”“7.0”“4.4”……# > $ rna_tissue_hpa:宠物猫(845810 x 6] (S3: tbl_df /台/ data.frame) # > . .运用:美元对应[1:845810]“ENSG00000000003”“ENSG00000000003”“ENSG00000000003”“ENSG00000000003”…# > . .$ gene : chr [1:845810] "TSPAN6" "TSPAN6" "TSPAN6" "TSPAN6" ... #> ..$ tissue : chr [1:845810] "adipose tissue" "adrenal gland" "appendix" "B-cells" ... #> ..$ tpm : chr [1:845810] "31.5" "26.4" "9.2" "0.1" ... #> ..$ ptpm : chr [1:845810] "37.7" "32.7" "14.5" "0.2" ... #> ..$ nx : chr [1:845810] "9.8" "7.6" "2.1" "0.3" ... #> $ rna_tissue_gtex : tibble [639,744 x 6] (S3: tbl_df/tbl/data.frame) #> ..$ ensembl: chr [1:639744] "ENSG00000000003" "ENSG00000000003" "ENSG00000000003" "ENSG00000000003" ... #> ..$ gene : chr [1:639744] "TSPAN6" "TSPAN6" "TSPAN6" "TSPAN6" ... #> ..$ tissue : chr [1:639744] "adipose tissue" "adrenal gland" "amygdala" "basal ganglia" ... #> ..$ tpm : chr [1:639744] "27.4" "15.5" "7.3" "7.7" ... #> ..$ ptpm : chr [1:639744] "34.2" "18.8" "9.0" "9.4" ... #> ..$ nx : chr [1:639744] "13.4" "9.8" "7.0" "6.6" ... #> $ rna_tissue_fantom : tibble [797,265 x 6] (S3: tbl_df/tbl/data.frame) #> ..$ ensembl : chr [1:797265] "ENSG00000000003" "ENSG00000000003" "ENSG00000000003" "ENSG00000000003" ... #> ..$ gene : chr [1:797265] "TSPAN6" "TSPAN6" "TSPAN6" "TSPAN6" ... #> ..$ tissue : chr [1:797265] "adipose tissue" "amygdala" "appendix" "basal ganglia" ... #> ..$ tags_per_million : chr [1:797265] "60.1" "10.7" "13.5" "16.2" ... #> ..$ scaled_tags_per_million: chr [1:797265] "87.4" "12.4" "17.8" "18.0" ... #> ..$ nx : chr [1:797265] "27.0" "3.5" "4.4" "5.5" ...

3.2可用的参数列表构造子集hpaListParam ()

看看参数可用于后续的构造子集/可视化,HPAanalyze包括函数hpaListParam ()。这个函数的输入是输出的hpaDownload

如果你离开这个论点空白,这个函数会给你内置的数据集的结果。

# #如果你使用的输出hpaDownload () downloadedData <——hpaDownload (downloadList = c(“正常组织”、“病理学”,“RNA HPA组织”,“RNA HPA细胞系”))str (hpaListParam (downloadedData)) # 4 # $ normal_tissue:列表的列表2 # . .组织:美元对应[1:63]“脂肪组织”“肾上腺”“附录”“骨髓”…# . .$ cell_type:空空的[1:120]“组织”“腺体细胞”“淋巴组织”“造血细胞”…# $病理学:列表1 # . .癌症:美元对应[1:20]“乳腺癌”“良性肿瘤”“宫颈癌”“直肠癌”…# $ rna_tissue_hpa:列表1 # . .组织:美元对应[43]“脂肪组织”“肾上腺”“附录”“b细胞”…# $ rna_celline:列表1 # . .$ cell_line:空空的[1:69]“a - 431”“A549”“AF22”“AN3-CA”…

3.3数据子集hpaSubset ()

hpaSubset ()过滤器的输出hpaDownload ()为理想的目标基因,组织,细胞,癌症和细胞系。适用的数据将只在子集(即。normal_tissue不会子集癌症)。的主要目的hpaSubset是准备一套可控的数据被导出。然而,这个函数也可以用于其他数据表操作的目的。的输入targetGene的参数是一个字符串向量HGNC符号。

如果你离开数据论证空白,这个函数会自动子集内置的数据集,这可能不包含所有可用的列如果你下载数据hpaDownload ()

downloadedData < - hpaDownload (downloadList =组织学,version =“示例”)酸式焦磷酸钠(downloadedData nrow) # > normal_tissue病理学subcellular_location # > 1193218 401800 13041
geneList < - c (TP53,表皮生长因子受体,CD44,‘PTEN’,‘IDH1’,‘IDH2’,‘本体’)tissueList < - c(“乳房”,“小脑”,“皮肤1”)cancerList < - c(“乳腺癌”,神经胶质瘤,黑色素瘤)cellLineList < - c (‘a - 431’,‘A549’,‘AF22’,‘AN3-CA’) subsetData < - hpaSubset(数据= downloadedData targetGene = geneList targetTissue = tissueList targetCancer = cancerList targetCellLine = cellLineList)酸式焦磷酸钠(subsetData nrow) # > normal_tissue病理学subcellular_location # > 126年21日7

3.4出口数据hpaExport ()

顾名思义,hpaExport ()出口的输出hpaSubset ()一个.xlsx文件或多个. csv或. tsv文件。每个数据集都是放置在一个单独的表。

hpaExport (subsetData文件名= '子集。xlsx”,文件类型=“xlsx”)

4可视化

HPAanalyze能够迅速从HPA下载数据集的可视化数据hpaVis家庭功能。这些函数的目的是帮助一群目标基因的探索性分析,这对获得的见解可能特别有用途径或感兴趣的基因签名。

hpaVis共享一个共同的语法功能,输入(数据论点)的输出hpaDownload ()hpaSubset ()(尽管他们做自己的子集,所以没有必要使用hpaSubset ()除非你想减少你的数据对象)的大小。根据功能,目标争论会让你选择可视化基因的载体,组织,细胞类型等。(参见帮助文件的更多细节)。所有的hpaVis函数生成标准ggplot2阴谋,这允许您进一步定制颜色和主题。颜色可能通过改变颜色论点,而也许重载通过设置默认主题customTheme参数

目前,normal_tissue,病理学subcellular_location数据可视化,更多的功能计划在将来的版本中。

的所有功能hpaVis家庭,如果你离开数据论点空白,他们将情节默认内置的数据集。

4.1雨伞的功能hpaVis ()

hpaVis将情节默认所有可用的土地。详见快速启动装饰图案。

hpaVis (downloadedData targetGene = c (“GCH1”、“分”、“SPR”,“DHFR”), targetTissue = c(“小脑”,“大脑皮层”,“海马”),targetCancer = c(神经胶质瘤))

4.2可视化组织数据hpaVisTissue ()

hpaVisTissue ()生成一个“热图”,感兴趣的蛋白质的表达(量化包含IHC染色)为每个细胞类型的每个组织策划。

geneList < - c (TP53,表皮生长因子受体,CD44,‘PTEN’,‘IDH1’,‘IDH2’,‘本体’)tissueList < - c(“乳房”,“小脑”,“皮肤1”)hpaVisTissue (downloadedData, targetGene = geneList targetTissue = tissueList)

4.3在癌症与可视化表达hpaVisPatho ()

hpaVisPatho ()生成一个数组的列图显示每个癌症蛋白质的表达的兴趣。

这个示例还演示图形的颜色可以定制的,这是一种常见的功能hpaVis家庭。

geneList < - c (TP53,表皮生长因子受体,CD44,‘PTEN’,‘IDH1’,‘IDH2’,‘本体’)cancerList < - c(“乳腺癌”、“神经胶质瘤”,“淋巴瘤”、“前列腺癌”)colorGray < - c (‘slategray1’,‘slategray2’,‘slategray3’,‘slategray4’) hpaVisPatho (downloadedData, targetGene = geneList targetCancer = cancerList颜色= colorGray)

4.4可视化数据与亚细胞位置hpaVisSubcell ()

hpaVisSubcell ()生成一个瓷砖图表显示蛋白质的亚细胞位置(批准和支持)。

这个示例还展示了定制输出的情节与ggplot2功能,这是适用于所有hpaVis功能。请注意,customTheme参数设置为真正的

geneList < - c (TP53,表皮生长因子受体,CD44,‘PTEN’,‘IDH1’,‘IDH2’,‘本体’)hpaVisSubcell (downloadedData, targetGene = geneList customTheme = TRUE) + ggplot2:: theme_minimal () + ggplot2:: ylab(“亚细胞位置”)+ ggplot2:: xlab(蛋白质)+ ggplot2::主题(axis.text。x = element_text(角= 45,hjust = 1) + ggplot2::主题(legend.position =“没有”)+ ggplot2:: coord_equal ()

5个人下载xml导入和图像

hpaXml家庭功能导入和从HPA提取数据从单个XML条目。的hpaXmlGet ()功能下载和进口数据作为“xml_document”/“xml_node”对象,可随后被其他处理hpaXml功能。HPA的XML格式包含丰富的信息,可能不是由这个包。然而,用户可以从导入的XML文件中提取感兴趣的任何数据使用xml2包。

一个典型的工作流处理XML文件包括以下步骤:(1)下载并导入XML文件hpaXmlGet ();(2)与其他提取所需的信息hpaXml函数;和(3)下载组织学染色图片,目前支持的hpaXmlTissurExpr ()hpaXmlTissueExprSum ()功能。

5.1伞的功能hpaXml

hpaXml将一个运用基因id(开始吗ENSG)和提取所有可行的信息。你也可以喂ourput hpaXmlGet。看到快速启动装饰图案为更多的细节。

表皮生长因子受体< - hpaXml (inputXml = ENSG00000146648)名称(EGFR) # > [1]“ProtClass”“TissueExprSum”“抗体”“TissueExpr”

5.2导入xml文件hpaXmlGet ()

hoaXmlGet ()函数接受一个运用基因id(开始ENSG)和角度的XML文件导入到r .这个函数调用xml2: read_xml ()引擎盖下面,因此生成的对象可能会进一步处理xml2如果需要的函数。

EGFRxml < - hpaXmlGet (“ENSG00000146648”)

5.3视图蛋白质类hpaXmlProtClass ()

蛋白质类的查询可以从进口中提取XMLhpaXmlProtClass ()。这个函数的输出是一个宠物猫4列:id,的名字,parent_id

hpaXmlProtClass (EGFRxml) # > #宠物猫:40 x 4 # > id名称parent_id源# > <空空的> <空空的> <空空的> <科> # > 1 Ez酶< NA > < NA > # > 2 Ec Ez酶蛋白质酶3 # >等转移酶Ec酶# > 4 Ki激酶Ez UniProt # > 5 Kt酪氨酸蛋白激酶Ki UniProt马# > 6预测膜蛋白< NA > MDM # > 7 Md膜蛋白预测的MDM < NA > MDM # > 8我MEMSAT3预测膜蛋白< NA > MEMSAT3 # > 9 Mf MEMSAT-SVM预测膜蛋白< NA > MEMSAT-SVM # > 10毫克Phobius预测膜蛋白< NA > Phobius # > #……30多行

5.4得到总结和组织的形象表达hpaXmlTissueExprSum ()

这个函数hpaXmlTissueExprSum ()提取摘要的表达蛋白质的正常组织的兴趣。这个函数的输出是一个(1)一个字符串列表包含一句话总结和(2)dataframe所有组织的蛋白质染色阳性和组织学染色图像的组织。

hpaXmlTissueExprSum (EGFRxml) # > $总结# >[1]“细胞质和膜性表达在一些组织,在胎盘最丰富。”#> #> $img #> tissue #> 1 cerebral cortex #> 2 lymph node #> 3 liver #> 4 colon #> 5 kidney #> 6 testis #> 7 placenta #> imageUrl #> 1 http://v18.proteinatlas.org/images/18530/41191_B_7_5_rna_selected.jpg #> 2 http://v18.proteinatlas.org/images/18530/41191_A_7_8_rna_selected.jpg #> 3 http://v18.proteinatlas.org/images/18530/41191_A_7_4_rna_selected.jpg #> 4 http://v18.proteinatlas.org/images/18530/41191_A_9_3_rna_selected.jpg #> 5 http://v18.proteinatlas.org/images/18530/41191_A_9_5_rna_selected.jpg #> 6 http://v18.proteinatlas.org/images/18530/41191_A_6_6_rna_selected.jpg #> 7 http://v18.proteinatlas.org/images/18530/41191_A_1_7_rna_selected.jpg

这些图像可以通过设置自动下载downloadImg参数真正的。如。hpaXmlTissueExprSum (CCNB1xml downloadImg = TRUE)

5.5获得的个人细节包含IHC样本hpaXmlAntibody ()hpaXmlTissueExpr ()

更重要的是,HPA的XML文件是唯一的格式编程accesible数据包含的信息每个抗体和每个组织样本中使用的项目。

hpaXmlAntibody ()提取抗体信息并返回一个宠物猫与每个抗体的一行。

hpaXmlAntibody (EGFRxml) # > #宠物猫:5 x 4 # > id releaseDate releaseVersion RRID # > <空空的> <空空的> <空空的> <科> # > 1 CAB000035 2006-03-13 1.2 < NA > # > 2 HPA001200 2006-03-13 3.1 AB_1078723 # > 3 HPA018530 2008-12-03 4.1 AB_1848044 # > 4 CAB068186 2014-11-06 13 AB_2665679 # > 5 CAB073534 2015-10-16 14 < NA >

hpaXmlTissueExpr ()上面每个抗体的所有样本提取信息并返回一个列表的宠物猫。如果抗体尚未用于包含IHC染色,返回的宠物猫是空的。

tissueExpression < - hpaXmlTissueExpr (EGFRxml)总结(tissueExpression) # >长度类模式# > [1]18 tbl_df列表18 # > [2]tbl_df # > [3] 18 tbl_df列表18 # > [4]tbl_df # > [5] 18 tbl_df列表

每个宠物猫包含临床数据(patientid,年龄,),组织信息(snomedCode,tissueDescription),染色结果(染色,强度,位置)和一个imageUrl为每个样本。然而,由于大量的数据和每个图像的尺寸相对较大,hpaXmlTissueExpr没有提供一个自动下载选项。

tissueExpression[[1]] # > #宠物猫:327 x 18 # > patientId年龄性染色强度数量位置imageUrl # > <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <空空的> <科> # > 1 1653 53岁男性< NA > < NA > < NA > < NA > http:// ~ 60 # > 2 1721年联邦应急管理局~ < NA > < NA > < NA > < NA > http:// ~ 57 # > 3 1725男< NA > < NA > < NA > < NA > http:// ~ # > 4 4 25男< NA > < NA > < NA > < NA > http:// ~ 34 # > 5 512联邦应急管理局~ < NA > < NA > < NA > < NA > http://联邦应急管理局6 2664 74 ~ # > ~ < NA > < NA > < NA > < NA > http:// ~ # > 7 2665 88联邦应急管理局~ < NA > < NA > < NA > < NA > http:// ~ 54 # > 8 1391联邦应急管理局~ < NA > < NA > < NA > < NA > http:// ~ 45 # > 9 1447联邦应急管理局~ < NA > < NA > < NA > < NA > http:// ~ # > 10 1452 44个联邦应急管理局~ < NA > < NA > < NA > < NA > http:// ~ # > #……317多行,和10个变量:snomedCode1 <装备> # > # snomedCode2 <科>,snomedCode3 <科>,snomedCode4 <科>,# > # snomedCode5 <科>,tissueDescription1 <科>,tissueDescription2 <科>,# > # tissueDescription3 <科>,tissueDescription4 <科>,# > # tissueDescription5 <空空的>

hpaTissueExprSumhpaTissueExpr提供下载链接下载相关染色图像,与前功能也给选择自动下载过程。

6兼容hparBioconductor包


表1: hpar和HPAanalyze之间互补功能
功能 hpar HPAanalyze
数据集 包含在包 从服务器下载或使用内置的数据集
查询 运用id HGNC符号数据集,运用XML id
数据版本 一个稳定的版本 最近在默认情况下,选择下载
发布信息 通过功能的访问 N /一个
查看相关浏览器页面 通过getHPA函数 N /一个
可视化 N /一个 探索通过hpaVis功能
XML N /一个 下载并导入通过hpaXml功能
组织学图像 视图通过加载浏览器页面 通过提取链接hpaXml功能

7确认

我们感谢的支持美国国立卫生研究院国家癌症研究所R01 CA151522和基金的细胞,发育和综合生物学在伯明翰阿拉巴马大学的。