# #设置,包括= FALSE ----------------------------------------------------- knitr: opts_chunk美元集(崩溃= TRUE, = " # > "发表评论,警告= FALSE,错误= FALSE, eval = FALSE,作物=零 ) ## ---- 图书馆,消息= FALSE,警告= FALSE,错误= FALSE ----------------------- # 图书馆(BiocStyle) #库(HPAanalyze) #库(dplyr) #库(宠物猫)#库(readr) #库(tidyr) # #——呼应= FALSE, eval = TRUE, fig.cap =“”字段> >”按钮。”,。width = '100%'---- knitr::include_graphics("figures/query_fields.png") ## ----echo=FALSE, eval=TRUE, figure cap="用下拉菜单构建您的查询",out。width = '100%'---- knitr::include_graphics("figures/query_dropdown.png") ## ----echo=FALSE, eval=TRUE, fig.cap="Click the 'Search' button.",输出width = '100%'---- knitr::include_graphics("figures/query_search.png") ## ----echo=FALSE, eval=TRUE, fig.cap="Copy the link to the tsv file.", out。宽度=‘100%’——knitr: include_graphics(“数据/ query_tsvlink.png ") ## ----------------------------------------------------------------------------- # ## 链接到你的查询tsv # my_hpa_query < -“https://www.proteinatlas.org/search/protein_class%3ACD +标记+和+ normal_expression % 3 acerebral +皮层% 3 bany % 3 bnot + % 2克洛发现+和+预后% 3 aglioma % 3 bunfavourable ? = tsv格式“# # # #创建一个临时文件作为目的地下载#临时< - tempfile(“查询”,fileext=c(".tsv.gz")) ## ##下载到临时文件# Download。文件(url = my_hpa_query destfile = temp =“卷曲”方法,模式= "白平衡 ") # # ## 文件读入数据帧# query_df < - readr:: read_tsv(临时)# # # # #拆开(临时分开的临时文件 ) ## ----------------------------------------------------------------------------- # 宠物猫:看见(query_df) # # # >观察:6 # # >变量:22 # # >美元基因
" cd81 ", " nrp1 ", " prnp ", " sdc1 ", " thy…"# #> $“基因同义词”
" tapa-1, tapa1, tspan28 ", " cd304, nr…# #> $ ensemble
“ENSG00000110651”、“ENSG00000099250”……# #> $ '基因描述'
“CD81分子”,“神经球蛋白1”,“Pr…# #> $染色体
11, 10, 20, 2, 11, 17 # #> $位置
“2376177 - 2376177”、“33177492 - 33177492…# #> $ '蛋白质类'
“乳糜泻标记、疾病相关基因……# #> $证据
“蛋白质水平的证据”,“证据…# #> $抗体
" cab002507, hpa007234 ", " cab004511,…"# #> $ '可靠性(IH) '
“支持”、“批准”,“强化”,…# #> $“可靠性(鼠标大脑)”
不,不,不,不,不,不# #> $ '可靠性(IF) '
“支持”、“不确定”、“批准”……# #> $ ' Subcellular location '
“质膜”,“线粒体”,“……# #> $ '预测p值'
“神经胶质瘤:5.12 e-5(不利),Panc……# #> $ ' RNA癌症类别'
“表达于全体”,“表达于全体……”# #> $ ' RNA组织类别'
“表达于全体”,“表达于全体……”# #> $ ' rna ts '
Na, Na, Na, Na, Na # #> $ ' rna ts tpm '
NA, NA, NA "食道:250.7;皮肤:…# #> $ ' TPM max in non-specific '
“精囊:2273.0”、“胎盘……# #> $ ' RNA细胞系类别'
“细胞系增强”,“细胞系enh…”# #> $ ' rna cs '
Na, Na, Na, Na, Na # #> $ ' rna cs tpm '
“ASC diff: 2031.3”,“U-87 MG: 437.4”…## ----------------------------------------------------------------------------- # ## 查询给你最新HPA版本以来,获得最新的数据集来匹配# latest_datasets < - hpaDownload () # # hpaVis (data = latest_datasets # targetGene =美元query_df基因,# targetTissue =“大脑皮层”,# targetCancer = "神经胶质瘤 ") ## ----------------------------------------------------------------------------- # ## 下载并导入xml文件感兴趣的蛋白质# query_xml_list < -拉普(query_df运用美元,hpaXmlGet) # # # #提取蛋白质类的列表数据帧# query_protein_classes < -拉普(query_xml_list,hpaXmlProtClass) # names(query_protein_classes) <- query_df$Gene # name list items ## ##将列表转换为数据帧# query_protein_classes_df <- # tidyr::unnest(tibble::enframe(query_protein_classes, name = "protein")) ##一瞥(query_protein_classes_df) ## >观察:122 ## >变量:5 ## > $ protein
“研究”、“研究”,“研究”,“研究”,“研究”,“研究”,“研究”…# #> $ id
“Cd”、“农协”、“摩根富林明”、“马”、“医学博士”,“我”,“曼氏金融”、“毫克”,“Mh”,…# #> $ name
“CD标记”,“转运体”,“附属因子包括…# #> $ parent_id
NA NA,“农协”、NA NA, NA, NA, NA, NA, NA, NA, NA, NA,……# #> $ source
“UniProt”、“TCDB”、“TCDB”、“MDM”、“MDM”、“MEMSAT3”、“米……## # ##我们列表中的哪些蛋白质也是潜在的药物靶点?# filter(query_protein_classes_df, name == "Potential drug targets") # # #> # A tibble: 2 x 5 # #> protein id name parent_id source # #>
1 CD81 Pd潜在的药物靶点
2 PRNP Pd潜在药物靶点
下丘脑-垂体-肾上腺轴的