1如何通过过滤种族和种族来生成清单文件?

https://support.bioconductor.org/p/9138939/

图书馆(genomicDataCommons,悄悄= true)

根据懒惰评估最佳实践的更改,我对过滤表达方法进行了很小的更改。现在无需包括在滤波器表达式中。所以:

q = files()%>%genomicicdatacommons :: filter(cases.project.project_id =='tcga-coad'&data_type =='对齐读取'&perveriention_strategy =='rna-seq'&data_format =='bam')

并获得结果:

计数(q)
## [1] 1183

和清单。

清单(q)

您关于种族和种族的问题是一个好问题。

all_fields = opic_fields(files())

我们可以抓住种族或者种族的要查看潜在的匹配字段。

grep('race |种族',all_fields,value = true)
## [1]“ cases.demographic.decnicity” ## [2]“ case.demecraphic.race” ## [3]“ cases.follow_ups.hormonal_contraceptive_type_type” ## [4] cases.follow_ups.hormonal_contraceptive_contraceptive_use_contraceptive_use ## ## ## ## ## ## ##[5]“ case.follow_ups.scan_tracer_used”

现在,我们可以检查每个字段的可用值,以确定如何完成过滤器表达式。

可用_values('files',“ case.demagrogricic.efnicity”)
## [1]“不是西班牙裔或拉丁裔”“未报告”“西班牙裔或拉丁裔” ## [4]“不知名”,“不允许收集”“ _ Missing”
可用_VALUES('files',“ case.demecraphic.race”)
## [1]“白色” ## [2]“未报告” ## [3]“黑人或非洲裔美国人” ## [4]“亚洲” ## [5]“ unnaken” ## [6]“”其他“ ## [7]”不允许收集” ## [8]“美洲印第安人或阿拉斯加本地人” ## [9]“本地夏威夷人或其他太平洋岛民” ## [10]“ _ Missing”

我们现在可以完成过滤器表达式以限制白色的仅比赛。

q_white_only = q%>%genomicdatacommons :: filter(cases.demographic.race.race =='white')count(q_white_only)
## [1] 691
清单(q_white_only)

2我如何获得由日期添加到TCGA项目的RNA-seq数据的案例数GenomicDataCommons

我想通过实验类型将添加的案例数(创建,在此处创建的任何逻辑日期都足够)。我试图通过GenomicDataCommons软件包获取这些数据,但是它给了我我相信给定实验类型而不是数字情况的文件数量。如何获取RNA-Seq数据的案例数量?

库(tibble)库(dplyr)
## ##附件包:'dplyr'
##以下对象从“包:genomicdatacommons':## ## count,filter,选择”中掩盖
##以下对象从“包:stats':## ##过滤器,滞后掩盖
##以下对象从“包装:base”:## ##互动,setdiff,setequal,union掩盖
库(genomicDataCommons)案例()%>%>%genomicicdatacommons :: filter(〜project.program.name =='tcga'&files.experiention_strategy =='rna-seq')%>%>%faceet(c(c(“ files.created_dateTime”))%>%centregations()%>%。[[1]%>%as_tibble()%>%dplyr :: besseve(dplyr :: desc(key))