1选手

目前有三种方法可以找到你所需要的数据在公司治理文化:

  • 最简单:使用我们的强大的和漂亮的GUI称为“数据浏览”交互平台,请阅读本教程在这里
  • 最先进的:对于高级用户,请直接SPARQL查询教程
  • 最甜蜜的:使用公司治理文化数据API,通过创建一个查询列表中R(很快,请等待)。

2图形数据浏览器

请阅读本教程在这里

3数据集的API

请阅读教程第一。

3.1通过数据集浏览TCGA API

做一个HTTP得到在这个端点将资源与数据集的所有实体。以下链接(做一个HTTP得到)一个将一个实体(例如列表/文件TCGA)从数据集与适当的URL。进一步后其中一个链接你会得到一个特定的资源(如果我们去/文件,我们会得到一个描述一个特定的文件)等所有特定属性id、标签等和其他实体链接连接到一个特定的资源(例如/案例),您可以进一步探索。从那里,这个过程重复,只要你遵循的链接。

3.1.1返回数据集访问槽的公司治理文化

创建一个身份验证对象和你的令牌,确保您使用正确的URL。

  • https://cgc-datasets-api.sbgenomics.com/

使用Auth $ api ()方法不需要类型基本URL或令牌。

库(sevenbridges) #创建一个身份验证对象< -身份验证(url = " https://cgc-datasets-api.sbgenomics.com/ ",令牌=“your_cgc_token”)美元api (path =“数据集”)

3.1.2返回列表TCGA的实体

你可以另一个问题得到请求href tcga的对象,如果你想访问,tcga数据。

< -身份验证(url = " https://cgc-datasets-api.sbgenomics.com/datasets/tcga/v0 ",令牌=“your_cgc_token”) (res < - $ api()) #默认方法得到#所有资源/实体名单(res _links)美元

3.1.3解释所有实体的列表

例如,看到所有,TCGA的列表文件,发送请求:

(res < - $ api(路径= "文件"))

例如,看到元数据模式文件发送请求:

美元的api(路径=“文件/模式”)

3.1.4将文件复制到您的项目

从数据集获取文件id API,然后使用公共API来复制文件。确保你的项目是“TCGA”兼容,否则如果你试图控制访问数据复制到您的non-TCGA项目,你会得到

403年“HTTP状态:足够的权限访问所请求的文件。”
(res < - $ api(路径= "文件"))get_id < -函数(obj)酸式焦磷酸钠(obj“_embedded”文件,美元函数(x) x $ id) id < - get_id (res) #创建公司治理文化身份验证a_cgc < - auth(平台=“公司治理文化”,令牌=美元令牌)a_cgc美元拷贝文件(id = id、项目=“RFranklin / tcga-demo”)

3.2发布与查询

终端用户可以过滤收集资源使用DSL的JSON格式翻译为SPARQL的子集。主要优势是最终用户获得子集SPARQL表现力而不需要学习SPARQL规范。

3.2.1之上找到样品连接到一个案例

身体< -列表(实体=“样本”,hasCase = " 0004 d251 - 3 - f70 - 4395 b175 c94c2f5b1b81”)美元api (path =“查询”,身体=身体,方法=“POST”)

计算样本连接到一个案例

美元的api(路径=“查询/总”,身体=身体,方法=“POST”)

发出一个得到href路径请求将返回以下数据:

注意:api函数是一个光层httr包,它是不同的身份验证api美元调用。

httr:内容(api(令牌=美元令牌,base_url = " https://cgc -数据集api.sbgenomics.com/datasets/tcga/v0/samples/9259e9ee - 7279 - 4 - b62 - 8512 - 509 - cb705029c”))

3.2.2发现病例诊断年龄

假设你想看到所有病例的诊断年龄10至50。然后,您使用以下查询。

注意,元数据字段的值包含keyfilter hasAgeAtDiagnosis是一个字典,其价值进一步字典keysgt(大于)和lt(小于)上界和下界来过滤。

身体< -列表(“实体”=“病例”、“hasAgeAtDiagnosis”=列表(“过滤器”=列表(“gt”= 10,“lt”= 50))) $ api (path =“查询”,身体身体=,=方法“POST”)

3.2.3发现病例与给定年龄和疾病诊断

假设您想看到的所有情况下,在这个例子中,(发现病例诊断年龄)(doc: find-all-cases-with-a-given-age-at-diagnosis),有一个年龄在10至50的诊断,但也有疾病的“肾Chromophobe”。然后,使用以下查询:

身体< -列表(“实体”=“病例”、“hasAgeAtDiagnosis”=列表(“过滤器”=列表(“gt”= 10,“lt”= 50)),“hasDiseaseType”=“肾Chromophobe”)美元api (path =“查询”,身体=身体,方法=“POST”)

3.2.4复杂的过滤TCGA的示例数据

身体< -列表(“实体”=“病例”、“hasSample”=列表(“hasSampleType”=“原发肿瘤”,“hasPortion”=列表(“hasPortionNumber”= 11)),“hasNewTumorEvent”=列表(“hasNewTumorAnatomicSite”= c(“肝”、“胰腺”)、“hasNewTumorEventType”=列表(“过滤器”=列表(“包含”=“复发”))))$ api (path =“查询”,身体身体=,=方法“POST”)

发出一个得到请求到href路径

httr:内容(api(令牌=美元令牌,base_url = " https://cgc -数据- api.sbgenomics.com/datasets/tcga/v0/cases/0004d251 - 3 - f70 - 4395 b175 c94c2f5b1b81”))

3.2.5对一个案件查询与多个过滤器

get_id < -函数(obj)酸式焦磷酸钠(obj“_embedded”文件,美元函数(x) x $ id)名称(res)身体< -列表(“实体”=“病例”、“hasSample”=列表(“hasSampleType”=“原发肿瘤”,“hasPortion”=列表(“hasPortionNumber”= 11,“哈西德派教徒”=“TCGA-DD-AAVP-01A-11”)),“hasNewTumorEvent”=列表(“hasNewTumorAnatomicSite”=“肝”、“hasNewTumorEventType”=“肝内复发”))(res < - $ api(路径=“文件”,身体=身体))get_id (res)