内容

作者:马丁摩根
日期:2019年7月22日

1R.

1.1的历史R.cr

  • 统计编程语言。1992年,初始版本1996年,2000年稳定的Beta版本;实施S.。Cran于1997年开始。
  • '免费'软件:没有成本,开源,广泛使用。
  • 可扩展:包装(15,000 ooncr,1750年生物体
  • 主要特征
    • 固有的统计概念
    • 矢量化计算
    • '旧学校的脚本而不是图形用户界面 - 非常适合再现性!
    • (先进的)复制更改Semanatics.

1.2vector和数据帧

1 + 2
## [1] 3
x = c(1,2,3)1:3#整数的序列从1到3
## [1] 1 2 3
x + c(4,5,6)#矢量化
## [1] 5 7 9
x + 4#回收
## [1] 5 6 7

vectors.

  • 数字()特点()逻辑()整数()复杂的(),......
  • NA.: '无法使用'
  • 因素():受限制的“级别”集的价值观。

运营

  • 数字:==.<<=>> =,......
  • 逻辑:|(或者),(和),!!(不是)
  • 子集:[,例如,X [C(2,3)]
  • 任务:[< -,例如,x [c(1,3)] = x [c(1,3)]
  • 其他:is.na()

职能

x = rnorm(100)y = x + rnorm(100)绘图(x,y)

  • 许多!

data.frame.

df < -  data.frame(独立= x,dependent = y)头(df)
##独立依赖性## 1 -0.4338047 -0.5779168 ## 2 -0.2769985 -1.0665115 ## 3 -1.6966211 -1.8769578 ## 4 -2.648116 -1.95408116 -1.9540841 ## 5 -2.1015776 -1.1166887#6 0.7109163-0.3363154 -1.11.116688 -1.1166887#6 0.7109163 -1.1.1166876 -1.1166887#
DF [1:5,1:2]
##独立依赖性## 1 -0.4338047 -0.5779168 ## 2 -0.2769985 -1.0665115 ## 3 -1.6966211 -1.8769578 ## 4 -2.6481076 -1.954081076-0.9540841 ## 5 -2.1015776 -1.1166887 -1.1166887 -1.1166888
DF [1:5,]
##独立依赖性## 1 -0.4338047 -0.5779168 ## 2 -0.2769985 -1.0665115 ## 3 -1.6966211 -1.8769578 ## 4 -2.6481076 -1.954081076-0.9540841 ## 5 -2.1015776 -1.1166887 -1.1166887 -1.1166888
绘图(依赖〜独立,df)#'公式'界面

  • 相等长度矢量列表
  • 载体可以是不同的类型
  • 二维子集和分配
  • 列访问:df [,1]DF [,“INDEP”]df [[1]]DF [[“INDEP”]]DF $ INDEP.

练习:仅绘制价值依赖> 0.独立> 0.

  1. 选择行

    RIDX < - (DF $依赖> 0)&(DF $独立> 0)
  2. 绘制子集

    绘图(依赖于〜独立,DF [RIDX,])

  3. 皮肤猫另一种方式

    绘图(依赖于〜独立,df,子集=(依赖> 0)&(独立> 0))

1.3分析:功能,类,方法

Fit < -  LM(依赖于〜独立,DF)#线性模型 - 回归ANOVA(FIT)#摘要表
##方差的分析表## ##响应:依赖于## DF SUM SQ平均SQ F值Pr(> F)##独立1 92.664 92.664 70.32 3.787E-13 *** ## Residuals 98 129.139 1.318 ##  --  ## signif。代码:0'***'0.001'**'0.01'*'0.05'。'0.1''1
绘图(依赖〜独立,df)abline(适合)

  • lm():普通功能
  • 合身: 一个目的课堂“lm”
  • Anova(): 一种通用的有一个特定的方法课堂“LM”
班级(适合)
## [1]“lm”
方法(类=“LM”)
##Kappa ##Vcov ##查看“?方法”用于访问帮助和源代码

1.4帮助!

?“绘图”#纯旧功能或通用?“plot.formula”#方法?“plot.lm”#coptor'lm'对象的#方法,plot(fit)

1.5

库(GGPLOT2)GGPLOT(DF,AES(x =独立,y =依赖项))+ geom_point()+ geom_smooth(方法=“lm”)

  • 通用:> 15,000包装cr
  • 获得贡献者的域名专业知识奇怪(或其他)特质
  • 安装(只有每台计算机)与加载(通过图书馆(GGPLOT2),每次会话一次)

2生物体

2002年作为理解微阵列数据的平台

2.1

1,750包。专业领域:

  • 测序(RNASEQ,CHIPSEQ,单细胞,称为VARIANTS,......)
  • 微阵列(甲基化,表达,拷贝数,......)
  • 流式细胞仪
  • 蛋白质组学
  • ......

重要的主题

  • 可重复的研究
  • 包装与工作Kflows之间的互操作性
  • 可用性

资源

2.2对象

一个独特的特征生物体- 用于对象用于代表数据

图书馆(Biostrings)DNA < -  dnastringset(C(“Aactcc”,“CTGCA”))DNA
##长度2 ##宽度SEQ ## [1] 6 AACTCC ## [2] 5 CTGCA
逆转概述(DNA)
## Dnastringset长度2 ##宽度SEQ ## [1] 6 GGAGTT ## [2] 5 TGCAG
  • 生物仪器:DNA,RNA,AA表示和操纵
  • Genomicranges.:基因组空间中的坐标
  • 概括分析:使用行和列注释协调“测定”数据(例如,从RNASEQ实验中计数)(例如,有关样品和实验处理的信息)。

2.3高吞吐量序列工作流程

网站,https://biocondion.org.

1750'软件'包,https://biocumon.org/packages.

  • 序列分析(RNASEQ,ChipSeq,称为变体,拷贝数,单个单元)
  • 微阵列(甲基化,拷贝数,古典表达,......)
  • 注释(今天早上稍后的注释......)
  • 流式细胞仪
  • 蛋白质组学,图像分析,......

发现和使用,例如,deseq2.

  • 着陆页:标题,描述(摘要),安装说明,徽章
  • 鸽子!

还:

  • '注释'包
  • '实验数据'套餐
  • 工作流程
  • 课程材料,......

3.结束问题

3.1会话信息

sessioninfo()
## R版本3.6.1修补(2019-07-16 R76845)##平台:X86_64-Apple-Darwin17.7.0(64位)##正在运行:Macos High Sierra 10.13.6 ## ##矩阵产品:默认## blas:/users/ma38727/bin/r-3-6-branch/lib/liblblas.dylib ## lapack:/users/ma38727/bin/r-3-6-branch/lib/librlapack.dylib### locale:## [1] en_US.UTF-8 / en_US.UTF-8 / EN_US.UTF-8 / C / EN_US.UTF-8 / EN_US.UTF-8 ## ##附加基础包:##[1] stats4并行统计图形grdevices utils datasets ## [8]方法基础## ##其他附加包:## [1] BioStrings_2.53.2 Xvector_0.25.0 iranges_2.19.10 ## [4] S4Vectors_0.23.17 Biocgenerics_0。31.5 ggplot2_3.2.0 ## [7] biocstyle_2.13.2 ## ##通过命名空间加载(且未附加):## [1] RCPP_1.0.1 Pillar_1.4.2 Compiler_3.6.1 ## [4] Biocmanager_1.30.4 zlibbioc_1。31.0 tools_3.6.1 ## [7] Digest_0.6.20评估_0.14 Tibble_2.1.3 ## [10] gtable_0.3.0 pkgconfig_2.0.2 rlang_0.4.0 ## [13] yaml_2.2.0 xfun_0.8 withr_2.1.2 ## [16]] stringr_1.4.0 dplyr_0.8.3 KNITR_1.23 ## [19] Grid_3.6.1 tidyselect_0.2.5 glue_1.3.1 ## [22] R6_2.4.0 RmarkDown_1.14 Bookdown_0.12 ## [25] purrr_0.3.2 magrittr_1.5 scales_1.0.0 ## [28] CodeTools_0.2-16 Htmltools_0.3.6Assertthat_0.2.1 ## [31] ColorSpace_1.4-1 Labeling_0.3 Stringi_1.4.3 ## [34] lazyeval_0.2.2 munsell_0.5.0 crayon_1.3.4

3.2致谢

本教程中报告的研究得到了国家人类基因组研究所和国家癌症研究所的奖励号码U41HG004059和U24CA180996的国家癌症研究所。

该项目已收到欧洲联盟Horizo​​ n 2020研究和创新计划下的欧洲研究委员会(ERC)的资金(Grant协议号633974)