OSCA单细胞数据分析笔记-2—R与Bioconductor

对应原版教程2-3章 http://bioconductor.org/books/release/OSCA/ (对R基本了解的读者可跳过这一节)

1、简介

  • R语言是生信人最熟悉的编程语言之一,其核心在于有上万个R包极大扩充了其使用范围,需要用到那个R包,安装、加载使用即可。在生信学习过程中,有两个最常见的R包库

  • 一是Comprehensive R Archive Network(https://cran.r-project.org/mirrors.html) (CRAN),是R语言的最常用、基础的R包库,适用于全部的R语言使用者(各行各业);

CRAN
  • 二是Bioconductor(https://bioconductor.org/),为生信人建立的R包库。其主要包含了许多专门用于分析某一类生信数据的包。(当然也包含一些数据包)

    Bioconductor

2、基础操作

2.1 设置镜像

提高下载安装包的速度。如下分别为bioconductorCRAN选择了清华的镜像源

options()$repos 
options()$BioC_mirror
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options()$repos 
options()$BioC_mirror

2.2 安装R包

  • 安装源自CRAN的包:install.packages()基础函数

    install.packages("BiocManager")

  • 安装源自Bioconductor的包:BiocManager::install();其中BiocManager是管理下载Bioconductor包的包,::表示引用该包的函数,install()就是下载包的函数。

    BiocManager::install("SingleCellExperiment")

  • 所以安装包之前的第一步就是要判断该包来自CRAN库还是Bioconductor

2.3 获取帮助文档

  • 方式1:?函数名(后面不要加括号),前提需要加载该包才行。否则会提醒使用??进行全局搜索。

    library(SingleCellExperiment)
    ?cpm

  • 方式2:Rstudio右下栏的packages。可先在搜索栏快速检索包的名字,然后调出选定包的全部函数帮助文档。

  • 方式3:CRAN/Bioconductor的官网里的该包出处。其中如作者所说,Bioconductor对开发包人员所提供的帮助文档有更严格的要求
  • 方式4:百度/google等等

3、R在线学习资源

上面只是简单根据教程介绍了一些R基础知识点,但例如安装R、Rstudio操作,R的数据结构等可专门另行找资料学习。结合教程,推荐的开源资源如下。

  • R for Data Science (适合初学者)
    https://r4ds.had.co.nz/

  • R语言教程(北大的李东风老师编写的,最大好处就是中文,适合小白)
    https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html

  • Advanced R(进阶)
    https://adv-r.hadley.nz/

  • 生信技能树R语言教程(B站视频)
    https://www.bilibili.com/video/BV1cs411j75B

  • 包括OSCA,R for Data Science等都是基于Rmarkdown编写的,所以顺便再推一个Rmd教程(B站视频)
    https://www.bilibili.com/video/BV1ib4y1X7r9?p=1

关于R的一些基础知识就简单介绍这么多了;相信来了解scRNA-seq数据分析的读者多少对R也已经比较了解了。下一节会介绍SingleCellExperiment,这个贯穿教程始终的数据结构组成。

(0)

相关推荐