OSCA单细胞数据分析笔记-2—R与Bioconductor
对应原版教程2-3章 http://bioconductor.org/books/release/OSCA/ (对R基本了解的读者可跳过这一节)
1、简介
R语言是生信人最熟悉的编程语言之一,其核心在于有上万个R包极大扩充了其使用范围,需要用到那个R包,安装、加载使用即可。在生信学习过程中,有两个最常见的R包库
一是Comprehensive R Archive Network(https://cran.r-project.org/mirrors.html) (CRAN),是R语言的最常用、基础的R包库,适用于全部的R语言使用者(各行各业);
二是Bioconductor(https://bioconductor.org/),为生信人建立的R包库。其主要包含了许多专门用于分析某一类生信数据的包。(当然也包含一些数据包)
2、基础操作
2.1 设置镜像
提高下载安装包的速度。如下分别为bioconductor
与CRAN
选择了清华的镜像源
options()$repos
options()$BioC_mirror
options(BioC_mirror="http://mirrors.tuna.tsinghua.edu.cn/bioconductor/")
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options()$repos
options()$BioC_mirror
2.2 安装R包
安装源自CRAN的包:
install.packages()
基础函数install.packages("BiocManager")
安装源自Bioconductor的包:
BiocManager::install()
;其中BiocManager
是管理下载Bioconductor包的包,::
表示引用该包的函数,install()
就是下载包的函数。BiocManager::install("SingleCellExperiment")
所以安装包之前的第一步就是要判断该包来自CRAN库还是Bioconductor
2.3 获取帮助文档
方式1:
?函数名
(后面不要加括号),前提需要加载该包才行。否则会提醒使用??
进行全局搜索。library(SingleCellExperiment)
?cpm方式2:Rstudio右下栏的packages。可先在搜索栏快速检索包的名字,然后调出选定包的全部函数帮助文档。
方式3:CRAN/Bioconductor的官网里的该包出处。其中如作者所说,Bioconductor对开发包人员所提供的帮助文档有更严格的要求
方式4:百度/google等等
3、R在线学习资源
上面只是简单根据教程介绍了一些R基础知识点,但例如安装R、Rstudio操作,R的数据结构等可专门另行找资料学习。结合教程,推荐的开源资源如下。
R for Data Science (适合初学者)
https://r4ds.had.co.nz/R语言教程(北大的李东风老师编写的,最大好处就是中文,适合小白)
https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.htmlAdvanced R(进阶)
https://adv-r.hadley.nz/生信技能树R语言教程(B站视频)
https://www.bilibili.com/video/BV1cs411j75B包括OSCA,R for Data Science等都是基于Rmarkdown编写的,所以顺便再推一个Rmd教程(B站视频)
https://www.bilibili.com/video/BV1ib4y1X7r9?p=1
关于R的一些基础知识就简单介绍这么多了;相信来了解scRNA-seq数据分析的读者多少对R也已经比较了解了。下一节会介绍
SingleCellExperiment
,这个贯穿教程始终的数据结构组成。