小白福音—生物信息学生R入门教程
生物信息学生R入门教程
关于生信,网上的学习资料有很多,初入门的学生,往往迷失在纷繁复杂的教程中,而找不到发力的方向。那么有没有一些整理的比较系统的总结呢,答案是有的。今天我们要给大家分享的就是一个比较系统的入门书籍。它系统的介绍了各组学的分析流程,并且是中文书写,阅读完全无压力。下面我们具体来看看这本书吧。
作者介绍:
欧剑虹 1997年考入武汉大学微生物专业学习,后进入日本大阪大学学习,2009年毕业于大阪大学,取得信息科学与技术博士学位。2011年进入麻省州立大学医学院从事生物信息研究工作。
原文链接 https://qiubio.com/new/book/
书籍目录:
前言
第一章 R/Bioconductor入门
第二章 基因芯片分析
第三章 RNA-seq数据分析
第四章 ChIP-seq数据分析
第五章 ATAT-seq数据分析
第六章 scRNA-seq数据分析
第七章 下游分析
第八章 上游分析
Appendix
作为一本入门书籍,它比较系统的介绍了五个组学的分析流程。能使初学者对这些组学有一个清晰的、直观的、系统的印象。
关于单细胞转录组
对于单细胞转录组学,这本书介绍了如何使用Seurat和Monocle来分析scRNA-seq数据。
下面我们来看一下大概涉及哪些分析
Seurat基本分析流程
数据下载
数据读取
质量控制
载入注释
质量控制与细胞选取
标准化
高差异基因
二次标准化
PCA分析
决定需要考虑的PC
细胞分集
生成降维图像
寻找分集标记基因
对分集细胞进行标记
亚群分析
Monocle基本分析流程
载入数据
预处理
细胞分群
使用pseudotime排列细胞
选择合适的基因来标记状态
区分状态
将细胞合理地分布在不同状态间
差异表达分析
BEAM分析
小结
以作者看来,分析scRNA-seq的数据的关键在于如何对细胞进行cluster。这其中有很多的算法,而之后的降维分析比如tSNE其实主要还是为了数据图形化显示方便。在细胞分群之后,差异表达分析其实与第三章的RNA-seq并无二致,我们只需要对需要比较的因素做到心中有数即可。