小白福音—生物信息学生R入门教程

生物信息学生R入门教程

关于生信,网上的学习资料有很多,初入门的学生,往往迷失在纷繁复杂的教程中,而找不到发力的方向。那么有没有一些整理的比较系统的总结呢,答案是有的。今天我们要给大家分享的就是一个比较系统的入门书籍。它系统的介绍了各组学的分析流程,并且是中文书写,阅读完全无压力。下面我们具体来看看这本书吧。

作者介绍: 
欧剑虹 1997年考入武汉大学微生物专业学习,后进入日本大阪大学学习,2009年毕业于大阪大学,取得信息科学与技术博士学位。2011年进入麻省州立大学医学院从事生物信息研究工作。

原文链接 https://qiubio.com/new/book/

书籍目录:

  • 前言

  • 第一章 R/Bioconductor入门

  • 第二章 基因芯片分析

  • 第三章 RNA-seq数据分析

  • 第四章 ChIP-seq数据分析

  • 第五章 ATAT-seq数据分析

  • 第六章 scRNA-seq数据分析

  • 第七章 下游分析

  • 第八章 上游分析

  • Appendix

作为一本入门书籍,它比较系统的介绍了五个组学的分析流程。能使初学者对这些组学有一个清晰的、直观的、系统的印象。

关于单细胞转录组

对于单细胞转录组学,这本书介绍了如何使用Seurat和Monocle来分析scRNA-seq数据。

下面我们来看一下大概涉及哪些分析

Seurat基本分析流程

  • 数据下载

  • 数据读取

  • 质量控制

  • 载入注释

  • 质量控制与细胞选取

  • 标准化

  • 高差异基因

  • 二次标准化

  • PCA分析

  • 决定需要考虑的PC

  • 细胞分集

  • 生成降维图像

  • 寻找分集标记基因

  • 对分集细胞进行标记

  • 亚群分析

Monocle基本分析流程

  • 载入数据

  • 预处理

  • 细胞分群

  • 使用pseudotime排列细胞

  • 选择合适的基因来标记状态

  • 区分状态

  • 将细胞合理地分布在不同状态间

  • 差异表达分析

  • BEAM分析

小结

以作者看来,分析scRNA-seq的数据的关键在于如何对细胞进行cluster。这其中有很多的算法,而之后的降维分析比如tSNE其实主要还是为了数据图形化显示方便。在细胞分群之后,差异表达分析其实与第三章的RNA-seq并无二致,我们只需要对需要比较的因素做到心中有数即可。

(0)

相关推荐