16S结题报告 | 16S专题
编前语
从上节《16S简介》,我们可以推测得到,选择16S测序,往往是为了了解样品的微生物的群落多样性。那么16S rDNA测序解题报告主要包括哪些内容呢?
我们先来看看一般的16S结题报告目录:
下面我们来针对主要内容进行具体说明
一、测序数据统计
高质量序列数统计表
高质量序列数统计表解读:
上表主要着重关注的是高质量序列值及比例,这些在文献中常需要作简单的描述,例如:在16S测序中,经过质控后,共有____个高质量序列,平均每个样品有_____个reads。
二、OTU统计分析
OTU聚类统计表
OUT聚类的作用主要有两个:(1)将序列进行分类,减少后续分析的工作量,提高分析效率;(2)由于在OUT聚类的同时会去除嵌合体序列,所以也会导致分析准确率的提高。
OUT聚类表的格式如下:
表格解读:
各样本分类至门、纲、目、科、属、种的OUT数越大,则反映该样本在该分类水平的序列种类越多,该样本所包含的物种数越多,反之则相反。
venn图分析
Venn图解读:
Venn图分析可以简洁明了地看到不同样品或不同组的共有OUT数目和独有OUT数目。共有OUT数越大,表示序列相似的集合越多,从而反映物种多样性越大。在不同条件处理样品时,不同样品的共有OUT数越大,往往反映了不同条件对菌群的调控作用越显著。此外,维恩图还可以直接通过观察各样品OUT总数推测各样品的菌群多样性大小情况。
三、菌群Alpha多样性分析(我们需要重点关注的是多样性指数统计表、多样性稀释曲线)
Alpha多样性指的是一个特定区域或生态系统内的多样性,常用物种丰富度表示。它反映的是样品内物种组成,包括数量和丰度。评估指标有:observed species、shannon指数、simpson指数、chao指数等。
我们从observedspecies 指数稀释曲线和 Chao1 指数稀释曲线可以判断样品测序量是否足够以及得知样品中群落的丰富度。若曲线趋于平缓或处于平台期,则测序量已足够覆盖样品中的所有物种,否则与之相反。Shannon指数稀释曲线、 Simpson 指数稀释曲线以及PD whole tree稀释曲线则主要反映的是物种的丰富度和均匀度。
还有一点需要注意的是,我们在生成Alpha多样性稀释曲线时,需要先对OUT表进行重抽样,再进行Alpha多样性分析。这是因为数据过滤会导致导致数据测序深度不同,同一样品,测序深度不同会导致检测到的物种数量不一样,在同一批样品中,测序深度不同的情况,直接比较该批样品的物种数量就失去了可比性和科学性。
四、菌群的分类学组成分析
群落组成柱状图
柱状图解读:
每个柱形图代表一个样本,每种颜色代表一个分类单元,纵坐标代表各分类单元的丰度,柱子越长,表示该分类单元在对应样品中的相对丰度越高。
结合聚类分析的群落组成热图
热图解读:
根据以上热图颜色由红到绿之间的深浅情况,可以直接判断每个颜色方块对应的样本中该属丰度的高低情况,结合样品的实验处理条件,则可以直观推测在不同实验处理条件下各样品的属水平群落变化情况。
五、菌群Beta多样性分析
Beta多样性和Alpha多样性类似,都是来自生态学概念,但不同的是,Alpha多样性指的是样品内或某一生态区域内的物种多样性,而Beta多样性则侧重于不同样品内或不同生态区域内的物种多样性,两者的范围不一致。
PcoA/NMDS分析
PcoA或NMDS图解读:
该图主要是为了观察个体或群体之间的差异或相似度。距离越远,表示样品间或样品组间的差异越显著。
基于UniFrac距离的多组比较和箱线图
箱线图解读:
UniFrac距离主要是根据各样品序列间的进化信息来比较这些样品在其进化谱系中是否存在显著的微生物群落差异。如上图,横轴代表的是各分组,纵轴代表的是UniFrac距离,若样品组之间的UniFrac距离差值越大,则表明它们的菌群结构差异越大。
Last but not least,结题报告中提及的分析软件、分析方法和涉及到的算法等,各位小伙伴也别忽略喔,这些是在文献写作中需要交待清楚的内容。由于不同的项目,使用到的分析软件及方法不同,小编就不在这里展开介绍了。
以上是小编对16S结题报告解读的心得分享,若有不到位之处,请各位小伙伴指出来一起探讨探讨喔~
本文由柯柯供稿,莫秋芬、江舜尧编辑。