技术贴 | 微生太宏基因组报告解读 | 第十二篇:功能分析-基于抗性基因CARD数据库
本文由阿童木根据实践经验而整理,希望对大家有帮助。
原创微文,欢迎转发转载。
细菌抗生素耐药性是在人类为控制细菌生长而进行的大规模抗生素的使用的前提下, 细菌通过基因突变或者从环境有机体的基因水平转移而获得对特定抗生素的抗性,这些突变使抗生素作用靶位发生改变或不能再对其靶标施加作用。耐药性的获得通常涉及到基因/移动DNA元件及其细菌宿主之间复杂的相互作用。随着DNA测序成本的降低和分析速度的提高, 研究者能够获得大量病原体基因组以及土壤、海洋和人类相关宏基因组的数据信息。利用基因组序列数据与生物信息学方法, 可深度剖析细菌耐药机制, 确定新药靶点, 寻找新的抗生素。CARD数据库目前使用最广泛的抗性基因数据库,目前包括3997个抗性基因分类,并在线提供各个分类名称与PDB、NCBI等数据库的搜索接口,方便后续分析。
一、组成概况
根据数据库的注释结果,绘制各样品抗性基因相对丰度统计图。下图是相对丰度前20的抗性基因相对丰度柱形图,其中不同的颜色代表不同的抗性基因类别。
二、LEfSe差异分析
LEfSe是一种结合了非参数检验和线性判别分析的方法,常被用于寻找可以区分多组样品的Biomarker。LEfSe分析结果中的抗性基因的LDA>阈值,表示该抗性基因在相应分组中丰度较高,而在其他分组中丰度较低。下图是抗性基因的LEfSe分析LDA柱形图。
三、聚类分析
从抗性基因的相对丰度表中筛选出丰度排名前20的抗性基因,接着通过对多个样品的抗性基因进行丰度聚类来考察抗性基因丰度在不同样品或者分组间的相似或差异性。下图是抗性基因聚类热图。
四、Circos图分析
Circos图可以用于展示每个样本中抗性基因的丰度,以及各个抗性基因分别在各个样本中的比例。下图是抗性基因在各个样本中的分布Circos图。其中左半圈为丰度最高的十个抗性基因,每个抗性基因内,不同颜色代表不同样本来源的比例;右边半圈为样本,样本内不同颜色代表不同抗性基因的比例。
五、相关分析
相关分析可用于分析环境因子或其它组学数据与宏组学数据之间的相关性。先选出丰度较高的抗性基因,再计算环境因子与抗性基因间的Spearman相关系数进行,最后选出与环境因子相关最多的抗性基因,可以得到如下的抗性基因与环境因子之间的相互关系热图。其中X轴上为环境因子,Y轴为抗性基因。R值(相关系数)在图中以不同颜色展示,右侧图例是不同R值的颜色区间。* 0.01≤ P <0.05,** 0.001≤P < 0.01,*** P < 0.001。
六、RDA分析
RDA分析可用于研究环境因子、样品、功能三者之间的关系,寻找影响样品分布的重要环境驱动因子。RDA分析更多的描述请见前面的篇章。下图是抗性基因 RDA分析的结果。
感谢阅读~
你可能还喜欢
1 技术贴 | 16S专题 | 简单介绍如何用自己的笔记本处理高通量16S数据
4 技术贴 | 宏转录组专题 | DDBJ数据库:宏转录组测序数据下载