技术贴 | 16S专题 | 简单介绍如何用自己的笔记本处理高通量16S数据
导 读
高通量16S测序经济实惠、周期短,是许多微生物组学尤其是环境微生态方向科研工作者的有力武器。
课题组经费不够,测了16S只能自己分析(省钱啊!!)。这里为需要自己处理16S数据的同学,整理了一下高通量16S rDNA下机数据处理过程中的常用软件(课题组没钱租不起服务器,只能用自己的小笔记本处理)。希望对大家有所帮助。
平台搭建
高通量测序数据分析常用操作系统为Linux系统,序列比对、过滤、质控等诸多软件都是基于Linux系统开发的。建议安装Biolinux,为生物信息学开发的Linux系统,自带Qiime。Qiime 中集成了许多高通量数据处理工具。大家也可以使用官方提供的镜像进行安装(http://qiime.org/install/virtual_box.html)。
通过虚拟机在自己的笔记本上安装好linux系统和Qiime软件,之后就可以利用它们进行数据处理了。
数据预处理
利用Qiime对原始进行拼装,然后去除barcode,再去除引物,由于Qiime不能去除引物,所以需要借用mothur来去除引物(https://www.mothur.org/wiki/Category:Commands)
拼接的数据去除噪音: AmpliconNoise and Denoiser,也是基于Qiime平
嵌合体检测:chimera_check、pintail、mallard、bellerophon、chimeraslayer.
去除同聚体后的good序列,可以直接居聚类,生成OTU,Qiime提供三种OTU聚类的方式:1. De novo Clustering(从头自聚类)、2. Closed-Reference(封闭式)、3. Open-Reference(开放式)。关于聚类的教程:(http://blog.sina.com.cn/s/blog_670445240101n8n4.html)
利用Qiime生成OUT-table,所使用的命令:make_otu_table.py -i non_chimeric_seqs_otus.txt -t rep_set_tax_assignments.txt -o otu_table.biom ; 然后将信息转化为TXT格式:biom summarize-table -i otu_table.biom -o otu_table.txt 。
再将OUT-table转化为带有分类信息的文件,生成带有OTU分类信息的txt文件,所使用命令: biom convert -i otu_table.biom -o otu_table_with_taxonomy.txt --to-tsv --header-key taxonomy。再转换成Excel.
数据分析
基于OTU表格就可以进行多元分析了。
基于Qiime可以进行多样性分析有:α多样性、β多样性、系统发育树、PCoA分析。
分析到这一步Linux 系统上的工作就完成了,其他工作大家可以在Windows系统利用各类数据库和R语言进行数据处理和分析。在这里简单给大家介绍了一下用自己电脑安装了linux之后处理下机数据的软件,相关细节下次有机会再给大家介绍。(课题组还是有钱的好!)
本文由董小橙、江舜尧编辑。