技术贴 | 16S专题 | 简单介绍如何用自己的笔记本处理高通量16S数据

导  读

高通量16S测序经济实惠、周期短,是许多微生物组学尤其是环境微生态方向科研工作者的有力武器。

课题组经费不够,测了16S只能自己分析(省钱啊!!)。这里为需要自己处理16S数据的同学,整理了一下高通量16S rDNA下机数据处理过程中的常用软件(课题组没钱租不起服务器,只能用自己的小笔记本处理)。希望对大家有所帮助。

平台搭建

高通量测序数据分析常用操作系统为Linux系统,序列比对、过滤、质控等诸多软件都是基于Linux系统开发的。建议安装Biolinux,为生物信息学开发的Linux系统,自带Qiime。Qiime 中集成了许多高通量数据处理工具。大家也可以使用官方提供的镜像进行安装(http://qiime.org/install/virtual_box.html)。

通过虚拟机在自己的笔记本上安装好linux系统和Qiime软件,之后就可以利用它们进行数据处理了。

数据预处理

利用Qiime对原始进行拼装,然后去除barcode,再去除引物,由于Qiime不能去除引物,所以需要借用mothur来去除引物(https://www.mothur.org/wiki/Category:Commands)

拼接的数据去除噪音: AmpliconNoise and Denoiser,也是基于Qiime平

嵌合体检测:chimera_check、pintail、mallard、bellerophon、chimeraslayer.

去除同聚体后的good序列,可以直接居聚类,生成OTU,Qiime提供三种OTU聚类的方式:1. De novo Clustering(从头自聚类)、2. Closed-Reference(封闭式)、3. Open-Reference(开放式)。关于聚类的教程:(http://blog.sina.com.cn/s/blog_670445240101n8n4.html)

利用Qiime生成OUT-table,所使用的命令:make_otu_table.py -i non_chimeric_seqs_otus.txt -t rep_set_tax_assignments.txt -o otu_table.biom ; 然后将信息转化为TXT格式:biom summarize-table -i otu_table.biom -o otu_table.txt 。

再将OUT-table转化为带有分类信息的文件,生成带有OTU分类信息的txt文件,所使用命令: biom convert -i otu_table.biom -o otu_table_with_taxonomy.txt --to-tsv --header-key taxonomy。再转换成Excel.

数据分析

基于OTU表格就可以进行多元分析了。

基于Qiime可以进行多样性分析有:α多样性、β多样性、系统发育树、PCoA分析。

分析到这一步Linux 系统上的工作就完成了,其他工作大家可以在Windows系统利用各类数据库和R语言进行数据处理和分析。在这里简单给大家介绍了一下用自己电脑安装了linux之后处理下机数据的软件,相关细节下次有机会再给大家介绍。(课题组还是有钱的好!)

本文由董小橙、江舜尧编辑。





(0)

相关推荐

  • MPB:使用QIIME 2分析微生物组16S rRNA基因扩增子测序数据(视频)

    为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...

  • 16s分析之Qiime聚类OTU

    首先Qiime官网命令都集中在这个网址,大家可以收藏,随用随查: http://qiime.org/scripts/index.html 这次我们关注的是聚类OTU,与其相关的命令如下: 这里主要有三 ...

  • 16s分析之Qiime数据整理+基础多样性分析

    还记得昨天最后一条命令吗? single_rarefaction.py -i otus/otu_table_mc2_w_tax.biom -ootu_table_even6073.biom -d 60 ...

  • 16s分析之PCoA分析学习笔记

    今天我们来一起学习一下PCoA分析:PCoA可以使用很多种距离的相异或者相似矩阵: 基于关联矩阵,所以它也会有表征其重要性的特征根: ################################# ...

  • phyloseq入门

    翻译:文涛 写在前面: 最近一段时间面临着各种各样的问题和挑战,总在寻求一种可以权衡,理解,解释,解决之道. phyloseq:使用R语言分析微生物群落(microbiome census data) ...

  • 16s分析之Qiime中一些常用的命令学习笔记

    首先提出一个问题:我们在测序公司得到数据,可能他们会给跑出otu.table文件,但是没有进化树,在影响到了后续的Aplha,beta多样性分析: 让我们开始解决这个问题: # 物种注释(如果没有注释 ...

  • phyloseq-对象构建-2-Qiime输出数据

    本文作者:xph phyloseq 对象构建 为何要使用 phyloseq 简称ps.公众号推出的多篇教程中,均使用ps对象,其可实现多种分析与可视化,无需再为数据形式而烦恼. 本次推送提供两种生成方 ...

  • 16s分析之Tax4Fun功能预测使用笔记

    有一天我在网上发现了这篇文章(当然我是后知后觉): 看到了这张图片: 穷人总是想法多,处于做功能预测的需求,而且本人做的是土壤,我看到这里,就想尝试一下这种方法: 官方网址:http://tax4fu ...

  • 技术贴 | 16S专题 |基于QIIME2 dada2插件的16S扩增子测序数据的分析流程详解(下)

    本文由Bayegy根据实践经验而整理,希望对大家有帮助. 原创微文,欢迎转发转载. 导  读 明明测了100000条序列,为什么我用dada2得到的OTU丰度只有8000?是人性的扭曲还是道德的沦丧? ...

  • 技术贴 | 16S专题 | 初学者如何深入解读16S rDNA扩增子测序数据,从而选择自己的分析步骤(满满干货~)

    导  读 网络上有很多16S rDNA扩增子测序数据的详细分析流程.但是很多初学者在拿到测序公司给的测序数据时,仍然不知道从何下手.究其原因,我们从测序公司拿到的数据是五花八门的,网上的分析流程虽然详 ...

  • 技术贴 | 16S测序简介 | 16S专题

    编前语 随着假期的结束,老师们的数据分析结果也陆陆续续回来了或即将回来. 然而,面对一大堆的图表文件,是不是有种明知此地有宝藏却不知从何寻起的懵圈感? 没关系,在接下来的一个月里,小编将在每周五和您一 ...

  • 简单介绍各类化肥的不同特性

    时间:2018/3/13 16:27:57       作者:翻堆机 翻堆机: 常用的肥料有很多种,不同的肥料性状有别,用法也各不相同,有的适宜作底肥.有的适宜作追肥,有的适宜作种肥,不同的作物对化肥 ...

  • 我是怎样从基本面分析转向技术分析的 最简单有效的交易规则

    我们对世界的认知总是片面的,主观的,如同盲人摸象.这是没有办法改变的事实. 无论你怎么努力,你对事物的认识都不能达到客观真相. 这也是索罗斯的交易理论的基础. 因为人们的认知错误,市场会扭曲,扭曲到一 ...

  • 简单介绍珍珠的挑选方法和鉴别

    珍珠有着"珠宝皇后"的美誉,其制成的珍珠项链拥有着无可比拟的高雅气质,是众多女性朋友出息重要场合的必备之物,近年来,随着各种设计理念的创新,珍珠开始与黄金.铂金等各种材质搭配,珍珠 ...

  • 简单介绍重晶石

    重晶石是以硫酸钡(BaSO4)为主要成分的非金属矿产品,纯重晶石显白色.有光泽,由于杂质及混入物的影响也常呈灰色.浅红色.浅黄色等,结晶情况相当好的重晶石还可呈透明晶体出现.重晶石系硫酸盐矿物.成分为 ...

  • 天津除了南开大学、天津大学之外,还有其他好大学吗?简单介绍其他8所大学,低调而实力强

    有人问,除了天大和南开,天津还有什么好大学? 这个问题很好,天津大学和南开大学名头太响,在它们的光芒之下,很多天津的大学都是默默无闻,其实还是有不少好大学的,否则大家也不会羡慕天津考生全国最高的一本录 ...

  • 简单介绍长江大学:长江大学的来历怎样?王牌专业和就业是什么?

    前几天,我写了一篇三峡大学的文章,有人说,三峡大学叫长江大学,就更有气魄了. 我不知道三峡大学有没有想过长江大学这么名字,不过2003年之后,它就没法想了,因为有了长江大学了. 三峡大学主要是水电.电 ...