扩增子数据是否应该抽平?还是标准化?
写在前面
做扩增子数据分析经常遇到一个问题?我们是否应该抽平数据呢?还是只需要做标准化就可以了?在微生信生物群中有许多人都问过这样的问题。这里我也将这个答案分享给大家。
抽平
实际上,抽平被许多数据分析工作者不愿意采用,相信大家都知道了,但是alpha多样性的分析在目前看来只能通过抽平进行后续的计算。所以如果要计算alpha多样性,就需要抽平。
满足下面两个条件要抽平
如果测序样本之间序列数差异在10倍以上,则需要对序列数高的样本进行抽平。
如果样本集中有部分样本序列数量少于10000条,也需要抽平。
抽平不可以做什么分析
基于抽平的序列可以做alpha多样性分析,也可以做beta排序和距离分析,但是如果要做差异检测,我们推荐不要使用抽平操作,推荐使用DESeq2和Edger包自带的数据标准化步骤。
最后,希望大家数据做的顺利,科研步步高。
相关推荐
-
技术贴 | 16S专题 | 初学者如何深入解读16S rDNA扩增子测序数据,从而选择自己的分析步骤(满满干货~)
导 读 网络上有很多16S rDNA扩增子测序数据的详细分析流程.但是很多初学者在拿到测序公司给的测序数据时,仍然不知道从何下手.究其原因,我们从测序公司拿到的数据是五花八门的,网上的分析流程虽然详 ...
-
16s扩增子测序分析全流程详解
扩增子测序是一种高靶向性方法(对特定长度的PCR产物或者捕获的片段进行测序),用于分析特定基因组区域中的基因变异.PCR产品(扩增子)的超深度测序可以有效地识别变异并对其进行特征分析.总体思路是靶向地 ...
-
科研 | Nature 子刊: 小鼠肠道微生物生物库扩大了培养细菌的覆盖范围(国人作品)
编译:小鹿同学,编辑:小菌菌.江舜尧. 原创微文,欢迎转发转载. 导读 肠道微生物组(GM)的研究中常常使用小鼠作为实验模型,但大多数小鼠GM成员仍未被鉴定.本文中,研究者构建了迄今为止最大的小鼠肠道 ...
-
16S结题报告 | 16S专题
编前语 从上节<16S简介>,我们可以推测得到,选择16S测序,往往是为了了解样品的微生物的群落多样性.那么16S rDNA测序解题报告主要包括哪些内容呢? 我们先来看看一般的16S结题报 ...
-
MPB:遗传发育所刘永鑫等-易扩增子:易用、可重复和跨平台的扩增子分析流程
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...
-
MPB:使用QIIME 2分析微生物组16S rRNA基因扩增子测序数据(视频)
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...
-
R语言实现扩增子数据抽平算法
写在前面 现在是20年2月中旬了,今年注定是不平凡的一年,尽然现在都还在家中.但是任务量还是十分繁重.谁让做生物信息的也不用限制什么地点. 为什么我要实现抽平算法呢?16年phyloseq的出现很对我 ...
-
袁隆平有多牛——八组数据缅怀袁隆平
新华社记者从中南大学湘雅医院获悉,"杂交水稻之父".中国工程院院士."共和国勋章"获得者袁隆平,5月22日13点07分在湖南长沙逝世,享年91岁. 袁隆平是我国 ...
-
16S扩增子数据提交GSA实操手册—发表文章前必备技能
GSA简介 GSA是Genome Sequence Archive的缩写,即基因组序列存档,由中科院基因组所主办. 网址:http://gsa.big.ac.cn/ 之前介绍过NCBI提交测序数据,- ...
-
MPB:中科院微生物所蔡磊组-基于扩增子数据的系统发育树的构建和展示
为进一步提高<微生物组实验手册>稿件质量,本项目新增大众评审环节.文章在通过同行评审后,采用公众号推送方式分享全文,任何人均可在线提交修改意见.公众号格式显示略有问题,建议电脑端点击文末阅 ...
-
抽平计算alpha多样性有多大概率出错?怎么办?
写在前面 我们目前只能使用抽平的方式计算alpha多样性,然而有一定的概率出错. 请看下面的图示: 我们看到,让每个环境都抽取两个物种时,物种数量可能出现评估错误.这种抽平会影响稀有物种的评估.但是随 ...
-
ampvis2 一个用于分析和可视化16S rRNA扩增子数据的R包
ampvis2: an R package to analyse and visualise 16S rRNA amplicon data View ORCID ProfileKasper S. An ...
-
张家口又排倒数第一了,看完这数据,我又抽了自己个嘴巴!
省统计局今日公布了2015年全省城镇单位就业人员平均工资.哪个市平均工资最高?哪个行业的工资收入最多?张家口市平均工资排第几?请往下看↓↓↓ 2015年城镇非私营单位就业人员年平均工资50921元 2 ...
-
基于扩增子数据的宏观生态学研究
仅仅基于扩增子序列数据分析就能够发Nature Microbiology,该杂志2016年1月创刊,微生物研究领域顶尖期刊之一,最新SCI影响因子达14.174,Nature出品必是精品. 整合全球土 ...
-
数据的标准化处理:分享几种常用方法
我们在进行临床研究时,通常会收集大量不同的指标变量,每个指标的性质.量纲.数量级等特征,均存在一定的差异.针对涉及多个不同指标综合起来的评价模型,由于各个指标的属性不同,无法直接在不同指标之间进行比较 ...