环境微生物生态问题集合答疑-总结
[toc]
写在前面
非常感谢韦老师和凌恩公司举办的多次微生物领域的讲座,虽然之前的一段时间我没足够的时间听直播,幸好有回放,因为这里面的东西实在都是我们都在思考和目前的一些热点。这次第五期我周末抽了一点时间看完,已经有很大的帮助了,虽然一些问题并不能有一个好的解释,但是我们最起不在彷徨,大佬都不纠结,我们也不用怎么过度思考。
问题总结
扩增子研究中批次效应太大,尽量不要多次测样
扩增子分析尽量使用ASV来聚类OTU,认可比较大,比较主流
系统发育在组间比较还是要注意,邓老师作为开发者目前也只是在组内比较。
建议做系统发育分析要比对方法之间的适应性,而不是简单的借用,参考使用。
稀有物种是否可靠是作为是否用其来参与系统发育分析的一个评价指标。
核心物种很热,但是没有标准,用问题来评估,或者制定标准。
问题
第一个问题:菌群构建:有时候用零模型,有时候用中性理论?
理解看到的群落,通过方法打乱群落,选择方法很重要,评估选择的方法,但往往跟着别人走。目前呢主要有零模型,中性理论,还有那个打乱进化树的那个方法。背后机理,假设不同,最终选择哪种方法,建立进行一系列条件的比较。使用比较的方法,不要仅仅看比率,要比较,看不同群落之间过程的差异。
第二个问题 :核心微生物的定义是?
划分是局限的,但是很重要。微生物量很重要,做研究的话,划分标准,要根据研究范围和科学问题调整:
从南到北核心微生物会有一些变化,如果使用同一种标准挑选,那就是广泛分布种。
如果通过一个地点选择核心微生物,然后从南到北比较,那就是核心微生物的变化过程。
所以与科学问题有关系,目前没有标准。只有问题。
自己构建分析系统,有什么建议?
扩增子测序平台:看你的目标是什么?只是做一个扩增子标准分析,没有必要做这样一个分析平台。邓老师和别人合作比较多,希望把平台规范化,所以构建了平台,这是目标。最麻烦的选用什么工具,评估工具,规范最好。目前每个人不一样
基本上就是买一台服务器,邓老师使用的平台已经有框架了,自己构建的功能并构建到平台上。
群落装配,零模型计算bNTI的数据过滤问题?
组装研究过程中,发展非常快,方法不断跟新,领域只是个初级阶段,不够稳定,可能会得到不同结果,不同设置:数据过滤,不同比例的应用。
最简单的评价规则:数据过滤的判断通常来讲,理解数据中的稀有物种,认为这部分是否可靠。实际上其他分析里面,一开始就直接去掉了,asv默认序列提取就大于10个序列以上(这是usearch),所以OTU的表是否可靠,不要保留过多的稀有物种。
第一个bNTI这个方法基于树的打乱。和序列的可靠程度有密切关系。所以可靠的OTU数据。第二个,我们认为比率上并不是一个绝对的量,组内的和组间的不同,我通常选择组内的进行比较,建议谨慎,组装过程往往使一个点,传递的信息往往具有承接性,用多种方法同时功巩固同一个结果。
二分网络:跨界互作,细菌和古菌关系?等和其他等都会有类似的应用?
从原理上来讲都是可以使用的,使用规范上和解释程度上,我门开发的都是一种推测的相关,还需要验证是否存在这种情况。
网络只是个方法,生物学解释和结论需要用生物学证据来证明。
宏基因组样本组装?依据是什么?config的使用
宏基因组发展很快,组装工具的使用,内部参数使用,通常来说速度和准确性的平衡,宏基因组分析里面还要看完整度,选用方法得到的contig,感觉不太好想改变,想相对完整组装好一些。
我们知道环境微生物,近源非常多,所以得到的不是一种菌的contig?没有对和错,因为本来就不知道。希望得到比较长的contig,进一步分析,但是出现错误的情况,可能性会逐渐增多。确实要小心,这些不是一个种,是好几个种的混合。不同的人,都会用自己的方法。这个领域发展很快,数据的应用是一个巨大的挑战。
全长的问题-16s全长?
邓老师认为这是一个趋势,哟比较大的好处,信息部较多,比较完整,个人认为是挺重要的,但是经费?所以应用起来不是很多,权衡的过程。
16s测序仅仅提供的最基本的群落变化的依据,深入往下做的,那还需要做全长吗?现在微生物群落测定成本依据很低了,已经常态化的一个指标,只能得到一个基本的信息。
邓老师认为这是一个很重要的方向。三代测序成本会高一些,但是会之间下降。
网络分析群落互作功能关联?
抗性基因和氮循环数据库邓老师做了,那有没有考虑其他数据库?
都在向功能来聚焦,想着方向发展,邓老师认为这是发展方向,做完16s之后会逐渐往这个方向发展,只有功能才会是生态方向的变化,这个才能弄清楚生态的功能变化。是一个方向,一个重点。
但,抗性基因,等其他功能,为什么我们关注这方面呢个?这些方面研究的基础会多一些,碳,微生物是分解者,为什么?因为降解碳,还给生态系统。微生物碳非常重要,降解是关注点,但是太复杂,每一个微生物都在承载碳循环的过程,但是碳源的利用会有倾向性,基因组上和碳循环相关的基因非常多,降解的完全不一样,邓老师在做一些尝试,但是太复杂,选择功能基因会很困难。
因此做一些目标性的基因,甲烷降解等,邓老师也在做一些工作。
OTU和asv
ASV有几个主要的方法,OTU给定阈值,在感念上不同
单一碱基不同就不同,97%会有一些一样
ASV方法在去除不可靠序列会有自己的标准,好像和OTU的方法不同,有的时候差距十倍?
有时候却差不多?
等
如何选用?
常用的ASV方法,因为常用,OTU不足,实际上得到的结果不足,ASV在普遍上的接受程度非常高。
OTU的好处是允许少量碱基的变化,这种误差可以消除,但是ASV来做的话无法去除这种影响,因此,在扩增上如果使用ASV的话尽量使用高保真酶。
测序批次的问题?
去除批次差异,回归样本或则分组之间的差异比较;
说实话邓老师以前也关注这些问题,不同实验室,测序平台,往往不同,影响很大,也可以比较,用的方法也没有一个合理可靠的方法,通常来讲,我们要比较差别在哪里,首先去除稀有物种,序列数量比较少的去除。但是也不一定,和测序平台等有关系。
好一点就是尽量一次测定。
或者重新在测定一次。当然尤其是高丰度的微生物是可以整合在一起的。
反应器 群落简单?反而好做
做反应器的生态学的东西?是否会容易?