USEARCH11新功能简介

USEARCH是继Mothur、QIIME后的第三大流行扩增子分析流程,目前引用12893次。由Robert Edgar大神独立编写。官方网址:http://www.drive5.com/usearch/

详细介绍,请参阅

  • 扩增子分析神器USEARCH

  • 扩增子分析还聚OTU就真OUT了

软件优缺点

  • 优点

跨平台
体积小巧
易用

  • 缺点

软件64位版收费
代码不开源

v11新功能

就在2018年7月末,USEARCH(Ultra-fast sequence analysis)扩增子分析神器迎来了其第11个大版本,

具体有哪些新功能呢?

详见此页:

http://www.drive5.com/usearch/manual/whatsnewv11.html

主要新增了6大新功能,21个新命令,下面进行简介。

新特征

  • 机器学习:主要包括随机森林、多次交叉验证、OTU分类重要性,包括的命令有森林训练、森林分类和森林交叉验证

  • 改进嵌合体检测

  • 新增了两种Alpha多样性指数:Mirror estimator、 Singleton-free (FE) estimator

  • Octave plot(八度图)展示Alpha多样性,方便观察样本品中真实序列、测序错误和嵌合体数量

  • 样品组间多样性比较

  • 同一性交驻验证特征预测的准确率

新命令

  1. calc_lcr_probs: Calculate lowest common rank probabilities 计算序列物种分类各级概率

  2. cluster_tree: Construct clusters from tree using distance cutoff 基于树文件聚类

  3. distmx_split_identity: Split distance matrix into test/training pair for CVI 拆分距离矩阵为测试和训练集

  4. fastx_syncpairs: Sort forward and reverse reads into the same order 双端序列找成队并排序

  5. fastx_trim_primer: Remove primer-binding sequence from FASTx file 引物匹配并切除

  6. forest_classify: Classify data using random forest 随机森林分类预测

  7. forest_train: Train random forest classifier 随机森林分类器建立

  8. nbc_tax: Predict taxonomy using RDP Naive Bayesian Classifier algorithm 采用RDP算法预测分类学物种注释

  9. otutab_binary: Convert OTU table with counts to presence(1) / absence(0) 转换OTU表为二元(有、无)形式

  10. otutab_forest_classify: Classify samples using random forest 样品随机森林分类

  11. otutab_core: Identify core microbiome in OTU table 鉴定OTU表中核心微生物组

  12. otutab_forest_train: Train random forest classifier on OTU table 基于OTU表的随机森林训练

  13. otutab_otus: Extract OTU labels from OTU table 提取OTU表中的OTUs

  14. otutab_rare: Sub-sample OTU table to same number of reads per sample 抽样标准化OTU表

  15. otutab_samples: Extract sample labels from OTU table 提取OTUs表中样品名

  16. otutab_select: Identify OTUs which are informative (correlate with metadata) 鉴定更有信息的OTUs,,即组间差异OTUs

  17. otutab_xtalk: Identify cross-talk using improved algorithm (UNCROSS2) 改进算法鉴定嵌合

  18. search_pcr2: In-silico PCR, search for matches to primer pair 电子PCR,基于引物匹配扩增区

  19. subtree: Extracts subtree under given node 提取树中指定结点的子树

  20. tabbed2otutab: Convert read mapping file (read+OTU) to OTU table 单行表格转换为OTU表

  21. tree_subset: Extract subset of tree for given set of leaf labels 根据树叶标签提取子集

(0)

相关推荐