USEARCH11新功能简介
USEARCH是继Mothur、QIIME后的第三大流行扩增子分析流程,目前引用12893次。由Robert Edgar大神独立编写。官方网址:http://www.drive5.com/usearch/
详细介绍,请参阅
扩增子分析神器USEARCH
扩增子分析还聚OTU就真OUT了
软件优缺点
优点
跨平台
体积小巧
易用
缺点
软件64位版收费
代码不开源
v11新功能
就在2018年7月末,USEARCH(Ultra-fast sequence analysis)扩增子分析神器迎来了其第11个大版本,
具体有哪些新功能呢?
详见此页:
http://www.drive5.com/usearch/manual/whatsnewv11.html
主要新增了6大新功能,21个新命令,下面进行简介。
新特征
机器学习:主要包括随机森林、多次交叉验证、OTU分类重要性,包括的命令有森林训练、森林分类和森林交叉验证
改进嵌合体检测
新增了两种Alpha多样性指数:Mirror estimator、 Singleton-free (FE) estimator
Octave plot(八度图)展示Alpha多样性,方便观察样本品中真实序列、测序错误和嵌合体数量
样品组间多样性比较
同一性交驻验证特征预测的准确率
新命令
calc_lcr_probs: Calculate lowest common rank probabilities 计算序列物种分类各级概率
cluster_tree: Construct clusters from tree using distance cutoff 基于树文件聚类
distmx_split_identity: Split distance matrix into test/training pair for CVI 拆分距离矩阵为测试和训练集
fastx_syncpairs: Sort forward and reverse reads into the same order 双端序列找成队并排序
fastx_trim_primer: Remove primer-binding sequence from FASTx file 引物匹配并切除
forest_classify: Classify data using random forest 随机森林分类预测
forest_train: Train random forest classifier 随机森林分类器建立
nbc_tax: Predict taxonomy using RDP Naive Bayesian Classifier algorithm 采用RDP算法预测分类学物种注释
otutab_binary: Convert OTU table with counts to presence(1) / absence(0) 转换OTU表为二元(有、无)形式
otutab_forest_classify: Classify samples using random forest 样品随机森林分类
otutab_core: Identify core microbiome in OTU table 鉴定OTU表中核心微生物组
otutab_forest_train: Train random forest classifier on OTU table 基于OTU表的随机森林训练
otutab_otus: Extract OTU labels from OTU table 提取OTU表中的OTUs
otutab_rare: Sub-sample OTU table to same number of reads per sample 抽样标准化OTU表
otutab_samples: Extract sample labels from OTU table 提取OTUs表中样品名
otutab_select: Identify OTUs which are informative (correlate with metadata) 鉴定更有信息的OTUs,,即组间差异OTUs
otutab_xtalk: Identify cross-talk using improved algorithm (UNCROSS2) 改进算法鉴定嵌合
search_pcr2: In-silico PCR, search for matches to primer pair 电子PCR,基于引物匹配扩增区
subtree: Extracts subtree under given node 提取树中指定结点的子树
tabbed2otutab: Convert read mapping file (read+OTU) to OTU table 单行表格转换为OTU表
tree_subset: Extract subset of tree for given set of leaf labels 根据树叶标签提取子集