jolytree | 从 基因组序列 直接 建树~超快速!

写在前面

  • “快速”!“不需要序列比对”!“准确”!”系统进化树“ !!!

  • This procedure is a useful approach for quickly inferring species trees
    without the burden and potential biases of multiple sequence alignments --Jolytree

  • 在CJ推荐下,瞄了一下文章,感觉是个实用的工具,准备下手试一试。

  • doi: 10.3897/rio.5.e36178

安装

惯例先看conda能不能安装

conda install -c bioconda jolytree

或者下载git-hub上的安装包

git clone https://gitlab.pasteur.fr/GIPhy/JolyTree.git

并且伴有大量依赖包需要安装

#mash (Ondov et al. 2016) version >= 1.0.2;binaries: github.com/marbl/Mash/releasessources: github.com/marbl/Mash#gawk version >= 4.1.0sources: ftp.gnu.org/gnu/gawk#FastME (Lefort et al. 2015) version >= 2.1.5.1sources: gite.lirmm.fr/atgc/FastME#REQ version >= 1.2sources: gitlab.pasteur.fr/GIPhy/REQ
  • 下载之后还要修改 JolyTree.sh 文件

  • 主要是添加 mash, gawk, FastME 和REQ的位置。

  • 建议查看jolytree的README

数据准备

mkdir Jolytree && cd Jolytreemkdir genome && cd genome#准备相关基因组序列文件在genome文件夹即可

准备测试6套基因组的系统进化树

运行

开始时间:21:27

JolyTree.sh -i genome -b test -t 8 &>jolytree.log

使用的参数解析

-i 输入带有基因组序列文件的文件夹;只能识别:.fa/.fna/.fasta/.fas四种后缀格式。-b basename输出文件以此为前缀-t 使用的线程数量

运行时间:13~15min 6个物种。
速度还是很理想的。

结果解析

  • 会生成四个文件在Jolytree文件夹内

  • test.d
    PHYLIP 格式的(修正的)成对进化距离矩阵

  • test.oepl
    以每行格式的 每对物种的p值距离

  • test.acgt
    A/C/G/T的残基计数

  • test.nwk
    是主要关心的结果~

((Citrus_sinensis.genome:0.159135886250,((Cucumis_sativus.genome:0.171662675000,Arabidopsis_thaliana.genome:0.206346965000)1.000:0.006246766250,Capa.0_4:0.149529908750)0.750:0.003642808750)0.667:0.005885428750,S_lycopersicum_chromosomes.4.00:0.187912683750,Vvinifera_145_Genoscope.12X:0.140575526250);

展示

  • 甜橙、葫芦、拟南芥和番木瓜进化关系是没问题。

  • 番茄和葡萄分歧时间相距比较近,所以也比较难区分。

  • 总体而言还是能快速预测一个较准确的结果。

最后

  • 测评了Jolytree,个人认为还是非常简单、实用、快速的工具。

  • 另外,不知道能否用在重测序群体的关系预测?

  • 若是结果也相对可靠,还是能在预判工作上提供了时间的便利。

(0)

相关推荐