jolytree | 从 基因组序列 直接 建树~超快速!
写在前面
“快速”!“不需要序列比对”!“准确”!”系统进化树“ !!!
This procedure is a useful approach for quickly inferring species trees
without the burden and potential biases of multiple sequence alignments --Jolytree在CJ推荐下,瞄了一下文章,感觉是个实用的工具,准备下手试一试。
doi:
10.3897/rio.5.e36178
安装
惯例先看conda能不能安装
conda install -c bioconda jolytree
或者下载git-hub上的安装包
git clone https://gitlab.pasteur.fr/GIPhy/JolyTree.git
并且伴有大量依赖包需要安装
#
mash (Ondov et al. 2016) version >= 1.0.2;
binaries: github.com/marbl/Mash/releases
sources: github.com/marbl/Mash
#
gawk version >= 4.1.0
sources: ftp.gnu.org/gnu/gawk
#
FastME (Lefort et al. 2015) version >= 2.1.5.1
sources: gite.lirmm.fr/atgc/FastME
#
REQ version >= 1.2
sources: gitlab.pasteur.fr/GIPhy/REQ
下载之后还要修改 JolyTree.sh 文件
主要是添加 mash, gawk, FastME 和REQ的位置。
建议查看jolytree的README
数据准备
mkdir Jolytree && cd Jolytree
mkdir genome && cd genome
#准备相关基因组序列文件在genome文件夹即可
准备测试6套基因组的系统进化树
运行
开始时间:21:27
JolyTree.sh -i genome -b test -t 8 &>jolytree.log
使用的参数解析
-i 输入带有基因组序列文件的文件夹;只能识别:.fa/.fna/.fasta/.fas四种后缀格式。
-b basename输出文件以此为前缀
-t 使用的线程数量
运行时间:13~15min 6个物种。
速度还是很理想的。
结果解析
会生成四个文件在Jolytree文件夹内
test.d
PHYLIP 格式的(修正的)成对进化距离矩阵test.oepl
以每行格式的 每对物种的p值距离test.acgt
A/C/G/T的残基计数test.nwk
是主要关心的结果~
((Citrus_sinensis.genome:0.159135886250,((Cucumis_sativus.genome:0.171662675000,Arabidopsis_thaliana.genome:0.206346965000)1.000:0.006246766250,Capa.0_4:0.149529908750)0.750:0.003642808750)0.667:0.005885428750,S_lycopersicum_chromosomes.4.00:0.187912683750,Vvinifera_145_Genoscope.12X:0.140575526250);
展示
甜橙、葫芦、拟南芥和番木瓜进化关系是没问题。
番茄和葡萄分歧时间相距比较近,所以也比较难区分。
总体而言还是能快速预测一个较准确的结果。
最后
测评了Jolytree,个人认为还是非常简单、实用、快速的工具。
另外,不知道能否用在重测序群体的关系预测?
若是结果也相对可靠,还是能在预判工作上提供了时间的便利。
赞 (0)