linux(1)-- gffread
gffread
gffread: used to generate a FASTA file with the DNA sequences for all transcripts in a GFF file
软件安装
方法1:源码安装
#从源代码构建gffread需要GCLib源代码库。 如果未找到../gclib目录,则make命令应自动从存储库中获取最新的gclib版本。
cd /some/build/dir
git clone https://github.com/gpertea/gclib
git clone https://github.com/gpertea/gffread
cd gffread
make release
方法2:conda安装(建议使用conda安装)
conda install gffread -y
方法3:cufflinks 因为gffread其实是cufflinks自带的一个小软件。所以如果你的系统中已安装过cufflinks,那么就不必再单独安装gffread了。
软件使用示例
使用起来非常简单。
提取转录本序列
gffread genome.gff -g genome.fa -w transcript.fa
提取cds序列
gffread genome.gff -g genome.fa -x cds.fa
提取蛋白序列
gffread genome.gff -g genome.fa -y pep.fa
gff2gtf
gffread my.gff3 -T -o my.gtf
gtf2gff
gffread my.gtf -o- > my.gff3
延伸
如果想了解gff与gtf文件的区别,请参考以前的文章:GFF和GTF的异同及相互转换
想了解更详细的参数命令或其他功能,请自行使用
gffread -h
查阅
参考
Pertea G and Pertea M. GFF Utilities: GffRead and GffCompare [version 1; peer review: 3 approved]. F1000Research 2020, 9:304. DOI: 10.12688/f1000research.23297.1
赞 (0)