linux(1)-- gffread

gffread

gffread: used to generate a FASTA file with the DNA sequences for all transcripts in a GFF file

软件安装

  • 方法1:源码安装

#从源代码构建gffread需要GCLib源代码库。 如果未找到../gclib目录,则make命令应自动从存储库中获取最新的gclib版本。
cd /some/build/dir
git clone https://github.com/gpertea/gclib 
git clone https://github.com/gpertea/gffread
cd gffread
make release

  • 方法2:conda安装(建议使用conda安装)

conda install gffread -y

  • 方法3:cufflinks 因为gffread其实是cufflinks自带的一个小软件。所以如果你的系统中已安装过cufflinks,那么就不必再单独安装gffread了。

软件使用示例

使用起来非常简单。

  1. 提取转录本序列

gffread genome.gff -g genome.fa -w transcript.fa

  1. 提取cds序列

gffread genome.gff -g genome.fa -x cds.fa

  1. 提取蛋白序列

gffread genome.gff -g genome.fa -y pep.fa

  1. gff2gtf

gffread my.gff3 -T -o my.gtf

  1. gtf2gff

gffread my.gtf -o- > my.gff3

延伸

  • 如果想了解gff与gtf文件的区别,请参考以前的文章:GFF和GTF的异同及相互转换

  • 想了解更详细的参数命令或其他功能,请自行使用gffread -h查阅

参考

  • Pertea G and Pertea M. GFF Utilities: GffRead and GffCompare [version 1; peer review: 3 approved]. F1000Research 2020, 9:304. DOI: 10.12688/f1000research.23297.1
(0)

相关推荐