lncRNA组装流程的软件介绍之transeq
咱们《生信技能树》的B站有一个lncRNA数据分析实战,缺乏配套笔记,所以我们安排了100个lncRNA组装案例文献分享,以及这个流程会用到的100个软件的实战笔记教程!
EMBOOS是一系列处理核酸序列和蛋白质序列的命令行工具的集合. 它包括了序列的提取, 查找, 比对和简单的序列分析等若干小程序. 它们都是独立的命令行工具, 所以用起来小巧而高效, 避免了图形界面程序和R/Python等编程工具的繁琐.
transeq是emboss里的一个工具
功能:把核酸序列翻译为氨基酸序列
官网:http://emboss.sourceforge.net/apps/cvs/emboss/apps/transeq.html
一、软件安装
使用conda安装
conda install emboss
二、transeq的用法
安装完成以后,可以使用transeq -h来查看软件的帮助文档。
2. 常用参数:
-frame=F # To translate a sequence in all three forward frames
-frame=R # To translate a sequence in all three reverse frames
-trim # This removes all 'X' and '*' characters from the right end of the translation.
The trimming process starts at the end and
continues until the next character is not a 'X' or a '*'
-clean # This changes all STOP codon positions
from the '*' character to 'X' (an unknown
residue). This is useful because some
programs will not accept protein sequences
with '*' characters in them.
三、输入文件
fasta格式的核酸序列
### 四、软件运行命令
```sh
transeq ../step3/intersection/filter3_by_noncoding_exon.fa filter4_protein.fa -frame=6
命令参数解读:
../step3/intersection/filter3_by_noncoding_exon.fa # 输入核酸序列
filter4_protein.fa -frame=6 # 输出氨基酸序列
-frame=6 # To translate a sequence in all six forward and reverse frames
五、输出文件
fasta格式的氨基酸序列
文末友情推荐
与十万人一起学生信,你值得拥有下面的学习班: