教程 | 全基因组特征标记可视化 - TBtools 太简单!
写在前面
全基因组层面可视化特征标记(如基因位点),从文字标签到图形标签。文字标签应该是三四年前实现的。图形标签,Emmm,事实上,这个功能已经实现了太久,以至于我自己只记得可以实现,而不记得如何使用。考虑到昨天推出这个功能后,不少朋友还是挺感兴趣,于是想了一下,那就干脆写一个教程贴。大体介绍下,这个功能到底咋用。
IOS 逻辑
前述我在推文和几场直播中,都已经提及 TBtools 的 IOS 逻辑。相信大家都不陌生。此处我们直接进入主题,看看具体可视化所需的文件及其格式:
以下逐个文件展开说明
染色体长度文件
顾名思义,记录了每条染色体的长度信息。只要有基因组序列文件,可以使用 TBtools 的 Fasta Stat 直接生成一个。如下
于是可以得到
特征标记的染色体位置
这个文件,得靠大家自己准备了。比如可以是某个基因家族的成员,或差异表达基因分布,更或者分支标记等信息。此处,我们使用 sRNAanno 数据库上 水稻 的 PHAS 注释信息,进行可视化。直接在
http://plantsrna.org/PHAS21list.jsp?species=Oryza_sativa 页面复制,保存到本地 txt 文件即可。对应的 24 nt PHAS的链接为 http://plantsrna.org/PHAS24list.jsp?species=Oryza_sativa
注意,在Excel里面做文本整理,记得另存为 制表符分隔 的文本文件。
特征标记的着色信息
TBtools 支持两类输入:
标记ID\tR,G,B
标记ID\tlog2Fc
很明显,前者的意思是,对标记ID进行颜色自定义,后者是一个偷懒过程。比如log2Fc是正数,那么就会显示为红色,是负数就会显示为绿色。对于 PHAS 位点,有不成文的着色方案。所以 21 PHAS 位点,我们全部给蓝色,而 24 PHAS 位点,我们全部给橙色,如下,