教程 | 全基因组特征标记可视化 - TBtools 太简单!

写在前面

全基因组层面可视化特征标记(如基因位点),从文字标签到图形标签。文字标签应该是三四年前实现的。图形标签,Emmm,事实上,这个功能已经实现了太久,以至于我自己只记得可以实现,而不记得如何使用。考虑到昨天推出这个功能后,不少朋友还是挺感兴趣,于是想了一下,那就干脆写一个教程贴。大体介绍下,这个功能到底咋用。

IOS 逻辑

前述我在推文和几场直播中,都已经提及 TBtools 的 IOS 逻辑。相信大家都不陌生。此处我们直接进入主题,看看具体可视化所需的文件及其格式:

以下逐个文件展开说明

染色体长度文件

顾名思义,记录了每条染色体的长度信息。只要有基因组序列文件,可以使用 TBtools 的 Fasta Stat 直接生成一个。如下

于是可以得到

特征标记的染色体位置

这个文件,得靠大家自己准备了。比如可以是某个基因家族的成员,或差异表达基因分布,更或者分支标记等信息。此处,我们使用 sRNAanno 数据库上 水稻 的 PHAS 注释信息,进行可视化。直接在
http://plantsrna.org/PHAS21list.jsp?species=Oryza_sativa 页面复制,保存到本地 txt 文件即可。对应的 24 nt PHAS的链接为 http://plantsrna.org/PHAS24list.jsp?species=Oryza_sativa

注意,在Excel里面做文本整理,记得另存为 制表符分隔 的文本文件。

特征标记的着色信息

TBtools 支持两类输入:

  1. 标记ID\tR,G,B

  2. 标记ID\tlog2Fc

很明显,前者的意思是,对标记ID进行颜色自定义,后者是一个偷懒过程。比如log2Fc是正数,那么就会显示为红色,是负数就会显示为绿色。对于 PHAS 位点,有不成文的着色方案。所以 21 PHAS 位点,我们全部给蓝色,而 24 PHAS 位点,我们全部给橙色,如下,

染色体热图信息文件

(0)

相关推荐