持续改进 | 全基因组特征标记可视化 - TBtools
写在前面
这两三天,主要是优化了 TBtools 的一些可视化功能。其中包括 JIGplot 的增强。有一定的效果。改动很多,也有不少新的思路和实现,但能用文字写出来,或者写出来大伙乐意看的东西似乎不多。想来想去,那么还是有一个可以写写。
全基因组水平展示基因标签
很多时候,我们需要一个概览,看看我们感兴趣的基因组特征具体的分布情况。最为常见的,或许就是看看某个基因家族成员或者某些基因在染色体上的分布情况。比如
事实上,这个还是挺有用的,起码在发现规律上。
增加染色体热图
前述,认为上图还是太单调,于是写了 Gene Density Profile,可用于统计全基因组的基因密度。基于此,可以直接展示全基因组的基因密度,显得整个图片饱满。当然如何解读,是否有必要,是另外的问题。
文字标签?还是图形标签
博士毕业课题开展过程中,我需要精细鉴定荔枝的小RNA位点,包括miRNA,phasiRNAs等。写了sRNAminer,得到结果后,可视化是个问题。总不能直接给个表格,没有Fig。但 ~500Mb 的植物基因组,miRNA 在 200 个左右。而phasiRNAs,在双子叶上,也大概有这个数目(21 PHAS 和 24 PHAS 加和就更多了)。大概 500 个基因 ID 在全基因组展示,是没有意义的。于是,索性支持了图形标签。最后得到下述结果(感兴趣的....等看我毕业论文的图例吧)
看起来还不错
图形标签也会遇到麻烦
项目需要,要在某个物种上,同样可视化其小RNA位点。可视化本身并不是问题,问题在于可视化的结果,如下
可以看到,这个物种的小RNA位点实在太多,以至于... 图之大,一屏容不下。
思来想去,想到了一个解决办法。于是又是一顿Coding。
这样看起来就舒服得多。直接把距离不超过100Kb的位点合并在一起展示。稍微放大下图片就可以看到,
数字代表指定个位点合并展示。感觉还不错。
但事实上,出完图,多少我自己还是不够满意。
优化到我自己满意为止
折腾了也有一个晚上,确实是不想整了。睡了一觉起来,还是不爽。因为这个图。出现了一些比较不协调的位置:
少数文本标签似乎靠得太近
染色体到图形标签之间的连线确实不够好看。
于是,又鼓捣了一个早上。期间事实上,对JIGplot的一些类进行了调整和增强,最终得到如下
或者
对比下之前的,就会发现,新的图片,图形标签的重叠处理做得更好。同时连线问题也得到优化。
写在最后
追求卓越,成功就会紧随而至。