解读文献里的那些图—热图
相信很多小伙伴刚开始读文献的时候都会遇到这种情况:那些花花绿绿的好高级啊!那些线条好别致啊!这一坨坨黑色的没有什么不一样啊!
识图能力停留在只会看高中函数图象的自己,除了看热闹,完全不知道这一幅幅图代表着什么意思,看不懂图成了我们读文献的第一道坎。有句话说得好,三分文章七分图,一幅精美的Figure在一篇文献中的地位举足轻重,所以,想要速读文献,抓住重点,就要练就一眼看懂图的本领。那么,从今天开始,我将和大家一起学习、解读文献中出现的各种图表,从Figure出发,找到科研灵感。
话不多说,今天的图来了!
初读文献时,大家一定经常见到这种热图,花花绿绿,很是高大上!但其实它是数据表现的入门必备技术,相对也比较简单,那它到底有什么用呢?大家先来看这张表:
请在三秒钟内指出表中哪一块的数字较大?
黑人问号脸?三秒钟我一行数据都看不完!
但是如果看下面这张图,告诉你红色代表数字较大,原谅色代表数字较小:
大家是不是一眼就可以找到较大的数字在哪里!
没错,这就是热图!热图(Heat map)是一个以颜色变化来显示数据的矩阵。
它的用途主要包括两大方面:1)直观展示重点研究对象的表达量及数据差异变化情况;2)呈现多样本或多基因表达量的聚类关系。
其实天下各图本一家,和函数图像一样,只要搞懂纵坐标,横坐标代表什么,那么这幅图要表达的意思也就呼之欲出了。
比如这幅图,要怎么看呢?我们先把它分成五部分:
①就是它的横坐标,代表样本;
②是它的纵坐标,代表基因,此外还表示红色代表高表达,绿色代表低表达;
③是它的主体部分,代表各个基因在样本中的表达情况;
④表示这些样本共分为了两类;
⑤是对这些基因表达模式的聚类分析的树形图。
所以这幅图要表达的意思是这8种基因在两类样本中的表达情况,大家可以直观的看到天蓝色的样本某些区域要比粉红色样本更红一些,也就是这些基因表达量更高一些。
这里又涉及了一个名词,聚类分析。简单地说就是把表达相似的基因归为一类,从而更有利于我们对结果进行观察分析。等以后分享到聚类分析图的时候再详细聊。
不仅仅可以表示表达量的差异,热图还可以表示相关性的高低等等,大家要注意纵坐标表示什么。
通过对数据进行这样的可视化处理以后,我们就可以很清楚的看到两类样本基因表达含量的差异性,从而帮助我们抓住研究重点,对差异性进行进一步的分析。
总结一下!热图可以帮助我们快速了解文章要研究的问题,虽然很简单,但是也不要忽视其重要性。就像我在学统计时一位老师说:不要一味的追求高级统计方法,既然它是一种方法,就没有高级低级之分,只要合适,t检验也一样可以找到真理!所以,把简单的热图应用的合适的文章中,也一定可以锦上添花!
参考资料:
1.实验万事屋
2.维基百科
3. 丁香园-《热图的解读与应用》