接着,掌握一门能进行统计绘图的语言
鼓捣完文本处理,那么就可以从非常混乱的文本中,基于某种模式提取出有效信息,那么剩下的就是画图。
画图,是一门艺术。统计绘图,也是一门艺术。生信数据太多,往往需要找到合适的图形,通过图形展示才能更好的从数据中提取出信息,发现规律。
稍微简单的统计图形,可以用Excel或者其他工具绘制,但是如果涉及到十几套数据,重复出一类统计图形,那么大多数Excel平民用户其实...真的搞不定。这是掌握一门能作统计绘图的语言的原因之一,但是,却不是根本原因。掌握这么一门语言的根本原因,是能够装X。这和学编程是一个道理,动动脑子写几行代码,换取你手动几个小时的时间还有美好心情。
在认识的人里面,有擅长用perl纯码出SVG的,用python matplot出各种定制化图形的,用GNU plot...和python差不多...但是大多数还是用R的基础绘图,或者说强大的绘图包ggplot进行绘图。
关于绘图的语言也有一些争辩...其实目前在我看来,情况是这样的。
绘图大体方向分为探索性绘图和展示性绘图
个性化绘图,比如象形图,共线性绘图等,属于后者,这类直接手工码,按比例做自调整函数应是最简单,一般应该是用perl或者其他语言直接码SVG,或者目前用比较多的python matplot 模块绘图,
而统计绘图应该属于前者,这类上,R的ggplot2 或者 正在发展的python版本的ggplot2必然是最优,因为探索性绘图,主要是边画边看,调整参数重新话,换个图形继续画,R的ggplot2甚是强大,各种图形自调整过分优秀,stat_xxx geom_yyy 几乎一个图形一行代码就搞定。
嗯,看起来好像python也有ggplot2 而且做展示性绘图十分强大,那么是不是直接学python就够了?....其实如果你可以用得炉火纯青,我觉得确实是足够啦。但是刚入门就不要想着逆天了,你也躲不开R,除非不用各种方便的生信相关的R语言包。直接学R,没坏处。python的ggplot2还在发展,感觉上,永远不可能追上R的ggplot2....因为后者不傻啊,大家都看着他在不断改进。
所以,以上说的都是废话,以下介绍个人用到的R语言学习书籍,总结下来,我个人还是从绘图的角度来学他的,当然后面才回归正道,用多一些统计的功能。
R初学者指南....其实我接触生信,看的第一本变成书,反而不是perl,而是这本书....
2. ggplot2 中文译本...
...嗯...其实如果我开书店的话...我应该卖书才是