数据从业者成长的五个阶段
这是傅一平的第358篇原创
【与数据同行】已开通综合、数据仓库、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822702 为好友后入群。新开招聘交流群,请关注【与数据同行】公众号,后台回复“招聘”后获得入群方法。
有同学问我数据从业者的成长是否有迹可循,我觉得是有的,因为数据从业者的使命是用数据驱动业务,但数据本身无法直接驱动业务,因此其必然要经历从数据到信息、从信息到知识,再从知识到智慧的过程。
笔者将这个过程跟自己的数据生涯联系起来,总结出数据从业者成长要经历的五个阶段,希望于你有所启示。
1、获取数据-取数
业务人员如果拿不到适合的数据,用数据驱动业务就无从谈起,而这些数据大多是由取数人员提供的,虽然当前自动化的取数工具不少,但考虑到市场的变化瞬息万变,数据的维度又几乎无限,决定了没有一种自动化的方式等解决所有的数据提供问题,即使我们能打造出牛逼的自动化取数工具,但这些工具的实现也要依赖取数人员的经验总结。
取数是任何数据从业者的基本功,任何一个数据从业者,如果没有经历过取数的历练,就会对他的发展产生影响,好比没写过代码就很难当好架构师一样。
无论是自己、团队还是合作伙伴,大家对于数据新人的培养,大多是从培养其成为一个合格的取数人员开始的,大多数据类岗位,比如数据分析师,也需要自己取数。
通过取数的实践,取数人员不仅理解了业务,也理解了数据,并能形成映射关系。当然取数水平的高低取决于其打破砂锅问到底的精神,有些取数人员只会取宽表,而有些取数人员能从源表追根溯源,有些取数人员只会被动的响应业务需求,而有些取数人员则会多问一句为什么,这决定了他们数据和业务视野的高下。
没有经历过取数的人生不是完整的数据人生,而很多数据从业者在取数阶段就分出了高下,具体可看笔者关于取数的相关文章,包括《傅一平,你能不能把数据取准确?》、《如何避免成为一台取数机器?》及《刻意练习,如何成为一名取数大师》等等。
2、展示数据-报表
取数有三个问题,一是缺乏口径标准影响数据质量,二是自动化水平不够浪费人力,三是数据的呈现不够直观和灵活,这个限制了其业务价值的体现,而报表能部分解决这些问题。
一方面,企业需要标准化、高质量的报表,这是企业经营所必需的。一个企业可以没有任何其他数据岗位,但表哥总是需要的。
当然报表不是数据从业者的必经阶段,但有了报表的经历会让你对于业务和数据的理解更上一层楼,因为你得开始体系化的考虑指标和维度的设计,开始想着用自动化手段的来解决人工取数问题,企业生产了成千上万的报表不是好事,但起码表明了大家想要快速拿到数据、不想每次人工取数的决心。
另一方面,报表需要用一种可视化的方式来展现,这是数据转化为信息的一种表达形式,报表的各种变种和升级(比如KPI、BI)可以更好的向公司呈现数据从业者的工作成果。
在数据仓库时代,在没有数据产品这个概念之前,数据从业者通过短信、彩信、PC门户、大屏乃至手机展示自己的风采,这是取数无法达到的。
做过报表的人对于数据的标准化、准确性及一致性会有更深刻的理解,而这是数据治理的基础;
做过报表的人对于指标和维度有更深的理解,这是数据分析的基础;
做过报表的人知道生产报表挂掉的后果,因此其对生产稳定充满敬畏;
做过报表的人会关注可视化,这是数据产品最基础的表达形式。
虽然不是每个数据从业者都需要经历报表的阶段,但报表能促其更好的成长,具体可看笔者关于报表的相关文章,包括《如何才能做好一张报表?》、《报表系统的雄心》等等。
3、分析数据-数据分析(数据运营等)
基于业务人员想法来制作报表,虽然对于能力提升重要,但价值有限,最多只是“60分工作”。即便你的需求来源是业务部门老总,也就值60分,表哥很多时候成为了老黄牛的代名词,一定程度反映了这种问题。
做数据,最值钱的,大多时候是想法,特别是基于实际业务现状有针对性的想法,现在数据分析师成了数据从业者中最热门的岗位之一,数据分析师干的活,核心就是分析数据(结合统计学等知识),找到规律(比如异动),给出结论和建议。
但数据分析要做好,综合要求非常高,因为大多数据分析是要向老板汇报的,优秀的数据分析师至少要具备业务能力、思考能力、沟通能力、表达能力、分析能力、数据能力、技术能力及统计能力。
业务能力:理解公司战略、充分理解行业、理解领导思想,最好有业务岗位实战经验
思考能力:最值钱的是想法,通过数据对这些想法进行系统化的分析和论证
沟通能力:对上沟通确认目标、对中要采取合作、对下要明确执行要求
表达能力:一切都是为了让人看懂,态度上重视汇报,汇报讲究故事化
分析能力:基于业务常识选择合适的指标和维度,发现异动原因并可视化展现
数据能力:拥有全局的数据视野、更深的数据理解能力和操作能力
技术能力:SQL、Python/R、机器学习/深度学习引擎
统计能力:理解统计的基本概念、理解基本算法
在很多企业中,数据分析是个岗位,但我一直认为数据分析仅仅是数据从业者谋生的高级手段,数据运营、数据产品、数据管理等各类岗位都需要数据分析的技能,比如数据运营就是数据分析的持续迭代。
数据分析师最大的问题是大多数时候它仅仅是参谋者的角色,无法推进分析成果的直接落地,或者说其价值的最终体现要依赖别人,数据分析有10年之痒不是空穴来风,很多数据分析师需要转岗,比如成为产品经理,我觉得这是非常正确的选择。
4、价值数据-数据产品
取数,报表及分析是数据从业者的主要岗位,但这些岗位离真正的业务价值创造还有不小距离,这是由其所处的价值链位置决定的,因为其夹在平台和应用之间。
对下,数据从业者要依赖基础平台的计算、存储、网络资源和基础数据,对上要依赖业务系统提供的通道以便让自己的数据发挥出价值,这对于数据从业者是巨大的挑战,因为你离不开别人,而别人却可以不用你,天生就不平等。
比如数据从业者搞数据治理,很多时候是为源系统数据的不给力买单,因为其天生就在上游,只为业务负责,在设计系统的时候,很少考虑过下游数据的分析需要,互联网公司先天的数据基因决定了在系统设计的时候可以考虑数据侧的要求,比如埋点,但对于大多数行业来讲,为了采集数据让数据方进行侵入源系统的设计几乎是不可能的。
在相当长的时间内,这种状况很难改变,因此只能往业务的前端想办法,数据产品经理这个岗位的出现,是数据从业者希望打破上游业务系统的桎梏,独立谋求价值创造的一种尝试。
虽然数据产品经理也是产品经理的分支,但它的差异化主要来自于数据的差异化,而不是功能或模式。广告投放(精准营销)、金融风控及决策洞察(含BI)是当前最主要的三大类数据产品形态,当然数据开发工具也可以归为数据产品,但它主要服务于内部。
笔者在《超越BI,数据产品的前途在哪里?》文中提到过,很多数据团队在企业内存在感不强,或者是老黄牛的命,是有其深层次原因的,并不会因为当前数据中台的出现而有什么实质性变化,而只有数据产品才能真正解决数据价值创造最后一公里的问题,现在很多做数据分析、数据运营的人希望去做数据产品,是数据从业者寻求价值突破的一种表现。
自己写过一些数据产品的文章,表达了这种认知,包括《为什么数据从业者要学点产品思维?》、《BI(商业智能)的未来?》、《产品的天机和成败:我的实践史与俞军的方法论》及《除了报表和取数,我还有多少大数据应用的机会呢?》等等。
5、领导数据-经理/总监
自己经历过取数、报表、数据分析等各个岗位,很深的体会就是数据从业者虽然做的很辛苦,但真正能脱颖而出的还是少数,你看CDO这个职称出现了很多年,但企业真正有这个头衔的比例并不高。
现在数据虽然已经成为了新的生产要素,但如果企业中没有更多的优秀数据从业者走上管理或领导岗位,要驱动数据生产要素发挥作用还是挺难的。
一方面,数据治理等基础工作需有人能沉下心去把事情做深做透,另一方面,数据产品的创新需要大量产品、运营资源的投入,这些都离不开专业领导的理解和支持。
比如对于大多数企业,当前要让一个模型产生实际价值,最根本的不是数据和模型问题,而是组织、机制和流程问题。
自己经常跟团队的主管和组长讲,我们现在不缺取数、报表、数据分析师等人员,最缺的是既有技术视野,也有业务视野,更有深度思考能力的优秀数据管理者,在数字化创新如火如荼的当下,数据领导者帮助把握好方向,让数据从业者拥有更多数据价值创造的机会。
最近一年笔者写了很多数据管理的文章,包括《数据团队的构成》、《数据团队演进的五个层级,你处于哪一级?》、《我如何设计数据团队的入职培训课程?》、《如何打造顶尖的团队协作能力?》及《如何提升业务对数据团队的满意度?》等等,因为这才是我最大的挑战。
比较抱歉的是,我写的数据从业者的五个成长阶段并未包括很多其他数据岗位,无论是平台,算法,运维、治理等等,但这些并不是最重要的。
我的核心观点其实只有一个,即数据从业者的成长要起于数据终于业务,让数据产生真正的智慧,只要能离这个目标近一点,就是正确的方向。