记得一年前,在项目中跟一位来自其他部门的同事H合作。我们俩为了某个项目方案一直争执不下。最后H要求我按照“原教旨主义”的原则,找出该方案的本源依据。被逼无奈,我不得不找出一本统计学基本原理,花了一天时间啃完基础原理方面的内容,才给出令H满意的答案。H比我更早时间加入公司,大部分时间都在客户一线工作。虽然工作性质、经历完全不同,但我们俩在思维方式方面却有着惊人的相似。我开始意识到,华为有这样一帮人,在工作中,不仅仅是提出解决问题的方案,还需要探究答案背后的逻辑。那么,问题来了。华为并不是学术研究机构,为什么一直强调方法论的研究?究其原因之一,华为的高层管理者采用轮换制的,在工作决策汇报时,如果如果汇报人不讲清楚方案背后的逻辑,而仅仅展现方案本身,管理层没办法做出相应的决策的。以CIO为例,过去的十几年期间,几乎没有IT背景出身的。现任CIO公司董事T总,是纯销售背景。T总的其中一句经典语录是:“你一个技术内行跟我一个外行讲技术,即使你讲得再有道理,我没办法反驳你,但反正就是不信。”除此以外,华为内部广为流传一句话:“以过程的确定性以应对结果的不确定性。”几乎被大家奉为基本的行动指南。上面啰嗦这么多,其目的只有一个,说明华为研究方法论不是闲着蛋疼,而是内外部生存环境所迫。自从2006年,华为从西方顾问公司引入相对完善的数据治理体方法论,但也经历了“水土不服”的痛苦期。经过十多年的不断实践和改进,逐步形成了华为数据治理方法论。总体来说,华为数据治理方法论是西方科学和东方哲学相结合的产物。并且经过内部长期验证,更加适合中国人的思维方式和企业文化。下面,我将华为数据治理方法论总结为“七宗最”:一、独创的数据语言,很好的建立了业务、数据和IT之间的联接华为公司的数据治理不是从IT开始的,而是从业务部门开始的。在数据管理总纲里,最核心的一句话便是“业务对数据质量负责”。要业务对数据负责,首先是要让业务理解数据是什么。前面提到的T总,每次汇报都会教育我们要“说人话”。数据管理部门的顶头上司尚且如此,面对业务部门领导时的场景就可想而知了。然而,西方的数据治理工作方法,基本上都是技术语言、专业语言。记得10多年前,开始跟业务讨论数据模型。业务不懂数据模型,但总能理解什么是模型吧。只能说,那时自己还“太年轻、太天真”。事实证明,并非所有人工作中都需要很强的抽象思维。经过反复不断的实践,估计业务部门也受够了一次一次的给我们当“小白鼠”。2011年,我们首次提出数据资产目录概念,以取代数据模型作为跟业务对话的基本语言。在设计理念方面,通过业务对象映射大家熟悉业务世界的“人、物、事”等。Gatner提出Digital Twins(数字孪生)是几年之后的事情,可以说二者有异曲同工之处。在具体的设计方法方面,不再一味强调基于数据结构相似性的抽象,而在抽象与具体之间找到合适的平衡点。同样的,在近两年,为了向业务解释什么是多维模型,同样费了我一番脑筋。最终还是前面提到的H,逼迫我翻出统计学基本原理。前两年,我曾以“破译通往数字世界的罗塞塔石碑”为主题,总结了自己过往在数据架构语言方面的工作经验。二、具有可供借鉴的企业参考数据架构质量管理界有句名言,“产品质量是设计出来的,而不是检测出来的。”企业统一的数据架构设计,是数据质量保证的关键环节。业内并不缺少架构方法。TOGAF、Zachman、DAMA都提出了各自的企业架构设计方法。华为取各家之长,也形成了自己的架构方法论。但是方法只是方法,不是能力。记得当初在华为内部,许多刚刚入行的数据人员,往往会吐槽架构方法太虚,不好用。我试图用一个比喻来说明:“并不是每一个会建茅房的人都是称职的建筑设计师。”没错,系统有简单与复杂之分,架构也有好坏之分。在十年前,在银行、电信业有比较成熟的行业、企业参考架构。但对于广大的传统制造企业,缺乏可参考的架构。其实还有一个渠道,相信ERP软件厂商有此能力。但真正派到客户现场的往往是软件实施人员,对于软件包的顶层逻辑架构并不熟悉。因此,往往一问三不知。华为历经了十多年的信息化、数字化深度建设与变革,加上华为自身的业务形态非常多种多样(多到令人想不到的地步),长期总结积累下来的企业数据架构,绝对是一笔非常宝贵的财富。对于在架构方面几乎是“一穷二白”的企业来说,同样也是采用“拿来主义”,作为自己企业架构蓝本。三、数据质量水平度量指标体系一提到数据质量,耳熟能详的是教科书式的“六性”(准确、完整、一致、及时、唯一、有效)。乍一看,评价标准非常严谨、客观,但实际操作起来,有些方面却非常困难。对于唯一性、一致性、可以通过IT系统的技术手段基本可以实现自动化监测。但对于其他三个特性就难了,而恰好对于数据质量来说又是几乎是致命的。以合同数据准确性为例,毕竟不可能投入大量人力去打开系统跟业务实际发生的情况逐一比对。因此,华为提出数据质量综合水平测评指标体系,是设计质量和执行质量相结合的综合评价方法。而且,二者所占的权重也是有特别讲究的,充分体现了数据质量的基本管理思想。四、动态演进的数据组织结构模型如果简单看到华为当前数据治理组织结构,相比而言非常完善,而且非常庞大。当前国内大部分企业的数据治理依然处于起步阶段。相信看完之后只能摇头,言外之意是“没有可比性”。事实上,几乎很难有企业可以一步到位。在有些企业,即使是顺利的成立了数据管理组织,但因为相当一段时间找不到自身和价值,结果也是不了了之。因此,如何帮助当前仍处于“两无”(无组织、无有人)的企业实现从无到有,就显得至关重要了。即使是华为,也经历了从开始艰难起步的过程。由于各个业务部门对数据价值理解不同,数据成熟度不同,以及数据人员的能力差异,各自的境遇也差别很大。经过实践,总结起来有两种典型模式可供参考:其一是数据质量痛点驱动,IT系统已经有相对充足的数据,但数据质量直接影响业务;其二是数字化愿景驱动,跟随数字化建设浪潮,从数据架构标准入手。五、与企业治理体系的有机融合严格意义来说,数据治理体系只是一个功能性的体系。换句话说,主要是围绕数据质量、数据价值等明确需要管控、执行要素的要求。举个例子,数据架构工作,在设计与落地过程中,跟IT系统的设计开发强相关。因此,相应的要求需要融入到IT管控流程中去。又如,数据质量的问责,虽然华为也有问题驱动式的直接通天,但大部分情况下,还是需要例行的问责机制。但是客观来讲,数据质量相比其他财报准确、业务合规、反腐等直接关乎企业前途命运的管控要素相比,虽然更加基础,但也更加间接一些。因此,数据治理体系落地的过程,采用“搭便车”的方式,往往起到事倍功半的效果。六、可解释性、可理解性千万不要忽略这一条的价值所在。举一个最近真实经历的例子。有个同事在群里扔来一句摘自DMBOK 2.0(中文版)中的一句话,“物理数据模型也属于数据架构文件,但物理模型是数据建模和设计的产物,而不是数据架构的产物。”看起来似乎前后矛盾,也难住了我这位江湖人称数据治理江湖“老中医”。为保险起见,查看原文:Physical data models are included,but a product of data modeling and design, rather than data architecture. 依然难以判断物理数据模型究竟是否属于数据架构。华为数据治理方法论由一帮真正亲历了华为公司内部数据治理体系不断演进的过程,因此清楚的理解方法论中每一条原则、每一个方法的背景。 七、具有自主可控的知识产权人类社会似乎进入了“地球村”,科技发展“无国界”。但这些认知被近两年内发生的一些列事件所颠覆。2019年,国际最大的工业界学术组织IEEE(电气和电子工程师协会)发布内部邮件称,清理华为系审稿人。虽然没有多久之后,该组织取消了这一规定,但不得不令人心寒。同为非营利性组织的DAMA,同样冠有“国际”的头衔,但依然属于美系的。而且并未地球上的唯一国际性数据管理组织,欧洲也有相类似的组织,例如,IRM UK。未来的社会必然走向数字化世界。因此,站在发展的眼光来看,当前的数据治理依然处于“婴儿期”。咱们国家应该有决心发展自主可控的数据治理体系标准组织。