终于有人把数据治理讲明白了

导读:数据治理:说起来容易,做起来难。

作者:石秀峰
来源:谈数据(ID:learning-bigdata)

“数据治理”这个10多年前就已经出现的名称,在最近这几年时间一下子火了起来。不知何时,江湖中流传出了:“数字转型、治理先行”的说法。

于是乎,我们看到:不仅是传统提供数据仓库、BI、主数据管理、元数据管理、数据集成等数据服务的软件供应商在说数据治理,“BATJ”等互联网公司,大型国企、央企也都在谈数据治理,很多企业都将数据治理作为数智化战略的一项必要举措,列入了企业的战略行动计划。

在众多谈论数据治理的企业或个人中,笔者发现大家对数据治理有着一个普遍的共识,那就是:“数据治理说起来容易,做起来难”!

01 为什么要做数据治理,真的想透了吗?

在做数据治理咨询的过程中,经常会遇到以下对话场景:

  • 请问你们为什么要做数据治理?

  • 常见回答:我们要建立数据标准,提升数据质量,实现数据资产统一管理。

  • 接着问:为什么要建立数据标准、提升数据质量,不做会怎样?

  • 常见回答:数据质量问题比较多,无法提供准确的数据报表,影响业务效率,无法支撑企业的数字化转型。

  • 再次问:都影响到了哪些数据报表、哪些业务?

  • 常见回答:XX报表不准确、统计口径不一致、系统之间数据孤岛,数据集成困难……吧啦吧啦……

  • 接着追问:为什么会造成数据报表不准确,口径不一致,系统集成难?

  • 常见回答:因为数据标准一致,数据源的数据质量差。

到此为止,采用咨询常用的5Why分析法,似乎已经get出了数据治理的现状和目标。我们将其总结下:通过数据治理实现企业数据的标准化、提高数据质量、提升业务处理的效率,为数据分析提供准确的数据支撑,赋能业务,助力企业实现数字化转型。

但是,我们仔细分析这样的调研结果是浮于表面的,围绕数据的问题在原地打转,没有将为什么要做数据治理真正想透。

数据要产生价值,需要一个合理的“业务目标”,数据治理的所有活动应该围绕真实的业务目标而开展,建立数据标准、提升数据质量只是手段,而不是目标。因此数据治理的第一步不是分析数据问题,而是分析业务问题,找到企业的核心业务诉求,定义数据治理的目标和范围。

02 数据治理不是什么高大上的东西,基本是脏活、累活!

数据治理很火,在DAMA 数据管理知识体系指南中,数据治理位于数据管理“车轮图”的正中央,是数据架构、数据建模、数据存储、数据安全、数据质量、元数据管理、主数据管理等10大数据管理领域的总纲,为各项数据管理活动提供总体指导策略。

▲DAMA-DMBOK2.0 数据管理车轮图

谈到数据治理,我们经常讲它是一个涉及到企业战略、组织架构、数据标准、管理规范、数据文化、技术工具的一个综合体。没有数据治理实践经验的,一定会认为:哇,数据治理好“高大上”呀!又是战略、又是标准、又是文化的,听起来很高深吗!

然而,只有你真正做过数据治理人才知道:数据治理不仅都是苦活、累活,还是个受累不讨好,经常背锅,领导看不见价值的活。

都说数据是资产,数据治理很重要。尽快大家都说数据治理很重要,领导也很重视,但在很多企业真正实施的过程中,却总会遇到高层领导支持力度不足,业务部门人员配合不到位,数据治理的总是要给业务让路等等问题。

究其原因:领导说重视数据,是真重视,还是嘴上说说?有没有将其纳入企业的战略行动计划?

数据治理要定战略、定制度、建组织,这是顶层策略,这每一项都牵一发而动全身,都需要高层领导的大力支持和推动,业务部门和技术部门的紧密协同。

数据治理要立标准、理流程、清数据,需要对每个数据域、数据实体、数据条目、数据项进行梳理和标准化,甚至有时候需要人工逐条、逐字段的定义数据标准、核实数据质量。

数据治理人员不仅要有良好的数据思维,还要有足够的细心、耐心和体力才能实现企业数据质量的不断提升,打磨出适合企业的数据标准。

数据治理过程中,有时候是不被理解的。数据治理是个地基性工程,人们看到的永远是数据应用的“高楼大厦”,数据治理团队天天忙忙碌碌的,领导也不知道“这伙人”到底都在干啥?但是,只要数据出现问题,第一个被问责的就是数据治理团队。

03 数据治理不是一个“项目”,想要立竿见影的效果?难!

项目是一系列独特的、复杂的并相互关联的活动,这些活动有着一个明确的目标或目的,必须在特定的时间、预算、资源限定内,依据规范完成。

那么,数据治理是项目吗?

是,当然是。

不论是全面的资产管理,还是针对特定领域的数据治理,都需要组建项目团队、定义项目目标和范围、制定项目计划、推进项目实施、最后是项目总结和结案。数据治理有明确的目标,有特定范围、质量、成本、时间、资源要求,从定义上讲数据治理当然是项目。

但是,通过一个数据治理项目的实施,即使这个项目预算很大,周期很长,是否就能解决企业数据管理和使用中的各种问题?是否就能培养出企业的数据文化,转变人们的数字化思维?是否就能实现企业管理和业务模式的创新?

一定不可能!

数据治理的最终目标是赋能业务,提升数据价值。这是一个持续漫长的运营过程,需要逐步完善、分步迭代,指望一步到位完成数据治理是不现实的。

项目型的数据治理,是不全面的,无延续性,能够解决一时的数据问题,但很难获得持续的数据价值。

因此说,数据治理不是一个“项目”,而是一个持续运营的过程。我们也可以将这个过程,看作是由一个个数据治理“微项目”组成,连续的、螺旋上升的模型。一个项目的结案,不是企业数据治理的终点,而是企业数据治理真正的起点!

04 做了数据治理,为什么数据质量依然很差,咋办?

一个网友留言:石老师,我们公司两年前就做了数据治理,建立了数据治理平台,元数据管理、数据质量管理等功能都有了,但是我们的数据质量问题还是很多,导致花了很多钱建设的BI系统基本都没人用,请问有什么好的方式解决?

这个问题,我没有答复。原因是数据质量差、BI用不起来,这个问题虽然常见,但是10家有相同问题的企业中,有9家的原因是不一样的。在没有经过详细调查,不了解具体背景的情况下,不敢贸然给出建议。

我曾盘点了引发数据质量问题的各种原因:

  • 有业务方面的数据定义不明确,也有技术方面的数据抽取不完整;

  • 有管理方面的岗位职责不清晰,也有执行层面的数据操作不规范;

  • 有数据处理加工过程中出现了错误,也有数据源本身就有问题;

  • 有数据治理系统功能有缺陷,也有系统强大但是没人用……

做过了数据治理,企业的数据质量就一定能提升吗?其原意是要问:上过了数据治理系统或实施了数据治理项目,为什么还会有数据质量问题。

这个问题很复杂。正如上文中的项目型数据治理,点到为止,治标不治本。有的企业认为数据治理就是上一套强大的数据治理平台,只要平台功能强大,就能管好数据,这恰恰是陷入了另一个误区——唯工具论,岂不知数据治理的本质是管理数据,而不是管理程序、脚本和任务。

另外,还有很多企业是出现了数据问题,并且对业务造成很大影响之后才去进行治理的——被动式治理,失去了治理数据的主动权,常常是解决了一个问题又引出了更多的问题。

……

世界上没有“包治百病”的数据平台,只有将数据治理常态化,持续地去做才是王道。

05 数据治理之道是什么,要怎么做?

前段时间,在网上看到一篇关于数据治理关键要素的总结文章,觉得写的很好,引用过来,供大家参考:

1. 数据治理需要体系建设

为发挥数据价值需要满足三个要素:合理的平台架构、完善的治理服务、体系化的运营手段。

根据企业的规模、所属行业、数据量等情况选择合适的平台架构;治理服务需要贯穿数据全生命周期,保证数据在采集、加工、共享、存储、应用整个过程中的完整性、准确性、一致性和实效性;运营手段则应当包括规范的优化、组织的优化、平台的优化以及流程的优化等等方面。

2. 数据治理需要夯实基础

数据治理需要循序渐进,但在建设初期至少需要关注三个方面:数据规范、数据质量、数据安全。规范化的模型管理是保障数据可以被治理的前提条件,高质量的数据是数据可用的前提条件,数据的安全管控是数据可以共享交换的前提条件。

3. 数据治理需要IT赋能

数据治理不是一堆规范文档的堆砌,而是需要将治理过程中所产生的的规范、流程、标准落地到IT平台上,在数据生产过程中通过“以终为始”前向的方式进行数据治理,避免事后稽核带来各种被动和运维成本的增加。

4. 数据治理需要聚焦数据

数据治理的本质是管理数据,因此需要加强元数据管理和主数据管理,从源头治理数据,补齐数据的相关属性和信息,比如:元数据、质量、安全、业务逻辑、血缘等,通过元数据驱动的方式管理数据生产、加工和使用。

5. 数据治理需要建管一体化

数据模型血缘与任务调度的一致性是建管一体化的关键,有助于解决数据管理与数据生产口径不一致的问题,避免出现两张皮的低效管理模式。

06 最后的话

数据治理不是一蹴而就的,它是一个漫长而持续的过程,没有一针顶破天的诀窍,也没有立竿见影的途径。只有将数据治理变成一种常态化机制,就如同我们每天吃饭、睡觉一样,形成一种习惯、一种文化、持之以恒、不忘初心、不懈努力,才能达到预期目标。

(0)

相关推荐

  • 大数据治理基础

    "信息"很大一部分都是由"数据"组成的.所以数据资产管理成为了企业或者组织采取的管理活动,用于保证数据资产的安全和完整,有效地利用起来就可以带来经济效益.数据资 ...

  • 数据治理的成功要素3:治理的时机和切入点

    题外话:最近一段时间工作繁忙,加上晚上回去还要写文章,长时间的伏案工作,给我脆弱的颈椎简直是雪上加霜.2012年体检,就查出了"颈椎生理曲度变直",医生叮嘱:要多加锻炼,尽早治疗. ...

  • 企业数字化转型从数据要素到数据治理(第一部分讲解视频)

    以上为本专题全部课件,本次分享第1-7页的讲解视频 近些年来,随着大数据在各个行业领域应用的不断深入,数据作为基础性战略资源的地位日益凸显,数据标准化.数据确权.数据质量.数据安全.隐私保护.数据流通 ...

  • 数据治理的成功要素4:组织制度保障体系

    话说:"无规矩,不成方圆".企业数据治理也一样,明确的组织机构.角色分工.统一的数据标准.规范的管理流程是保障数据治理成功的关键要素.今天我们来谈一谈,企业数据治理的组织制度保障体 ...

  • 老板要做数字化转型,干了3个月的脏活累活,我被开除了

    "数据治理"这个10多年前就已经出现的名称,在最近这几年时间一下子火了起来.不知何时,江湖中流传出了:"数字化转型.治理先行"的说法. 于是乎,我们看到:不仅是 ...

  • 谈数据:数据质量管理的10个最佳实践

    作者丨石秀峰 来源丨谈数据 全文共3768个字,建议阅读需15分钟 数据质量管理是所有数据类项目重点关注的领域,从20多年前的数据仓库到如今的数据湖.数据中台,企业都试图将通过对改善数据质量来提升数据 ...

  • 终于有人把数据中台讲明白了

    导读:要建设数据中台,我们首先需要明确什么是数据中台,以及数据中台能为企业带来什么价值. 作者:陈新宇 罗家鹰 江威 邓通 等 来源:大数据DT(ID:hzdashuju) 01 数据中台定义 数据中 ...

  • 干货解读 | 终于有人把数据中台讲明白了

    干货解读 | 终于有人把数据中台讲明白了

  • 终于有人把OBV指标讲明白了,90%的散...

    终于有人把OBV指标讲明白了,90%的散户没用过的指标,看懂了,让主力无处遁形. 物以稀为贵,讲的是供求关系,前几年破天荒有个"蒜你狠".有人把大蒜的价格抄到天上去了,为什么呢?因 ...

  • 终于有人把联邦学习讲明白了

    终于有人把联邦学习讲明白了

  • 终于有人把“内盘外盘”讲明白了,散户如果...

    散户如果把它的精髓吃透了,就可以让你读懂主力操作背后的盘口语言,值得每一位炒股人收藏. 很多数股民朋友到现在还不知道内盘和外盘,更有甚者都没有听说过.内盘和外盘代表什么呢,它代表的是买卖双方的一个博弈 ...

  • 终于有人把内卷讲明白了

    导读:内卷不但不会创造价值,而且会危害每一个人. 作者:王见现 来源:大数据DT ID:hzdashuju 01 CSDN企业招聘 小镇的故事 1. 什么是内卷 很久很久以前,地球上有一个小镇.小镇上 ...

  • 终于有人把3D打印讲明白了!

    作者:奥拉夫·迪格尔(Olaf Diegel).阿克塞尔·诺丁(Axel Nordin).达米恩·莫特(Damien Motte) 来源:大数据DT(ID:hzdashuju) 增材制造(俗称3D打印 ...

  • 终于有人把p值讲明白了

    导读:p值(P value)就是当原假设为真时,比所得到的样本观察结果更极端的结果出现的概率,是用来判定假设检验结果的一个参数.p值是根据实际统计量计算出的显著性水平.本文带你了解p值和对p值的常见误 ...

  • 终于有人把“筹码分布”讲明白了,我整整读了10遍,太精辟透彻了

    虽然太多人清楚知行合一的重要性,但性格早已决定了他们难以做到. 而那六个字的关键就在于执行并做到,道理很容易明白,但真正能做到的人,尤其是一生坚持去做的人,几乎是凤毛菱角,屈指可数.只要心中具备那种不 ...