[文字稿]政务大数据的设计模型
政务大数据的设计模型
宇尘埃 2019-3-10
按应用层次不同来分,数据的设计模型包括概念模型、逻辑模型和物理模型。政务大数据的本质是政务,其设计模型与政务业务是紧密联系的,基于电子政务的历史发展轨迹,以政务大数据的数据视角来看已经基本完成了数据积累、汇聚和数据加工、治理阶段,下一步的工作重点是政务大数据的价值创造和模式创新。
政务大数据的内容仍是数据,其设计模型依然可以分为概念模型、逻辑模型和物理模型(概念模型对应于软件系统之需求,逻辑模型对应于软件系统之设计,物理模型对应于软件系统之实现);同时,政务大数据是大数据的一种,其设计模型需充分考虑大数据的相关特点与特征。要梳理清楚政务大数据的设计模型,就需要先梳理清楚政务大数据的上下文范围。
作为软件工程里的常用词,“上下文”是“context”的直接翻译,在java等编程语言中经常出现,通常指一组环境信息、容器信息或者状态信息,类似于中文里的“语境”。政务大数据的上下文范围,即政务大数据的运行环境和执行范围,其边界伴随着政务的上下文边界(职能)的变化而变化。
围绕着政府职能的变革、行使社会治理、监管及服务的业务模式发展,所开展的“作业”、“监管”、“治理”、“决策”、“服务”过程,所产生和利用的政务数据包括:“业务数据”、“监管数据”、“治理数据”、“决策数据”和“服务数据”五类数据。
一、政务大数据的概念模型
政务大数据的概念模型一方面要对政务大数据提供和使用全过程、全周期的业务实体关系进行刻画,另一方面要对政府职能行使过程中所产生和利用的五大类数据进行基于业务主题的数据建模。
(一)全过程、全周期的业务实体关系
政务大数据提供和使用全过程、全周期的业务实体关系,可以从其五个主客体:管理者、运营者、提供者、所有者和使用者来展开。
以管理者、提供者和使用者为例,管理者对政务大数据的核心职能在于数据的监管和治理,其监管和治理的范围还会涵盖所有者和运营者。对于政务大数据的提供者来说,数据服务是基础,价值创新是核心。在政务大数据的五个主客体中,使用者是整个链条里数据价值最终落地的一环,从数据获取、加工、建模和分析四个基本动作中来体现其价值。
政务大数据所有者的核心问题在于权属,确权、鉴权和安全使用是工作重点,合理权衡公民、法人和政府各个角色间的权责利显得至关重要。
(二)基于业务主题的数据建模
在政府职能行使过程中,产生和利用的五大类数据分为“业务作业数据”、“行政监管数据”、“规范治理数据”、“决策分析数据”和“综合服务数据”。其中,业务作业、行政监管和规范治理是基础,决策分析和综合服务是目的。
业务作业数据:指政府机关或其他业务主体在进行业务活动开展过程中所产出或利用的数据。如在政务办公中,产出的工作文件、业务信息等。
行政监管数据:指政府机关行使监督、管理的基准数据。如合规性检查标准、业务监管控制标准等。
规范治理数据:指对政务大数据的标准化、规范化的约定,如业务数据元规范、元数据标准等,该部分数据同时服务于自上而下的“规划”、“治理”、“一致性保持”,以及自下而上的“汇聚”、“共享”、“交换”。
决策分析数据:指基于政府监管职能的决策分析规则库、决策模型、决策引擎数据,用于支撑政务大数据的决策分析能力和自学习、自优化、自提升。
综合服务数据:指给予政务大数据而组合以及创造出来的、具备新附加价值的服务数据,可以在政务活动中被再利用,也可以直接服务于使用者。
二、政务大数据的逻辑模型
政务大数据的逻辑模型(模式)是基于其概念模型,对其逻辑结构进行数据建模,它重在说明数据之间的逻辑关系,可分为三个象限:治理、服务和融合。
(一)政务大数据的元数据、主数据与主题数据
元数据强调的是规则、规范和标准,说明数据的组成结构。就政务大数据而言,其技术元数据支撑着政务应用体系的开发规范和控制模型,业务元数据支撑着政务大数据的核心价值实现(服务于公民、企业、外国人和其他社会组织)。
政务大数据的主数据是基于元数据而有效发挥作用的,是服务于政务信息集成与共享的全局性政务信息资源数据,其核心价值在于在全局范围内具有较高的可共享性。
政务大数据的主题数据是对政务信息资源进行战略规划后的产出物,体现的是数据视角下的政务业务融合。
(二)政务大数据的存储、计算和服务
政务大数据在物理上需要构建其存储、计算和服务三层模式,其元数据规划、治理好了,其存储模式也就建立了;计算层的计算能力有赖于主数据的规划、治理;服务层的服务能力依托于主题数据的规划、治理。
(三)政务大数据的采集、运营和管理
基于元数据进行数据采集,基于主数据进行数据治理,基于主题数据提供数据服务。政务大数据的运营本质上是其价值产生、传递和创新的过程。政务大数据的运营和管理就是进行数据治理和提供数据服务的过程。
三、政务大数据的物理模型
就政务大数据的物理模型整体而言,存储层是技术基础、计算层是核心能力、服务层是核心价值。
(一)政务大数据的存储层
政务大数据的存储层从大的方面来讲,就是要解决好结构化和非结构化两类数据的存储问题,这两类数据还往往需要相互转化。鉴于政务信息资源的特点,其数据是结构化还是非结构化往往取决于其原始来源和用途目的的综合作用。
如摄像头采集的是图形、图像信息或者音视频信息,在交通及治安执法时需要识别人物(人脸)、车牌,就需要把非结构化的图像转化为结构化的信息。又如相关物联网设备传感器采集的温度、湿度、pm2.5、甲醛等结构化数据,往往需要刻画出图文并茂的环境质量报告。
(二)政务大数据的计算层
政务大数据的计算层是围绕着政务业务来展开的,大体上可以分为协同(G2G:政府对政府)、治理(G2S:政府对社会)、服务(G2C:政府对公众&G2B:政府对企业)和决策(G2S:政府对社会)四个部分。在政务活动中产生的政务大数据的原始信息——政务信息资源库,需要通过关联分析、聚类分析、分类、预测、时序模式和偏差分析等数据挖掘技术以及信息组合、数学建模、相关性分析等数据计算。
(三)政务大数据的服务层
按照计算层的政务协同、政务治理、政务服务和政务决策四类政务大数据群组,依次衍生出“协同流程、协同成效”,“治理体系、治理收益”,“服务提供、服务优化”和“政务研判、政务预测”等八大政务业务主题域。
其中,协同流程提供政务活动的业务流程、过程数据支持,协同成效是对政务活动的价值评估、衡量;治理体系是政务监管评价、综合治理进行的系统性规划以及工具集、作业集;治理收益是治理效果的具体量化、数据展现;服务提供是基础、服务优化是用于政务服务的自我改进、提升;政务研判是对政务活动的研究、分析和判定,核心目标是对未来预测、更好支撑未来的政务活动。
政务大数据的物理模型是服务于其概念模型,依据其逻辑模型进行政务大数据的实际实施、落地的。如果政务优化比作一个人的综合价值,存储层就是其记忆的信息和知识(记忆力和记忆量),计算层是其学和做的能力(智商和反应能力),服务层是其结果规划、产出能力(大局观、情商和效率)。