浙江省公共数字平台是数字化转型的核心平台,按照“统分结合”原则,省市两级平台差异化定位。省级公共数据平台打通省建系统、上接国家平台、下连市级平台的数据共享主平台,支撑全省数字化转型,助力省域、市域治理现代化。市级公共数据平台打通市建系统、对接省级平台的数据共享子平台,支撑市域、县域治理现代化各类应用。我们鼓励县(市、区)依托省、设区市的公共数据平台开展数字化系统建设运营,当然,有一些经济实力强县(市、区),比如义乌、余杭县级的数据平台建得都非常好,昨天我看余杭区的公共数据平台叫数据超市,还获得了奖项。这是我们省公共数据平台的一个总体架构,我们把数据归集、数据治理建立汇集在公共的基础数据库,然后从几个方面建设的一个总体架构,我们通过对外的服务,通过三个平台,一个是数据共享平台,一个是数据开放平台,还有一个大数据处理分析平台,对外提供服务。浙江大数据处理分析平台,实际上是为全省所有的应用提供大数据分析处理服务。因为大数据分析平台部署技术要求更高,相对来说比较复杂一些,所以说我们很多市级平台里面就没有部署大数据处理分析平台,省级平台的大数据分析处理性比较强,所以大量的、批量的数据分析需求,就在省级平台里实现。数据共享平台主要对外向各级信用系统提供数据接口服务;数据开放平台主要面向社会开放政府的公共数据。浙江省大数据局目前的主要职能,一个是公共数据的管理,一个是政府数字化转型。公共数据管理的技术支撑就是公共数据的这3个平台,另外就是政策法规和标准规范。数据要素市场体制机制的改革完善这块工作,到底是大数据局来牵头,还是经信厅抓,还是发改牵头,省里也多次讨论。国家下来的文件里边对数据要素市场里面三条要求,其中一条是公共数据的应用,一条是社会数据的应用。公共数据利用由我们数据局来牵头,是对的。这个社会数据的利用,是包括整个数据要素的市场化,我们现在建议是在经信部门、信息化部门,就是经济部门来牵头。公共数据这块,我们建立了从编目归集到治理的共享开放的全流程的一个公共数据平台。
一)建立统一的公共数据资源目录体系
1.建立全省统一的公共数据资源目录体系
首先我们建立全省统一的公共数据资源目录体系,全面掌握了就是全省各级应用系统的数据目录。我们省级的数字化系统通过这两年的数据目录整合,从1785套减少到1336套,减少了将近450套信息系统,其中整合迁移859套,整合了656套、停用了203套,还有一些新增的信息系统。
2.从供需两侧编制公共数据目录
浙江省公共数据目录梳理从供给侧和需求侧结合开展,供给侧目录梳理围绕本部门已建的信息系统入手,梳理信息系统业务产生的数据库表信息;需求侧目录梳理从数据共享需求和数据提供责任清单入手进行梳理。要求各单位每年新建信息系统涉及数据需完成目录编制,实现应编尽编,同时对本单位的数据提供责任清单要完成共享目录的确认及数据归集。截至目前,目录系统已收录全省78家省级单位、11个地市56101类共894983项数据项可供部门间共享。我们现在讲政府数字化转型从两个方向,一个是业务数据化,业务数据化的方向就是需求侧的分析,所有的业务需要什么数据,首先梳理业务和业务指标,然后确定业务的数据需求清单。另外一方面是数据的业务化,首先梳理已有数据,然后梳理已有系统,依托数据共享模型,优化流程,推出规范化、精准化、协同化、智能化的新型服务。
3. 定期更新维护清单目录
省大数据局每月定期对未编目、未归集等情况进行通报和数据晾晒。准确知晓全省的数据编目情况、归集情况和数据质量问题。针对问题数据进行整改,每个月进行晾晒通报。现在有一个数据晾晒台,在一体化政务服务平台里面,数据的归集情况和治理情况会在晾晒台上进行公布,晾晒台的读者是省领导、各级市县的领导。我们建立了省市两级数据资源目录体系,国脉互联在此也做了大量的贡献。建立省市公共数据目录同步与监测体系,通过提供全省统一数据目录、信息系统等对接接口,实时接入各地市公共数据目录系统和省级各信息系统数据信息,提升数据目录的鲜活性、准确性和实用性,实现数据目录化、目录全局化、全局动态化的目标,下一步的目标是动态实时化。
(二)构建一体化的公共数据归集交换体系
1. 构建一体化的公共数据归集交换体系
运用数据高铁、数据管道、数据交换等多种技术,形成一体化的公共数据归集交换体系,将数据按需完整、实时传输至公共数据平台。数据共享方式有两种,一种是实时数据接口共享的方式;另外一种是归集,把需要的数据归集到省级平台里来,各个业务系统数据都进行归集,有分布式的数据的共享方式,还有集中式的数据共享方式。有一部分数据是集中到这个公共平台上,还有一部分是分散在各个单位数据仓的,所以我们有两种数据共享的方式。截至目前,全省已归集数据446.9亿条。
2. 数据归集的时效性问题
集中模式的数据归集方式会产生时效性问题。随着政府数字化转型的不断深入,各种应用对公共数据平台支撑能力和服务能力提出了更高要求。今年以来,“一证通办”“一件事”等应用不断推出,部分数据不及时、不完整问题日益凸显,影响了企业群众办事的用户体验与获得感,也影响了数字政府建设的深入推进。比如说 “一证通办”应用,就凭一个身份证就可以办理民生事项,就不用其他任何证件了,那么实现这个功能首先要进行数据共享,要利用公共数据平台数据。那么数据共享是通过归集数据来进行分享,那么归集的数据就产生什么问题?归集的数据的及时性不够。比如说办理夫妻落户,我们统计了办理这件事情需要几个证件,户口本、不动产权证、居民身份证还有户口迁入、迁出的户口本,还有结婚证,但是结婚证的归集数据有延时,12.7%的数据延迟超过1天,这数据就多了一天,如果你今天办了结婚证,你说马上办户口就办不了需要等到第二天。还有比如说执法检查食品经营许可证过程中,去检查的时候发现还没有食品经营许可证,去处罚的时候实际又是有食品经营许可证的。食品经营许可证数据归集,79.8%的数据延迟超过1天。数据及时性、完整性不够,主要有三个原因:一是非省统建系统数据汇聚的链路长、环节多,部分数据需要部门从各地市、区县的业务系统汇聚,数据推送有延迟;二是省级部门统建业务系统数据加工处理后没有及时推送;三是省级部门数据仓管理运维不够到位,运维人员、系统管理、运维机制、建设标准不够完善,数据仓监测、监控不够到位,数据质量管理精细度不够,省平台也无法实现主动监管。
3. 推进数据高铁建设
所以为了解决数据时效性的问题,我们提出要建立一个数据高铁。数据高铁是什么呢?数据高铁的建设主要是通过归集模式的提升,使数据的归集更加高效更加实时,把数据归集从“推平台”——就是从业务系统把数据推到公共数据平台,变成了“拉平台”,保证从公共数据平台、各个应用系统里直接拉数据,保证数据的及时性、完整性和准确性。同时依托公共数据平台,建立部门、地市实时数据仓,实现对数据仓的共同监管。
4. 核心技术:实时采集数据,又快又准又安全
在整个“推”改“拉”的技术里主要是采用一些流计算。在实施过程中,很多部门的业务系统也有疑虑,因为部门应用系统担心如果公共数据系统对其进行大量访问会影响它的系统性,因此我们也采用一些技术,不占用生产系统的生产资源,不改变生产系统的业务模式,也不影响生产系统运行。(1)采用StreamX 引擎,实现数据实时采集,不影响生产系统正常运行。
(2)采用集群+流计算模式,实现海量数据秒级送达,吞吐能力可达 100万条/分钟。
(3)采用插件化架构,实现各类数据源/数据平台快速对接。
5. 全省数据高铁通车情况
目前已开通11地市、18个省级部门29条“数据高铁”,对接105个业务系统、604类、184亿条数据,有力支撑政务服务2.0、互联网+监管、基层治理、11个标志性项目、“证照分离”改革等重点应用。
6. 数据高铁带来的改变
依托公共数据平台,建立部门、地市数据仓,实现多租户模式下的一体化平台。采取统分结合的模式,全局一套规范,数据集中调度,部门/地方独立管理各自空间。
7. 数据高铁应用成效
开通前,12.7%的婚姻登记证数据、65%的出生医学证明数据延迟超过1天。开通后,实现100%数据实时共享,居民办理“再生育审批”事项更快捷。最简单最典型的一个案例就是办理银行贷款的房产抵押,原来办理半年期抵押房产需要5天时间,现在我们建立了数据高铁,建立了浙江省的金融综合服务平台,当时银行提出来,全省所有房地产单机系统、不动产单机系统的登记信息,抵押各种交易的信息,能不能在三秒钟实施共享。当时我们听到三秒钟的时候,觉得有点难度,但现在实际上我们也确实就是8秒到10秒钟之间实现全省所有不动产登记系统的数据共享,到银行办理也不用原来的纸质抵押证件,实现数据的实时共享。
(三)形成一套闭环运行的数据治理机制
1. 形成一套闭环运行的数据治理机制
我们形成了一套闭环运行的数据治理机制,制定了浙江省公共数据治理的公共细则。《浙江省公共数据治理工作细则》建立省市县问题数据反馈整改责任机制和工作体系,实现问题数据“发现—反馈—修正—共享”闭环管理 ;制订数据清洗规则:通用规则(6类一级62类二级)+ 部门个性化规则(4454条)。实现数据从归集、清洗,到提供共享分析开放分钟级,如电子营业执照从市场监管局产生到可用于交管部门办理道路营运许可证只需几分钟。
2. 实现数据“按需治理,应治理尽治理”
浙江数据共享,从政策、理念、认知上讲,已经不存在大的问题,现在数据的质量是是我们数据共享里的一个难点。虽然问题数据比例不高,但对数据应用来说影响非常大,我们每个月通报问题数据要求各个部门整改,上半年累计发现问题数据2119.1万条, 目前已整改2035.2万条,整改率96.04%,问题数据比例从2019年底0.06%进一步降低为0.03%,这个比例已经很低了,但是这依然是我们数据共享中一项重点工作。
(四)强化数据共享,实现“按需共享,应共享尽共享”
省公共数据平台提供百亿级别数据运算能力,通过接口共享、批量共享两种方式,主动赋能省域、市域治理现代化,支撑各类应用2151个。大数据分析系统首先对全省各类系统提供大数据分析服务,通过公共数据共享系统接口共享来提供的,我们现在数据共享机构有1798个数据共享接口。
(五)数据共享赋能省域、市域治理现代化
实际上在浙江整体数字化信息建设过程中,很多基层平台是全省统建的。省级平台提供什么?提供协同接口和数据接口,请各个市县里面开发什么?开发UI,就是直接面向用户的一些应用,由基层直接设计出来。省级政府的平台提供数据接口和协同接口来赋能县市区部门的UI的开发,浙江统一的UI界面就是“浙里办”、“浙政钉”。数据共享有效支撑重大改革。以“证照分离”改革为例,我省上报国家平台数据340.3万条,数据完整性、及时性、准确性名列前茅。省内实现数据跨层级、跨部门、跨系统共享,满足事中事后监管需要。典型的应用,比如台州防汛防台应用,批量共享省公共数据平台数据10类、60.8万条,利用市公共数据平台接口99个、调用2300多万次,在4号台风“黑格比”防御过程中,为风险研判、灾害预警、应急调度等工作提供有力支撑,实现智能研判风险地区8个,预警地质灾害隐患点14个,一键启动防台响应4次,科学指导转移人员13.9万人,省市两级公共服务平台共同来推动市域的应用。
(六)推动数据开放,激发社会应用创新活力
1.推动数据开放,激发社会应用创新活力
另外我们还推动数据开放,激发社会的应用创新的活力。今年我们开放的数据集9520个,开放数据20.6亿条,网站访问量同比增长118%,下载调用量同比增长116%。数据开放聚焦“四个一”,推进数据开放和应用创新。制度上,出台一部规章——公共数据开放与安全管理暂行办法;技术上,建设一个系统——公共数据平台开放域系统;措施上,举办一场大赛——浙江数据开放创新应用大赛;成果上,打造一批示范应用——可复制、可推广的创新应用。
2. 建设一个系统:公共数据平台开放域系统
我们在公共平台上设立了三个域,一个是基础域,基础数据域;还有一个是共享域,把所有面向政府的共享数据放在公共平台上,属于共享域;最后一个是开放域,开放域是面向社会进行数据开放,开放的数据可以三分,就是将所有公共数据分成三类数据,一类是无条件开放数据,一类是受限开放,还有一类当然是不开放的数据,在开放域系统里,我们将社会数据也放在开放系统里跟公共数据结合在一起,为社会化应用提供服务。今年我们举办了首届浙江数据开放创新应用大赛,本次大赛聚焦普惠金融、交通出行、市场监管、医疗健康、社会服务保障等五大领域,重点挖掘一批社会效益明显、群众获得感强、有助于社会治理提升的数据开放优秀应用,推动优质项目落地孵化,促进数字经济发展,提升社会治理水平,助力“数字浙江”建设。同时,为丰富细分数据开放应用领域,还设立了“电力数据专场”和“德清地理信息专场”。我们把一些数据开放给像饿了么、高德地图、省家政平台、旅游集团这种平台。公共服务平台为他们的运营提供公共数据的支撑。比如饿了么平台餐饮公司的资质,我们将食品经营许可证数据共享给饿了么;比如高德,我们将省内所有停车场的实时空停车位数据共享给高德;此外,我们把一些家政人员的信息也共享给浙江省的家政服务平台,因为现在请保姆对保姆的资质也需要了解,需要一个后台信息的支撑。
(七)建立健全数据标准规范,强化制度保障
我们在数据开发过程中注意建立健全数据标准规范,强化制度保障。支撑我们浙江公共数据管理的是两个政府规章,一个是354号令,就是《浙江省公共数据和电子政务管理办法》,第二个就是今年新出台的《浙江省公共数据开放与安全管理暂行办法》,按照这两个政府令,我们又出台了大量的配套的一些配套的文件,包括《省市两级公共数据平台建设导则(试行)》,导则中包括一系列的地方标准,比如说人口数据库的标准、电子证照的标准、信用信息库的标准、法人数据库的标准、公共数据的严格规范、一些目录编制的规范还有一些工作的规范,例如利用数据脱敏实现公共数据的安全,要制定脱敏的技术规范,还有一些具体的操作指南。我们未来在公共数据方面的展望是,我们想建设全省的数据感知系统,实时感知、采集全省数据目录,做到目录之外无数据。全省各级9208套信息系统,我们通过数据感知网络感知到这9000多套数据里面的数据结构的变化,通过感知到的原始数据来识别需要共享的公共数据,然后通过目录加工完善为可理解的数据。现在实际上所有信息系统的数据是它本来的数据表,外人很难看懂它的数据表、表结构,可重用性还是比较差。我们想通过全省的数据感知系统来把最原始的、最底层的数据表变成可理解的数据目录来实现全省公共数据的共享。我们希望通过这个理念把数据从发现到采集到交互到利用,全链条做好。
参考文献:本文系浙江省大数据管理局副局长蒋汝忠先生于2020年11月27日上午在“2020智慧中国年会” 高级专家研讨会上的演讲
责任编辑:安安