零点有数以数据懂人性,市民精准画像助力政府治理
精准画像的“前世今生”
市民精准画像的应用场景
1、精准反诈
在公安反诈场景中,当前有两种主流的反诈手段,一是建立诈骗者黑名单机制,以事中及时止付的方式拦截诈骗行为;二是进行铺天盖地的全民反诈宣传,提高市民对诈骗行为的防范能力。
零点有数将商业领域中的精准画像应用于安防领域,将全量宣传转化为精准宣传,以历史受诈骗人群作为训练样本,建立监督学习模型,绘制出易受诈市民精准画像,大幅裁短宣传名单长度。
在实际建模过程中,零点有数发现了一些有趣的事实。
一线民警往往经验性地构建受诈人群画像,与模型有异曲同工之妙,例如认为“30岁以上”“单身”类人群是婚恋交友类诈骗的“常客”,但这些标签在模型中却表现不佳。究其原因,民警的经验性分析不会涉及“冷门”标签,而是更多地关注到人口学变量,才会有诸如“30岁以上”“单身”易受婚恋交友类诈骗的结论,而其背后有着更多隐藏的标签,需要借助精准画像来发现。
举例来说,“驾龄”“一年内的铁路购票次数”等这类难以用经验解释的标签,反而在易受诈人群模型中表现抢眼。若对这两个标签进行解释,即对应为“较早购买私车”(经济条件宽裕)和“商旅人士”,这两类人群在受诈人群中更为明显。
归根结底,精准画像是数万个标签经过复杂组合后的结果,如果仅凭经验来粗暴地挑取其中几个字段加以业务解释,对实际工作的指导效果不佳。
零点有数将精准画像应用于民政救助领域,以历史受救助人群作为训练样本,建立监督学习模型,绘制待救助市民精准画像。
零点有数深耕公共事务领域多年,基于分析应用政务数据的丰富经验,建立“救助数据库-救助画像-救助子场景”三步走的精准救助流程。
第一步,大而全地对接救助相关数据,涵盖多个民生领域;第二步,精且细地对数据进行处理建模,制作个人信息、社会关系、健康状况等多套救助标签,绘制待救助市民精准画像;第三步,建立多个业务子场景,在大病医疗、家属拘留、多胞胎等具体场景中定位潜在待救助人群。
市民精准画像的复用性与积累性
市民精准画像本身还具有两个不可忽略的特性,即复用性与积累性。
画像的背后是全市市民的“一人一档”与丰富的个人标签,本身可作为监督学习模型的特征表,其应用场景的多样性完全取决于训练样本。换句话说,数据标签是丰富的食材,而如何处理和烹饪、是否美味营养则取决于厨师的经验和技术。
零点有数以受诈人群识别易受诈人群、以被救助人群识别待救助人群,同样的思路经过处理后,可迁移至禁毒、维稳、反恐、矛调、养老服务等多个政府治理场景。
积累性则体现于少量的画像标签就能支持业务模型,大量的画像标签能改进模型,后至的画像标签也不影响之前的画像标签。先画骨架、再绘血肉,最后涂上皮肤,一个人的数字画像可以随着数据源的扩充不断变得鲜活。
零点有数综合运用精准画像、云计算、人工智能等技术手段,帮助推动数字政府的建立,推进治理方式的变革。以市民精准画像作为切入点,期望能够辅助提升政府的监测预警、应急管理和综合服务能力。
未来,零点有数将继续聚焦于公共事务领域和商业服务领域,运用20多年的数据分析与决策支持经验,助力政府治理,释放数字新效能。