【案例】某城商银行——消费金融大数据智能风控体系应用
项目以“内外部大数据的应用”、“实时风控技术的落地”、“智能化风控体系 的搭建”和“云化风控系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能风控解决体系,项目落地后取得了较好的效果。
本篇案例为数据猿推出的大型“金融大数据主题策划”活动(查看详情)第一部分的系列案例/征文;感谢 数尊 的投递
作为整体活动的第二部分,2017年6月29日,由数据猿主办,互联网普惠金融研究院合办,中国信息通信研究院、大数据发展促进委员会、上海大数据联盟、首席数据官联盟协办的《「数据猿·超声波」之金融科技·商业价值探索高峰论坛》还将在上海隆重举办【论坛详情】【上届回顾(点击阅读原文查看)】
在论坛现场,也将颁发“技术创新奖”、“应用创新奖”、“最佳实践奖”、“优秀案例奖”四大类案例奖
来源:数据猿丨投递:数尊
本文长度为5000字,建议阅读10分钟
近年来,伴随互金、消金等业务形态的崛起,个人金融信贷业务范围逐步扩展至新场景、新客群,探索出了新模式、新通道。与此同时,作为金融的“本质”的风险控制面临了前所未有的挑战。
尤其是在网贷、消金领域,新形势下风控命题迟迟无法破题,导致大量积聚的风险正在蚕食着行业健康、可持续发展的基石,主要表现在以下几个方面:
积聚政策性风险。在风控领域缺乏真正有效的解决方案的情况下,大量机构被迫“超高利率”来弥补风控的不足,也引来了监管部门对“现金贷”等业务的强力整顿。
倒逼客户回流传统机构。曾几何时,高举“效率为王”,以急速放贷为突破口,给行业带来了几缕新气。然而,过高的利率、妖魔化的催收,正在倒闭客户远离这个行业。
造成行业社会价值极大削弱。“好人不敢来”、“坏人里面挑好的”成为常态,新金融与“普惠”的初衷渐行渐远。
与此同时,大数据、人工智能技术逐渐成熟,行业看到了彻底解决风控症结的新路径、新方法、新技术。为此,构建新形势下的新一代智能借贷风控体系以有效识别风险、降低风险,如何有效依托场景、创新性使用新技术、平衡风控的效率与效能,打造新型的智能风险控制系统成为我们这个时代风控人的核心使命。
本项目以“内外部大数据的应用”、“实时风控技术的落地”、“智能化风控体系的搭建”和“云化风控系统的探索”为基础,与客户一同形成一套整体化的新型大数据智能风控解决体系,项目落地后取得了较好的效果。
周期/节奏
项目的整体分为两个阶段,第一阶段为实施部署,持续了16.5周,具体分为:方案制定、接入准备、系统测试、软件实施、验收测试、系统上线等6个阶段,于2016/3/21项目开始到2016/6/30结束。第二阶段为上线运营,跟进了12周,从2016/6/30开始到2016/9/30结束。具体项目排期如下:
客户名称/所属分类
项目名称《某城商银行消费金融场景大数据智能风控体系》。
以下为所属分类选择:
1、风控行业
风险控制是指风险管理者采取各种措施和方法,消灭或减少风险事件发生的各种可能性,或风险控制者减少风险事件发生时造成的损失。总会有些事情是不能控制的,风险总是存在的。做为管理者会采取各种措施减小风险事件发生的可能性,或者把可能的损失控制在一定的范围内,以避免在风险事件发生时带来的难以承担的损失。
2、大数据技术服务
基于大数据特点:数据量大、类型繁多、价值密度低、速度快、失效高等,结合金融行业特点,从大数据的思路出发,提供从数据到技术到业务再到决策和战略部署的整体解决方案服务,为企业和消费金融业务带来从量到质的过程。
任务/目标
银行现有风控体系面临数据应用范围扩展、风控决策效率不匹配场景需求,本项目旨在达成如下目标:
1)探索非金融体系数据的应用:现有风控体系基于央行征信报告设计,内部数据集成项目正在进行过程中,时间不可匹配业务,外部数据(征信数据除外)尚未有接入经验;
2)提升风控决策效率:传统风控系统单笔订单审批时间超过半小时,但消费金融场景客户填写资料后就在现场等,需要做到“实时”或“准实时”放贷;
3)尝试风控体系自动化优化:需要针对消费金融场景独立构建分析体系、风控体系自优化等内容;
4)探索风控系统的云模式:以消费金融业务为试点,探索风控系统云化的可能性。
挑战
本项目整合了数尊的三个核心产品:BOX(数尊宝)、BOL(数据连)、BOD(数尊塔)等三个产品,分别用以实现外部数据的接口及调度管理、内外部数据的任务/算法/运维管理、智能化决策引擎系统等三大主要功能,三个产品针对消金场景而设计。
尽管数尊拥有丰富的三个自有产品的实施经验,但仍然面临了以下三个方面的挑战:
1)认识层面:客户方对云化、外部数据的应用存在疑惑,也缺少经验,部分人员存在认识不清、不敢推动、不知如何推动的情况;
2)数据层面:内部数据存储于多个系统,存在多口径、格式等多个方面的问题;外部数据样式多变、项目执行过程中持续增加了多个接口(相应接口的字段也都有增减);
3)项目预期:对新业务的业务量预估值过高,对系统性能提出了超高水平的要求,导致系统部署方案进行多次调整。
实施过程/解决方案
本项目基于公司已有的外部接口管理平台、内外部数据实时处理平台、智能决策平台,采用多项成熟的外部数据处理标准、构建超过2000+内部风控决策规则,并且通过人工智能算法对决策流关键要素(如:字段、规则、评分卡)进行自动的监控及预警。
项目紧密结合新金融风控的特点、客户特点、以友好的体验方式,提供给客户一整套易用、灵活以及较彻底的拜托传统IT的束缚的智能化风控决策系统。
从如下项目构架图可以看到整个项目包括大数据接入平台(BOX)、大数据中间件(BOL)、智能决策平台(BOD)3大部分。
1、大数据接入平台
项目基于公司现有的BOX系统,整合已经接入30+以上外部数据供应商的数据接口,实现对央行征信、运营商数据、银联数据、电商数据、政府数据等2000+维度的字段的集成和实时调用。
另外,BOX系统采用了先进的数据路由的理念,对同一字段实现了“主从备”多数据源调用的动态优化,同时,也支持业务人员基于字段响应时长、字段覆盖率和字段成本等多维度指标,对数据调用策略进行界面化配置。
所涉关键功能包括:
1)数据接口变更的界面化配置。实现对接口HTTP、调用参数、覆盖字段、字段返回值等内容的前台维护和界面化配置。
2)数据调用路由,确保数据的稳定性。实现对多数据源的动态调用策略,封装了成本优先、覆盖率优先、按比例设置主从等多个策略。
3)外部接口原始数据的切片式存储和检索。实现对外部接口原始数据的存储和检索,以及数据的维护。
主要解决的问题:
1)解决外部接口持续增多、数据口径/逻辑不稳定所带来的频繁变动的问题。
2)解决外部数据调用需要兼顾“稳定性”和“节费”的问题。
3)解决调用来的原始字段存储的问题。
2、大数据中间件
大数据处理中间件(BOL)主要用以实现内部自有数据的实时同步、内部数据的复杂算法处理、内外部数据的交叉比对、外部实时清单数据的加工处理等4个方面需求。
BOL使用了目前最先进的流处理技术和实时处理机制,支持在10ms以内实现个人客户标签的抽取、数据的交叉比对等内容,极大的降低了业务界面客户等待的时间。
BOL综合采用了JVM存储、内存数据库和分布式缓存的方式,形成了数尊面向金融应用场景独有的数据存储结构,兼顾系统的动态性、高可用、高可扩展性。
BOL支持客户通过前台定制SQL的方式形成“任务”,通过触发和手动两种方式激活任务,实现对数据表操作、数据复杂加工处理、内外部数据的交叉验证等功能。同时,BOL支持基于xml方式的外部大数据计算平台的复杂模型的导入,从而为整个系统提供了大数据智能的数据基础。
所涉关键功能或技术包括:
1)流处理技术
BOL基于SparkStreaming搭建了流处理核心技术。通过创造性的应用和改造SparkingStreaming提供的丰富的API,实现内存的高速执行引擎,实现了丰富的“流式、批处理和交互式查询”应用。
2)通用算法平台结果文件的兼容和实现
通过XML解析器解析SAS、SPSS、阿里机器学习平台产生的模型结果,实现了对离线建模结果的兼容和算法应用
3)CEP策略的承载
内置复杂时间处理模块,用以提供提供基于时间跨度和滑动窗口的事件处理模式,极大的丰富了风控系统应对风险的能力。
4)第三方数据标准化及入库管理
内置30+第三方数据源接口、入库任务、常用加工处理任务,可供随时实现对外部数据的调用。
主要解决的问题:
1)解决海量数据挖掘的计算效率问题
某城商银行存量客户近1000万,项目使用了这批客户3年内的交易流水数据、APP登录、客服等维度的全数据,每天增量数据超过1G,这样的海量数据计算不可能由单台服务器完成,而是需要多台服务器同时计算,且最大化地使用服务器资源。
2)解决动态风险预警信息及时传递给决策流的问题
针对基于行为触发规则的场景,BOL基于实时数据的计算,捕捉动态风险信息并主动推送给决策流系统。
3、智能决策平台
智能决策决策平台(BOD)是智能风控决策中心平台,用以对借款人进行准确、实时的风险量化评估、进而提供基于订单的风险决策建议;
BOD为客户提供【一站式】风控决策流的开发、发布与部署的平台,提供【无需编码】【拖拽式】的决策流界面,【一键式】决策流上线部署和下线停用,提供基于数尊项目经验的“2000+内置的规则和100+评分卡”的强大知识库。
工作机制:接收到业务系统的借贷决策请求后,BOD向BOL发起数据请求,BOL通过调用外部字段(BOX)、整合内部字段完成数据组织;BOD获取数据后按决策流节点需求计算出节点结果,持续进行后续多次调用。
BOD为客户提供全流程闭环数据管理,为数据化运营提供了基础。BOD提供了风控业务相关的“前台”和“后台”报表50余张,帮助客户全面分析进件情况、指标、模型、决策流的整体情况和效率。
BOD基于历史数据,运行后台封装的算法策略,统计后台算法策略的违约率,作为字段、规则、评分卡等决策要素的效能优化的依据。
所涉关键功能或技术包括:
1)规则引擎
BOD兼容流模式和规则模式,基于风控应用了实现了大量的逻辑优化,实现了引擎核心与Java内核的完美融合。
BOD内置了规则优先序自动优化的智能程序,用以自动节省规则流中规则执行的优先序以及节省数据成本。
2)知识图谱
BOD基于“字段规则评分卡决策流”之间的内部数据关联关系,使用知识图谱的方式,提供可供配置的四类要素效力的指标监控和预警。
BOD依托客户的身份主键信息进行了普遍的实体化,支持基于本人、联系人、交易方、身份证、手机号、地址、学校、邮箱后缀、工作单位、QQ等借款人ID的关联关系展现,从而帮助客户方专家人工识别欺诈、信用风险的团体特征。
3)机器学习算法
BOD内置了包括GDBT、RNN、CNN、DNN等30+算法,仅需简单勾选即可跟踪风险动态,通过实时捕捉风险变化对决策流要素优化方向给出建议。
主要解决的问题:
1)决策流页面化全面配置的问题
决策流全流程页面化配置,全局“托拉拽”式组织,有效解决了传统引擎难用、不会用的问题。
2)人工智能和专家智能的融合的问题
基于个人关联关系,在复杂网络智商通过无监督算法实现分团和网络全局风险特征抽取,并基于规则和模型融合专家研判持续迭代和优化模型、发现欺诈模式。机器+专家研判持续强化机器识别能力。
结果/效果总结
1)风控效率提升。上线新系统及模板规则后,有效防控欺诈客户、降低信用风险,消费金融业务逾期率下降21%。
2)风控时间有效缩短,有效适配场景需求。线上放贷周期由1小时最短降低到1分钟,有效提升在客户触点的竞争力,审批时长的缩短直接提升了渠道推广人员的积极性。
3)IT风控权责分离和模型自动化能力带来大量成本节省。风控模型变更不再需要IT排期,风控人员即可完成修改并热部署实时生效;风控模型调整周期缩短,更高效应对信贷风险,提升风险应对能力。针对项目场景,整体系统节省的人工审批成本、软件开发成本、IT维护成本,经核算,整体节省成本约458万/年。
企业介绍:
1)数尊信息科技(上海)有限公司(以下简称数尊),是“华院数据”基于大数据核心能力、面向信用评估和风控领域孵化的子公司,专注于个人与中小企业信用风险的评价服务。数尊已成功完成两轮投资;
2)数尊总部设立在上海,在西安设有研发中心,在深圳、杭州等地设有办事处;
3)数尊擅长于多维权威数据源的整合和综合洞察,以“用数据推动风控和信用服务”为使命,致力于帮助企业提升个人客户的信用服务和风险控制能力,并立志成为中国最专业的数据化信用服务解决方案提供商;
4)数尊已覆盖了超过8亿的个人客户信用评价,并对近1亿客户实施过个人信用的场景化辅助应用;
5)数尊优势:
汇聚了来自中国科技大学、复旦大学、上海交通大学、西安交通大学等顶级学府的顶尖人才,组建了国内一流的金融智能算法和技术团队,其中硕士及以上学历员工超过80%,团队具备大数据、金融、互联网等行业的丰富经验;核心成员均具有十年以上面向个人客户的金融风险控制模型、系统、整体解决方案服务的经验或管理经验或数据处理经验;
数尊所深度整合的数据来源合法、操作合规、应用合理,可以为金融机构提供丰富有效的外部数据资源;
截止目前,数尊已经为国内300多家银行、保险、消费金融公司、其它互联网金融机构提供大数据智能风控服务,在行业享有一定的知名度和美誉。
数据猿超声波
「2017金融科技商业价值探索高峰论坛」
(点击图片,了解详情)