大咖一席谈之刘总和您聊聊数据的遴选与应用
随着数据应用在我们汽车金融业务发展中起到的作用越来越大,我们有必要重新的认识一下数据,以及它的种类,它的应用,它在工作中对决策产生的影响以及与人工审批之间的关系地位,那么,就让我们一起在刘总的文章中找到答案吧。(老穆点题)
当下,谈风控必谈大数据已经成为了行业共识,科技金融的观念深入人心。
那么,到底什么是大数据呢?我们又该如何去看待数据在风控工作中的作用?今天我们的话题就围绕着这个问题展逐一展开。
一.风控工作中主流应用的数据类型简介
1.各类黑名单、灰名单
这类数据是反欺诈类工作的重要数据应用。此类数据的应用分为两类,一是可直接给出结论的黑名单,二是需要判断影响的灰名单。对于灰名单的判定,体现了一家机构风控能力的高低。
2.专项数据库
这类数据是辅助判断类的数据,专注于某一特定方向的数据。市面上此类数据五花八门,名目繁多,风控机构需要根据自身业务属性和特征去筛选应用。
3.信息核验
这类数据是验证类数据,此类数据验证结果明确,是风控人员最喜欢的一类数据,大概看到“一致”二字时,无比舒心。
4.信用报告(非PBOC)
这类数据是专业分析类数据,信用报告一般由专业的征信公司或数据公司整合,具有一定的权威性,可直观反映问题点。
二.数据应用的误区
很多机构在数据的应用上,存在着盲目崇拜的误区,如果数据应用不当,则适得其反。我们来看一下数据应用中的常见误区:
1.数据范围广泛
不考虑数据的质量、来源,有多少接多少,完全不考虑数据对业务本身的价值。甚至会因与业务不相干的负面信息,影响了客户的正常业务办理。
2.数据渠道单一
数据选择单一的采集方式,缺少有质量的后备渠道,一旦数据渠道出现问题,整体审核工将受到影响,甚至导致业务停滞。
3.数据各自为战
数据分项采购后单项应用,缺乏分析加工和整合,即得即用虽然便利,但是浪费了数据的价值。
三.数据遴选原则
既然数据类型如此繁多,我们又该如何选择种类繁多的数据呢?我谈一谈实际工作中,自己对数据选择时的关注顺序。
1.数据的合法性、合规性和安全性
这一点的 重要性毋庸置疑,尤其是受监管的金融机构,如果非常会渠道获取的信息,就算再有价值,也不值得冒风险去触碰。
2.数据需求(数据场景)
每一类金融业务,每一款信贷产品必定有其机构特点的应用场景,我们举个例子来看,每当我们乘坐高铁的时候,总会听到广播里有讲逃票会被记入征信系统,OK,这里所讲的征信其实是个特指的征信,即铁道部门自行整理的一套系统,而不是我们常常接触的PBOC,那这样一个逃票的数据,对信贷工作有多大的帮助呢?做信用授信的消费分期时,还会有所考虑,但我们会因为某人逃了一张北京到天津的一张票面价格为54.5元的火车票,而拒绝他的购车贷款或购房贷款么?显然不是这样的,但是问题又来了,当系统反馈给你这个风险的时候,你会很被动。
当审核过程中,我们面对风险的时候,要么排除风险,予以核准,要么确认风险,予以拒绝,而不应是模棱两可的“或许有”、“可能没事”等等,但因业务场景的原因,以致所发现的风险点鸡肋时,反而影响了审核的判断,这样的数据就显得有些得不偿失。
3.数据的价值(命中率、尤其是整合平台数据,关注上传量)
我们再谈谈什么样的数据叫做有价值。通常我们认为,命中率、数据量级体现了一项数据的价值,这个观点没错,但是不完全是。
举几个例子,先来看看命中率,对于验证类数据来讲,命中率越高,数据越有价值,但如果是反欺诈类的数据呢,就很难以命中率的高低来评定数据价值了,过高说明数据与业务的契合度不够,过低又达不到风险防控的意义。
我们再来看数据量级,动辄千万,几亿的数据量级听起来煞是过瘾,我们在商务谈判中也常常被这个卖点所吸引,聚我个人的例子,与某国内知名数据整合服务平台谈数据合作时,对方对我讲,他们的客户如何如何知名、日查询量很大,同事手机反馈这些机构上传的信贷信息,逾期信息,黑名单等等,形成了一个规模庞大的信用风险共享平台。OK,那么我的问题来了,实际有多少机构向他们上传了自己的信贷信息和黑名单信息呢?查询量是千万级,实际上传给他们的信息又有多少呢?对方沉默不语,自然有些其他方面的解释。
诚然,通过数据平台共享风险,提升彼此的价值,这个构想美好,未来也终会走向这一步,但不会出现在现在,这里面深层次的原因不是今天的主题,也不再就这个话题展开了。
4.数据源的渠道稳定性
这其实有两个概念,一是渠道,二是稳定性。
我们先谈谈渠道,所谓渠道,也就是你获取的是第几手的数据,从数据的收集方直接拿一手数据最为真实,可靠,不过一般的机构很难直接接入,那么二手数据是我们主要的选择,即通过征信公司或数据公司获取,这里会出现什么问题呢?征信公司在提供数据时,会根据客户等级不同,需求不同向对方提供有选择的数据,这里设计一些商业操作面的问题,我就不在此揭示了,还请大家理解。至于一些拿着三手,四手数据的供应商,我在此也奉劝大家审慎采购,不谈其他因素,单是数据往来要跨越多个服务器这点,就足够令人担心,稳定性、安全性都无从谈起。
我们再来看看稳定性的概念,除了数据交互的稳定性,我们也要看数据供应的稳定性,实际工作中总会有因为各种原因,数据源停止了某项数据的供应,有可能是受相关的法律法规制约,也可能是你的供应商与上游合作谈崩等等,总之,供应商的实力与口碑在这个环节上就尤为重要。
5.数据的可替代性与可解读性
这两项指标的内容过于直白,我也就不再赘述了。
6.价格
是的,价格在我考量一家数据供应商是只能放在第六顺位上,价格不等于性价比,性价比应该放在价值的那一项中去考虑,比如某加公司独有,且是你最看重的数据,那尽管价格高些,性价比上去了,还是有价值的。而价格的比较,也有学问在里面,将来如果有机会,可以展开谈。
四.数据应用原则
1.验证类数据的适用范围
大致范围可以包括身份信息验证类、银行卡鉴权类、运营商信息类、财产证明类。
2.数据间的关联应用
如将灰名单与金融画像类(社会行为分析类)数据关联,按本机构需求进行加工,向风控人员提供参考。
3.怎样的数据可进入评分卡
定值或固定字段类的数据,可通过权重匹配,纳入到评分卡应用中。但权重匹配是设定的关键。通常建议将数据按审核思路分类,再将相关数据,对应到各自的大类中。之后,根据机构的风险承受能力,确定侧重点,设定各大类的权重。最后才是某一项数据在各自类别中的应用。
总结
尽管数据应用在当今的审核工作中有着毋庸置疑的重要性,但我始终认为,数据是工具,是手段,不是目的,不应该为了数据而数据,风控工作更不该被数据绑架,盲目的数据崇拜会使风控工作迷失了方向,退化了思想。
数据不应该是婴儿的学步车,失去了就走不了路,实际工作中,很多年轻的同事,当数据无法给出有效支持时,居然茫然失措,没有了数据,就不会审核,这样的情况,我觉得,说明他在工作中舍本逐末,没有掌握到风控工作的精髓,只是依靠着数据去工作,没有了数据,他什么也不是,而如果只靠数据就可以完成的审核,还需要人工么?人工智能发达的今天,系统也不能完全取代人工的审核,有经验的审核员在人力市场上的价格也高的令人咋舌,说明什么?说明审核的核心还在人为,数据、系统只是我们更好控制风险的工具。