这家超酷的公司要上市:CIA的御用大数据服务商会对保险业“降维打击”吗?
保观 | 聚焦保险创新
如果说谷歌是互联网大数据的霸主,Palantir或许可以称得上企业级大数据领域的霸主。Palantir本是《指环王》中可以穿越时空、洞察世间一切的水晶球的名字,作为大数据分析公司的Palantir也不负其名,凭借强大的分析技术“明察秋毫”,破解了不少世界级的“秘密”。9月29日,这个发家于To G业务的公司即将上市。除了大量的政府业务,这家硅谷最神秘的大数据公司也在拓展商业客户,包括保险。这样一个玩家入局,对于保险行业来说会是最硬核的“降维打击”吗?
硅谷的“离经叛道”者
Palantir成立于2003年,正式运营开始于2004年,但在直到2014年的10年时间里,它都很少为人所知,神秘程度可见一斑。2015年开始,随着“大数据”越来越多被提及,这家估值已经达到200亿美元的独角兽才开始进入大家的视野。
Palantir的主要业务是为政府机构和大型企业客户提供大数据分析软件和服务。除了服务客户的特殊性外,从很多角度看,Palantir都挺“不一般”。
Palantir拥有硅谷教父级的创始人。它的主要创始人彼得·蒂尔不仅是Paypal的创始人,作为风险投资人的成绩单也很亮眼:Facebook、LinkedIn、Yelp等都是他的代表作,畅销书《从0到1》也是这位大佬的作品。除了彼得·蒂尔,Palantir的其他创始人还包括他在斯坦福的同学Alex Karp,以及另外两位同样来自斯坦福的“超级码农”等。
彼得·蒂尔
Palantir从成立伊始便和政府业务有脱不开的关系。9·11后,美国面临恐怖袭击的威胁,CIA忙于调查各种线索。虽然有成千上万的数据库,但政府缺少最好的工程师来挖掘这些数据间的联系。而在Palantir成立之前,彼得·蒂尔的Paypal就深受欺诈问题困扰。为了反欺诈、反洗钱,Paypal开发了一套防欺诈系统来应对可疑资金转移等问题,再由分析师对筛选出来的结果一一排查。Palantir在此基础上开发出了更强大的“人+机器”超级系统,可以提升数据分析效率。在这些条件下,CIA成了Palantir的第一个客户。
Palantir最传奇的战绩之一是帮助多家银行追回了前纳斯达克主席麦道夫藏起来的几十亿美元巨款;据说,它还帮助美国军方成功定位和击毙了本·拉登,所以很多媒体在报道这家低调、神秘的公司时常常喜欢用“那家帮助找到本·拉登的公司”来称呼它。
围绕着Palantir一直有不少争议。典型的硅谷公司倡导自由主义,处理和美国政府的关系时也很谨慎,比较起来,Palantir在硅谷显得特立独行,甚至有点“离经叛道”。因为业务的关系,它和美国以及一些欧洲国家的情报机关关系密切,而且广泛收集了大量用户数据,Palantir也常常因为数据隐私问题被抨击。不过,Palantir也在招股书里为自己辩护称“我们不从事收集、挖掘或出售数据的业务。我们只是建立软件平台,使客户能够整合他们自己的数据。”
“在成千上万个干草堆里找针”:比数据收集更有价值的是分析
从反恐到商业:Palantir 的“三步走”
大数据公司面临的最关键问题是数据来源与数据量。我们常见的公司多是从事To C或To B业务,数据来源也多是源自这两条途径。这其中的几个痛点在于:
首先,除了诸如微信、支付宝等极少数的超级流量平台,绝大部分单个机构的数据体量比较小,而且维度也较单一,例如,一个医院的科室只有有限病人某类疾病的病历数据。
这个问题进而导致了数据的分散、标准不统一,大数据公司即使收集到了较大体量的数据,要想将其整合成统一标准的表达已经是一个挑战。
此外,目前很多行业数据积累的时间比较短,这不仅影响了数据体量,也影响了从时间维度对数据的分析。以健康险为例,一些专家也已经提到,过往数据积累的缺乏是影响健康险产品设计、定价的因素之一。
Palantir的业务切入点让它从一开始就可以接触到巨量的数据资源,形成了独特的竞争优势。前文已经提及,Palantir的成立与美国反恐有着密不可分的关系。尽管CIA、FBI等情报机构掌握着成千上万的数据库,包括财务数据、DNA样本、语音资料、录像片段、世界各地的地图等,但如何在这些纷繁复杂的数据中找到有价值的线索,提前掌握恐怖分子的行动相当耗费时间,而且对技术有很高的要求。
与情报部门相比,Palantir有更好的工程师,并且有Paypal时期的技术积累,可以建立分析数据库,整合相互分离的数据来进行搜索和分析。基于此,Palantir将客户定位于most important institutions,也就是最有影响力的政府组织、大型企业。通过与这些掌握着最全面、权威数据的机构合作,Palantir在起步阶段就已经突破了一定的数据壁垒。尽管这些数据仍然属于客户,但Palantir在服务过程中不断提高的技术能力和沉淀下来的对行业规律的洞见是非常宝贵的。
Palantir的发展可以分为三个阶段:前六年专注情报分析,建立了与政府客户的成功案例,在大数据领域树立了声望;下一步将客户拓展到同样有反欺诈、风控等需求,定价较高的金融机构;接着向更多领域发展。2013年,Palantir进军保险行业。
Palantir行业拓展时间表
目前Palantir拥有两大产品线:Palantir Gotham和Palantir Foundry,并形成了十余种解决方案,包括反欺诈、网络安全、国防安全、保险分析、疾病控制等。其中,Gotham主要面向政府客户,Foundry则主要面向商业公司客户。
Palantir Gotham
Gotham大数据分析平台主要应用于政府部门的国防、安保、反恐等领域,它的运行流程以多源数据为起点,包括结构化的数据,如日志、财务数据报表、电子表格等,还有非结构化的数据,如视频、邮件、文件、图片等。Gotham可以对这些源数据进行建模,将多个数据源整合成简洁、一致的数据。
传统数据建模通常围绕表单中静态的行和列展开,这种做法其实对于操作人员对数据在实际场景中的理解和应用并不友好。Gotham的厉害之处在于,它在建模时已经运用了真实世界的现实事物的特征和彼此间的联系,如“人群”、“组织”等,这便大大提高了建模的灵活性,使模型有了实际意义。
Gotham可以将用户数据更新实时同步,将用户行为自动记录、归因分析并存储,形成“动态本体”。
Gotham平台的应用工具包括:
Gotham的Table功能
用户可以通过这些综合性应用与数据产生“交互”,即刻搜索所有数据源,将数据关系可视化,进而建立不同的假设,发现数据间的联系和隐藏的模式,这更符合人们对数据分析、应用的期望。
正如Palantir在招股书中所言,他们的工作“不是在一个干草堆里找针,而是在成千上万个干草堆里找”。正是因为有了将不同来源的千头万绪的数据整合、集成为一个整体,挖掘深层线索的能力,Palantir才能屡屡创下“神迹”。Palantir的工程师还会深入阿富汗前线的基地与工厂部署系统,真的很勇敢!
现在,Gotham服务的美国政府部门覆盖了美国陆、海、空军,疾病控制中心,国土安全部等。在海外,Gotham还为丹麦警察局等其他国家的政府机构提供产品与服务。
Palantir Foundry
Palantir Foundry前身为Palantir Metropolis,最初是为金融行业设计,帮助他们进行欺诈识别,目前主要面向企业用户,已经覆盖了36个行业,可以连接到企业数据、专业数据和公共数据集,实现数据集成、信息管理和定量的分析,并发现趋势、关系和异常情况,包括进行预测。
在后端平台, Foundry将多个来源的结构化数据整合到连贯的模型中,并对模型执行复杂计算,同时共享和迭代分析产品;在前端应用程序,它提供了一套集成的应用程序,让用户可以建立交互,这些应用工具包括:
Monocle页面
Foundry在金融、保险领域的应用相对成熟,金融行业非常重要的信用评级、风险管理、关联交易、洗钱、逃税等都涉及此项分析内容。Foundry也获得了华尔街的认可,摩根大通是Palantir的第一批非政府客户。
除了金融类客户外,Palantir的企业客户还有空客、全球最大能源公司之一的bp、北美汽车制造商FCA美国等。
通过Palantir的产品可以看出,其技术主要有以下几个关键点:
1、构建了敏捷的大数据架构,数据规模可扩展,同时具有实时性和灵活性;
2、可以进行多领域与维度的数据整合及关联存储,进而抽象出各类数据资源间的关联关系;
3、建立的数据分析模型是可以快速定制且动态的,能够针对不同场景快速组建分析模型;
4、有面向人机共生的可视化技术,构建全局分析链,把人的决策和大数据技术进行深度融合,而且系统操作相对有何,即使没有多少技术基础的人也可以使用。
处理海量、异构的数据是数据分析的难点之一。在实际场景中,一方面要克服数据非结构化的问题,另一方面,诸如人脸、DNA、体态等各类信息表面上看关联性不强,但实际上蕴含着各种关系,不同数据影响的显著性也有差异,各种关联之间还隐藏着更深层次的信息。
与其他竞争对手相比,Palantir的主要优势就在于它对实际业务与场景、数据逻辑的理解更深入,突破了不同垂直领域间的壁垒,将数据融合到具体的“语境”中,打通了数据“上下游”间的关系。而且经过多年的业务积累,Palantir可以覆盖的数据与技术相对多元,跨行业的数据关联也对解决问题有很大的帮助。
进军保险:Palantir的“降维打击”?
Palantir于2013年开始涉足保险业务,保险分析也是其解决方案之一。这家CIA御用的大数据分析公司会对保险行业的其他竞争者形成“降维打击”吗?
Palantir可以集成高敏感度的保险数据,为保险运营的各个环节赋能,并根据可用数据进行风险评估。
具体来说,我们可以将Palantir为保险行业提供的解决方案分为对营销和销售、反欺诈及产品定价赋能这三大类。
营销和销售领域--基于所服务保险机构的数据,Palantir通过聚类、细分等方法对保险客户群进行分析,识别出低价值与高价值群体,帮助保险公司针对不同客群采取不同的展业策略。对于每一个客户,Palantir也可以生成包含了其财务、行为、趋势等信息的全方位视图,使客户经理能全面了解客户情况。
Palantir对销售活动的数据指标分析比较细致,可以检测营销活动的实时绩效,以及产品的采用率、吸收率、粘性等,不仅可以区分出最赚钱和最不赚钱的业务,还可以更深入地进行成因分析,从而提高销售效率。
反欺诈--反欺诈产品是Palantir在金融业务中最常见的应用之一。具体到保险场景,Palantir可以使保险机构实现索赔决策自动化,同时非结构化文档与结构化数据系统连接在一起,以实时评估索赔趋势,评估风险。如果发现异常索赔,Palantir系统可以迅
速标记,筛选出各类潜在的欺诈性行为。
产品定价--Palantir可以对保险公司当前的产品定价模型及算法进行评估和加强,对单个保险产品到大型再保险投资组合定价。
在上述各细分领域,中国也有不少提供相应服务的保险科技企业。比较这些公司与Palantir,比较显著的差异还在于所处理业务的细致、深入程度不同。很多数据公司所做的工作更像是数据获取后比较粗浅的归纳、整理,没有形成符合业务需求的相关指标,发现数据关联与规律,进而指导业务开展更是无从谈起。
Palantir的技术中还有一个需要我们注意的点是,在很多情况下,Palantir并不是直接替换到所服务企业已有的IT系统,而是在现有基础上进行一定的调整、扩展,使新增加的功能与已有IT格局相适应。这种做法对于企业来说有利于降低系统迭代的成本,快速实现升级,并且对员工所需进行的新技术培训也相对简单。对于保险这样亟需更新旧系统,加快数字化的行业来说,或许这类方案会更受欢迎。
Palantir合作过的保险公司包括苏黎世保险、日本财险公司Sompo等。其中,苏黎世保险与Palantir合作开发了数据挖掘软件,以更准确地为保单定价,Palantir提供的产品包括对所有相关数据源的快速集成,迭代面板、二阶分析应用程序等;Sompo则和Palantir一起在日本成立了合资企业,并推出新型的实时数据平台,Palantir加快了对日本市场的拓展。
苏黎世保险与Palantir开展的试点功能
高速增长却从未盈利,Palantir的问题在哪里?
Palantir的收入模式包括SaaS系统订阅与定制化的软件开发收费两种模式。为了获客,Palantir通常为客户提供短期的试用,收取较低比例(例如20%)的费用,有些甚至免费,客户满意的话再支付剩余费用。
在2020年上半年,Palantir有125个客户,包括各个领域的领先公司以及世界各地的政府机构。虽然客户数量不多,但单个客户创造的价值比较高:2019年,Palantir每位客户平均带来收入560万美元。
尽管已经成立了十几年,Palantir的收入增速仍然在加快:2019年其收入为7.426亿美元,比2018年增长25%;在2020年上半年,Palantir创造了4.812亿美元的收入,与2019年上半年的3.227亿美元相比增长了49%,这可能与疫情期间线上业务处理需求的增长有关。
Palantir业务增长趋势
从收入结构来看,2020年上半年,来自政府客户的收入为2.58亿美元,占总收入的54%,同比增速达76%;企业客户收入 为2.24亿元,占比46%,通过比增长27%。而在2019年,Palantir收入的53%来自商业客户,47%来自政府机构。之所以发生这一变化,我们认为与疫情期间政府部门因公共服务增加而产生需求增加有关。
虽然收入在不断增长,但Palantir自成立以来始终没有盈利。2019年,Palantir净亏损5.796亿美元;2020年上半年,净亏损为1.647亿美元,但这种经营情况已经有所改善,在2019年上半年,其净亏损为2.805亿美元。
Palantir之所以难以盈利,除了科技类企业高昂的研发投入外,最主要的支出还是在于销售费用这就涉及到To B类企业共同面临的问题。在正式合同签订之前,Palantir通常都需要花费几个月的时间、投入大量资源与客户一起进行一些实验性质的服务内容,这个阶段成本已经产生,但收入却要在后期确认,因此短期内收入无法覆盖成本,也会影响其未来的盈利能力。
除了盈利问题外,Palantir面临的另外一个挑战是业务集中程度高。根据招股书中披露的数据,2019年它的前20名客户带来的营收在总收入中占比达67%,这20名客户平均每位带来2480万美元收入。在2020年上半年,一个政府客户贡献了该公司11%的收入,还有一个企业客户贡献了10%的总收入。
Palantir显然也意识到了这个风险,在风险提示中提到:“如果现有客户不继续向我们购买产品或续签合同,或者我们与最大客户的关系受损或终止,收入可能会下降,经营结果将受到不利影响。”
不过有一点可以宽心的是,Palantir的业务涉及数据量比较大且敏感,服务的客户对安全性要求很高,很可能对Palantir形成“数据忠诚度”,如果切换新的合作商,资金、时间、信息安全等成本都比较高。此外,Palantir本身技术过硬,这是它最重要的立身之本。目前它的客户平均合作时间长达6.6年,客户忠诚度还不错。
上市在即:我们能从Palantir学到什么
Palantir将于9月29日上市,目前估值已经超过400亿美元。我们选择和大家分享这个案例不仅仅是因为它是一家保险科技相关的公司,更主要的是因为Palantir在一些共性的问题上可以给我们带来启发。
“大数据”是过去几年最热门的概念之一,无论是保险行业还是其他行业,我们都看到了很多所谓的大数据企业。但或许我们应该对“大数据”领域有更明确的定义与认识,最重要的是,对什么是“大数据”企业的核心竞争力有更清晰的认知。
研究数据最终的目的是为了指导实践,创造实际价值。所以,简单的数据收集与罗列的意义相对有限,随着业务和技术的发展大家也会发现,单点、静态的数据可以创造的价值越来越少,能够进行动态、跨维度分析数据流的企业更有优势。好的大数据分析不能只看能获取的数据绝对量的大小,也要看数据覆盖的行业领域、维度以及时间跨度,基于此才能更准确地挖掘出看似零散的数据之间隐藏的联系与规律,从而真的起到反馈、调整业务实践的作用。
Palantir之所以能做到这一点当然有其特殊性,包括不同国家间社会环境、制度等的影响,但它展现出的对不同来源、不同结构数据逻辑的理解和处理技术很值得我们学习。在这背后,是有了一定数据量后就满足于浅尝辄止的尝试,还是持续地积累、挖掘,这是一般企业与顶级企业存在差异的重要原因。
第二,Palantir应用的成功还在于它能够将技术与具体行业、场景有效地结合起来,这需要基于对不同业务本身有实际的了解。以保险业为例,保险本身体系复杂,技术赋能保险的过程中,很多问题并不是因为技术无法解决,而是因为技术对具体业务的理解出现偏差,导致整个架构出错。所以,成功的技术专家应该对结合的行业也有很深的洞察。
此外,我们也可以看到,Palantir的成长并不是爆发式的,在几年的时间里,它唯一的客户就是CIA。数据是要“养”的,数据量的积累需要时间,很多规律、关联也需要一段时期才能体现出来。所以,如果选择了这条赛道就要有足够的耐心,能“熬得住”,赚快钱的思路不适合这个行业。
我们的保险大数据正在刚刚起步的阶段,无论是数据量、分析技术还是对行业的认知都有很长的路要走,中间必然会遇到很多坑。希望Palantir的案例可以对大家有帮助,如果我们的用户朋友关于这个话题有更多的信息和想法,也非常欢迎和我们交流~
End