对话Neo4j亚太区副总裁:用数据的关系理解世界
如果你看过侦探电影,肯定熟悉一个情节,警察对着一块白板,白板上面罗列了嫌疑人、受害者、证据等一张张图,图被纵横交错的圈圈和箭头连起来,每条线,都会是一个线索;每个线索,又能牵扯出一片关系网。若是用技术的语言来表达,这就是物理世界「图数据库」的概念。
而在数字世界,类似新冠病毒的追踪、网上订票系统的成熟、网购搜索的精确、线上转账的安全等等,也会涉及「图数据库」技术。而说到这套技术,就不得不提一家公司——Neo4j。
2000年的某天,瑞典人Emil Eifrem坐飞机飞往孟买,当他正在为解决数据系统的性能问题发愁时,突然灵感乍现,随手抓起一张餐巾纸,迅速勾勒出一个图数据库模型。当时的Emil Eifrem或许并不会想到,那张餐巾草图会是一家公司的开端。
2007年,怀揣「图数据库」理想的Neo4j公司正式在瑞典成立了。十几年之后,Neo4j公司已经成为全球领先的图数据库平台,服务全球400多家企业客户(包括空客、康卡斯特、eBay、美国宇航局、瑞银、沃尔玛等),坐拥数百万社区用户。
Neo4j亚太区副总裁Nik Vora在给科技行者讲述这段故事时,笃定且自信。即便在公司创立之初,市场还是「关系型数据库」大行其道,Neo4j公司仍然坚守「图数据库」赛道,因为——“关系型数据库没有关系,它纯粹就是数据;图数据库存的不是图,它存的是关系。”
一言以蔽之,现实世界的一切事物,都处在关系之中,如人际关系、电脑网络、地理数据、分子结构模型等。这种互相关联,形成了一种互相关联的数据,联系就是数据的本质所在。传统的「关系型数据库」,其实并不能很好地表现数据的联系;而隶属于NoSQL(Not Only SQL,非关系型数据库)范畴的「图数据库」,是以图的结构形式来存储数据,它所存储的就是联系的数据,是关联数据本身。
Neo4j官网就有一句话恰当地概括图数据库的价值——“We Help the World Make Sense of Data(我们帮助世界理解数据)。”换言之,Neo4j在用数据的关系帮我们理解世界,因为图数据库模型更接近于真实世界的运行规则,这就是为什么Nik Vora说:“图数据库的美妙之处在于,它基本上适合于每一个行业。”
比如,Neo4j可以帮助发现和解开巴拿马和天堂论文网络;也帮助 NASA 对其著名的“经验教训”数据库进行了现代化改造, 并推进了火星任务;被沃尔玛用于在线推荐;还被德国糖尿病研究中心 (DZD) 用于帮助糖尿病患者,并致力于消除这种疾病。此外在Neo4j 社区,也一直在用图数据库技术解决一些社会紧迫问题:比如气候变化、癌症治疗、加速人类的火星之旅、推进性别平等、提高政府透明度、以及推动人类知识的边界等。
而Nik Vora本人,驻扎图数据库领域10余年。谈到这些经历,Nik Vora直言,就像图数据基于关系一样,自己所有的成功也是基于关系。人与人之间的关系联动,就是带来职业成功的关键之一,这不仅体现在于公司内部的员工扩张,也体现在客户和合作伙伴的市场扩张。实际上,持久互信的商业关系,也是职业与业务可持续发展的关键。
以下是科技行者访谈Neo4j亚太区副总裁Nik Vora的实录(经整理):
【谈图数据库技术】
“关系型数据库没有关系,图数据库存的是关系”
科技行者:Neo4j成立于2000年,公司成立之初,整个市场环境是怎么样的?
Nik Vora:2000年的时候,Neo4j创始人萌生了一个(做图数据库的)想法,并成立了公司,但想法只停留在理论阶段,而真正把想法付诸于实施、变成商业化落地的产品是在2007年。当时,我们的创始人在飞机上,提出了具体的想法,并且和伙伴们把它付诸实施。
2007年,面临的第一个挑战就是,怎么把它做一个技术的归类和分类。因为在那个时候,刚开始在美国和欧洲市场,基本上很多客户无论是大学里面学的、还是现实用的都是「关系型数据库」,他们很疑惑为什么这么一个小公司过来给我讲「图数据库」,它到底是做什么用的?这是当时最大一个挑战,在于普及。
Neo4j创始人和初创团队都是开发者,所以我们刚开始的产品版本,是OpenSource(开源)的方式,通过发展社区,社区的开发者们都可以对这个OpenSource做贡献,让大家更多地去了解什么是图数据库。现在在亚洲,可以看到很多开源社区的贡献者。
科技行者:既然当时市场的主流是「关系型数据库」,那为什么Neo4j会看好「图数据库领域」呢?
Nik Vora:当初的市场环境主要是关系型数据库,但随着互联网尤其是移动互联网的发展,大量数据涌现,关系型数据库已满足不了客户的需求。Neo4j看到市场的这种需求,并投身到图数据库这个领域。
在传统的关系型数据库里,要找到一个人,需要找数据之间的关系,可能要花费几天的时间去做关联。但是在图数据库里,发现可以做到毫秒级,相对于传统的关系型数据库,它的作用在于——发现数据之间的关系。
所以说,关系型数据库没有关系,它纯粹就是数据;图数据库存的不是图,它存的是关系。
科技行者:目前看来,图数据库主要用在哪些行业,可否描述一下具体的应用场景?
Nik Vora:图数据库基本上适合于每一个行业。回看过去一两年,中国变成了这一行业里的开路先锋,在图数据库的推广方面,很多中国的客户都在试用。
当然了,一些行业的普及程度会比另外一些行业高,比如执法部门。譬如,A认识B,通过图数据库,如果A是一个嫌疑人,而A与B之间已经有认识关系的话,那B也很有可能变成一个嫌疑人。通常,执法机关在处理移民工作中,大量地使用了人和人之间的关系。
还有诸如航空公司、运输公司(比如滴滴出行),都广泛的应用图数据库:分析一个乘客从A处到B处,一些航空公司都是用数据库表现出来,非常方便;还有银行里面欺诈检测和反洗钱这些场景也非常适合,尤其今天我们看到反欺诈呈一个上升趋势,欺诈者变得越来越聪明,银行再用传统的方式很难发现他,而通过图数据技术,可以把人和人之间的关系,把逻辑事件指出来,很容易就发现新型的欺诈关系;另外在保险行业,图数据库也非常流行,因为保险的欺诈也很多。
图数据库在制造业也有广泛的应用。比如汽车制造业,一辆汽车有很多的零件,一个零件坏了之后,它会影响上下游的关系,比如一个小零件坏了,可能影响到发动机的最大功率,通过图数据库,很容易把所有零部件之间的各种关系串起来。
智能手机行业也同理。手机零部件,如果用图数据库把它关联起来,很容易发现中间极小的问题,甚至产生蝴蝶效应,一个小螺丝钉坏了有可能会影响到显示屏幕,此前没有图数据库,是很难去发现这些问题的。
其他包括医疗等很多重要行业在内的千行百业,都在使用图数据库。
【谈市场竞争】
“说明我们当时做了一件对的事情”
科技行者:在图数据库领域,有很多巨头和玩家先后进入,相比之下,Neo4j的核心优势是什么?
Nik Vora:首先我们很高兴看到市场上面有很多的竞争对手出来,这说明我们当时做了一件对的事情。
Neo4j的核心优势有三方面:
开源。让更多人可以使用。
第二,图数据科学。让客户数据科学的投资最大化。目前在图数据科学方面,Neo4j已经积累了60多种不同的算法,可以帮助用户获得最大程度的投资回报。
第三,更快、更稳定、扩展性更好。机器会产生很多数据,而Neo4j支持1.2万亿个节点,且在毫秒级别返回结果,是第一家可以做到这个级别的公司。比如国内最大的某个制造厂商,在扩展性、速度方面,只有Neo4j可以满足它的需求。
科技行者:这些数据的隐私安全方面怎么保障呢?
Nik Vora:数据的合规、安全、隐私是一个非常重要的话题,Neo4j也充分地考虑到这一点。
除了开源版,Neo4j还有企业版,有非常重要的一些安全特性,可以帮助企业保护隐私和数据安全。比如基于角色实现安全控制,什么样的人可以访问哪些数据,什么样的人只能读取但不可以修改数据等等。还有通过加密保护保存在数据中心的一些数据。
科技行者:Neo4j的客户也很强势,比如NASA、沃尔沃、瑞银等等,可否举例描述一下,这些客户找到你们,主要的诉求是什么?
Nik Vora:我们很荣幸有这些客户。以NASA为例,NASA有数以千计的数据中心,NASA的科学家或工程师之前找数据非常困难,因为有太多的文档,查找极其耗时。NASA登陆火星项目应用了Neo4j,创建了知识图谱,把上亿信息关联起来,方便工程师,将项目缩短了两年的时间,能提前完成项目并节省成本。
中国很多公司也在投入和学习知识图谱。在中国很多大型机构,知识图谱都是非常流行的一个应用,大家投入很多的精力去学习,甚至已经开始研究知识图谱如何帮助企业。Neo4j在中国已经积累了很多客户,包括来自电信、银行、金融、制造行业的领先公司。
【谈国际化与融资】
“中国创新势头更强劲”
科技行者:相比之下,在图数据库领域,中国市场和国外市场存在哪些异同之处?
Nik Vora:在应用上差不多。市场方面,中国有几处不同:1)中国创新势头强劲;2)互联网的应用更广泛,规模更大,特别是移动互联网;3)云。中国70%应用在云上。
科技行者:您工作过的几个国家很有特色,比如新加坡、悉尼、孟买和上海,中国在工作环境上,与它们有何区别?
Nik Vora:如果中国客户喜欢你的产品,会很快采用。而且中国客户注重产品的本地化,满足本地化需求。
科技行者:6月份,Neo4j刚刚拿到3.25亿美元F轮融资,你们吸引投资人的秘诀是什么?
Nik Vora:投资者对我们都是长期投资。我们把投资者视为合作伙伴。
我们吸引投资人之处主要在于:1)我们是市场上排名第一的厂商; 2) 我们拥有成千上万的开发者社区;3)我们和投资人有着共同的价值观和愿景。
公司最新一轮的3.25亿美金的融资,不仅仅是在图数据库领域,实际上在所有数据库历史记录里,这都是最大的一笔融资。
科技行者:Neo4j将如何消化这笔融资?
Nik Vora:1) 加速市场扩张,比如中国和其他市场;2)继续投资图数据库和数据科学;3)持续成为处理万亿节点的市场领导者。