【视频】《猿来“探”名企》之阿里小Ai之父闵万里:大数据创新业务实践
阿里云小Ai之父——博士:“智能在端,智慧在云”;所有大数据服务都是为了满足人的需求,人是一切数据的总和;大数据可以应用于电商行业、企业服务、影视娱乐、交通物流、GAS服务、三维建模等行业
来源:数据猿 记者:春夏
《猿来“探”名企》之走进阿里巴巴
上期《猿来“探”名企》之走进阿里巴巴栏目中,我们分享了阿里云四位(闵万里、张洪伦、于军、邓彬)专家的精彩内容,得到了大家的广泛关注与支持。为此,我们数据猿又为大家分别整理了四位专家分享的详细内容。
今天,我们就为大家首先放送阿里云人工智能首席科学家、小Ai之父——山景(闵万里)博士的精彩内容《大数据创新业务实践》。
山景博士14岁被中科大少年班录取。19岁毕业后赴美攻读物理学硕士。2004年获得芝加哥大学统计学博士学位。先后在IBM Watson研究院及 Google 担任研究员,2013年加入阿里巴巴,领导阿里云人工智能项目小Ai。
山景博士52分钟完整分享视频
以下为山景博士分享的内容要点:
本文由“135编辑器”提供技术支持
智能在端,智慧在云
首先我要解释八个字:“智能在端,智慧在云”。智能是在端产生,而端上出来云的结果就是智慧。当所有数据汇集在云,智慧的交流、数据融合便没有了成本,没有成本的事物价值会产生“核聚变”式爆发,就会产生智慧。
现在很多号称是人工智能的产品并不是真正的智能。大家可能听说有智能家电、智能家居,比如扫地机器人,把芯片放进去,就可以沿着路线走路。他们只是简单的机器,毫无智能。我认为最接近人工智能的项目是无人驾驶,其具备人的所有功能:认知、视觉、听觉以及实时判断。
所以我着重强调“智能在端,智慧在云”,希望告诉大家什么是真正的智能,这也是我这几年在淘宝、阿里云工作的深刻感受,我们团队要做有智慧的产品,并且只做别人无法完成的事情,以凸显差异化竞争的价值。
人是一切数据的总和
从几千年的农耕社会到现在的信息时代,技术发生了很大的变革。首先是工业革命,然后有了半导体、芯片,接着出现了互联网。当基础设施硬件越来越强大的时候,硬件传递的数据就变得不可忽视了,因此,2004年开始,“大数据”这个词逐渐进入人们的视野。目前,大数据金字塔还远远没有到达顶部,我相信在未来很长一段时间内,大数据会换着各种外衣来冲击我们的视听和认知。
随着数据的产生,大数据逐渐被应用,90年代就有数据处理了,当时有windows95。下面我举几个历史上大数据应用的重大案例。
扎克伯格可以去白宫与奥巴马讨论政治话题,是因为其创办的Facebook掌握了巨大数据,所以他知道现在的年轻人和选民关注什么,不满什么,因此,即使他没有受过任何政治训练,他依然可以成为政治家。
奥巴马也是靠大数据走上总统位置的,这也是大数据应用最经典的案例。2008年,奥巴马聘请埃森哲总监查看Facebook、Twitter的民意测验数据,测算出加州地区哪些选民还在犹豫,然后雇人上门游说,借此登上了总统宝座,这是大数据改变政治版图的案例。
大数据还可以完成政权交换。2011年阿拉伯、突尼斯、利比亚、埃及就是利用大数据精准锁定对社会和总统不满的人群,让其在Facebook宣传刺激性话题,不费一兵一卒便完成了政权交易。
这些事情的发生是因为大数据精准捕捉到了人内心的需求,然后为人提供服务。归根结底,我们所做的所有大数据服务都是为了满足人的需求,可以说,人是一切数据的总和。下面我们来看大数据是如何为人们的日常生活服务的。
大数据的创新实践
电商行业
以淘宝为例,其购物首页黄金位置的板块可以产生很大销量。因此,把淘宝10亿商品中的哪类商品放到黄金位置可以产生最大价值就成为一个问题。以前我们会让运营人员凭经验判断,而现在可以利用大数据做出选择。
通过消费者的年龄、性别、职业、居住地、购物偏好等标签,我们用模型计算出每个消费者看到一件黄金位置的物品时购买的概率,进而求出3亿用户购买的总概率,从而预测出此物品的销售额。
每预测一件商品的销售额都要计算3亿人的购买概率,要对10亿件商品的销售额做出排序,加起来就是10亿×3亿的量级,我们的系统十几分钟就可以全部算完,从而选择出哪些商品放到黄金位置可以产生最高销量。
企业服务
阿里云可以通过企业公开的信息,利用爬虫技术深度挖掘企业与企业的关系以及企业与个人的关系,进而构建企业全息画像,包括企业背景、舆情、产品、投资状况等行业动态,从而应用到风险洞察、品牌营销、产品预测以及潜客挖掘服务中。
首先举个例子,中国的地王是谁?可能大家都会想到万科。但我们通过数据挖掘发现其背后有中国五矿集团、中国石化集团、中国华能集团等一度关系,如果再扒二度关系,想象空间会无限延伸。
数据挖掘可以洞察企业风险。以杭州绿城集团为例,我们通过数据挖掘发现全息画像图出现黄标以提示情况异常,原因是与绿城集团合作的公司最近出现诉讼事件,并被济南建筑劳务市场清除,而他与绿城集团又有合作关系,因此被我们的系统发现有舆论风险,并计算出其风险总分为0.577分。
用途在哪里?大家可以设想,如果放贷银行想要了解申请贷款公司的状况,就可以基于全息画像图评估与其关联的上下游风险。申请贷款的公司不会主动告诉银行其合作伙伴有问题,但数据可以告诉银行具体的实际情况,还可以挖出源头,而且每天都会更新。
除了能够洞察企业的财务风险、司法风险、股权风险以外,还可以监控品牌营销。以支付宝为例,我们会监测他的口碑传播,所有关于支付宝的黑文、软文等宣传资料,系统都会进行实时抓拍。
产品预测也很简单,比如我们要推出下一代云OS操作系统,就可以通过系统引擎做舆情分析,预测消费者需要哪项功能以及不需要哪项功能,从而调整、优化产品。
另外,系统还可以用于潜客挖掘。比如,对于谷歌公司来说,若在服务引擎中输入对手“微软”,就可以找出与微软合作的所有客户,然后定向挖角。而且还能知道自己的哪些客户正在与微软合作,处于高流失风险状态,进而采取补救措施。需要说明的是,这种业务往来是公开可查的信息,不是商业机密或内幕信息。
影视娱乐
今年《我是歌手》总决赛中,我们的小Ai在决赛现场全程预测了歌王的诞生,他在尝试用非常理性的公式模拟理解感性的过程。通过歌手的演唱预测听众反应是非常复杂的逻辑关系,歌曲是否唱的好要取决于歌曲本身,也取决于歌手的现场发挥和听众的审美情趣,这是文化不可预测的,然而当我们数据足够丰富时便可以预测,接下来看大数据如何在影视领域发挥价值的。
一,评估艺人商业价值。大数据系统可以通过粉丝成长指数、票房号召力指数、口碑指数等数据评估艺人知名度以及商业价值,从而帮助影视公司挑选合适的角色。我们的评估系统有真实的数据作为依据,并且已经应用到了阿里影业和阿里音乐业务当中。
二,影视投资风险控制。大数据可以从剧本题材、创作班底、竞争对手等维度预测电视剧、电影、IP系列作品的投资回报率。以IP作品为例,对于投资人来说,除了容易被抢走的知名IP作品以外,高性价比的黑马作品也是其投资目标之一。这时就可以通过在线模型计算出每件作品会火的概率,从而找出容易火的黑马作品。
交通物流
大数据还可以用于交通领域:我们用小Ai预测浙江省1300公里高速公路的交通路况,同时,我们选了国庆节假日最繁忙的时刻挑战自己,每5分钟更新一次未来60分钟的路况,预测准确率达到91%。
以前有人想在新加坡、巴西做这件事,但因为计算量太大可能导致结果不准确,所以他们没有如此大范围的做。而我们依托于阿里的平台能力以及大数据能力,就能在非常大数量范围内达到高准确率。
通过预测交通路况,可以降低物流体系中同城货运的成本。服务核心是通过信息透明化提升决策正确率,从而让货车司机接顺风单、接力单和回程单。以前货车司机使用百度地图、谷歌地图,看到的只是实时路况,不知道未经过的路况,所以不敢在途中多接单以免运货迟到。
但现在通过大数据对未来路况的预测,就能决定在哪段路中可以接顺风单,不仅可以为货车司机增加收入,为平台节省人力成本,也能够为消费者带来更加快捷的服务。
相对于送货来说,送外卖的时间窗口要求显得更加严格,因为大家吃饭时间都集中在11:30——13:00或者18:00——20:00。而送餐小哥人数有限,只骑电动车最多能够同时送5单,所以运力也极其有限,如果调配不合理,可能就会迟到两个小时。
为此,我们制作了一套解决方案,并且在内外部都已经用过:在上海点餐的时间可以压缩在45分钟之内。因为我们对未来的路况掌握最精确,可以使用实时计算做全局优化,从而为顾客带来更快捷的送餐服务。以前大家可能花80分钟都等不到外卖,现在花35分钟就可以等到。
大数据预测路况还可以用于电商生态中。比如,双11时淘宝销量爆仓,大数据预测到义乌到南京方向的路线严重滞后,这时我们就会把预测结果告诉物流公司,让其提前调拨运力,以保证客户双11购物后的收获体验。同时,大数据预测还可以使电商库存降低22%,通过用户在淘宝、天猫的购物行为数据实时计算出每个仓库的销量,从而降低库存。
GAS服务
我们发现传统领域有一个刚需:很多企业对空间位置的信息分布很敏感,而我们的GAS服务便可以为其解决问题。
以一手房营销为例,售房人员若想找到行销拓客的地点就要提前找到潜在购房客户。因为我们有淘宝APP和高德APP,基于以上数据中消费者的标签画像以及人力密度就可以知道哪些人有购房意愿。
比如一个用户经常购买4—5岁孩子的玩具,可能是因为他有学龄前儿童,那么就会有购买学区房的意愿;另外一个用户以前购物地址在南京,但是后来却成了杭州,可能因为他换了工作地址,也需要买房。这些蛛丝马迹就构成了用户的购房意愿,如果这些用户经常跑到银泰城去,售房人员就可以去银泰城做宣传。
GAS服务还可以用于门店选址,通过绩效考核、网格化分布等数据确定选址方案,其核心在于找到区域当中供给和需求之间的定量关系。
以我们为西湖电子的电动车充电桩选址为例,西湖电子有1500辆电动车,电动车充完电跑的历程数有限,如果充电桩设置不合理,就需要跑到很远的地方去充电,所以选址很重要。我们通过数据分析示意图中红点显示的需求密度,确定充电桩的选址。另外,由于示意图不仅会显示当下充电的需求,还会显示未来购买电动车的人群画像,所以我们在解决当下充电需求的同时,还能够预测未来上涨的需求。
三维建模
基于阿里云架构,我们还会将其用于三维建模服务。在消防、楼宇、楼堂馆所、大坝等重要基础设施的结构测量中,三维建模服务是刚需。以前会在房间内部放摄像头,通过录像进行三维重建,现在可以用激光扫描进行透视,然后针对波长反射情况重建三维立体模型,但其上传电脑P图时会占用很多内存,计算量很大。因此,我们用阿里云架构构建了一套服务,可以将任何上传的数据进行三维渲染,解决三维建模问题。
阿里云的商业模式很简单,我们要做行业中的领跑者,赋能给我们的伙伴客户,并通过伙伴服务更多的终端用户。我们要把火点起来,但星火燎原,要靠大家。
注:本文由数据猿记者春夏(微信:1101862984)整理发布。
来源:数据猿