【圆桌】认知智能领域会出现下一个商汤吗? | 甲子引力

从左至右依次为张一甲、俞扬、王兵、陆云波
整理:周湘豫、程丹

2019年11月9日至10日,科技智库「甲子光年」在北京举办了2019「甲子引力」大会。在11月9日下午的“数据智能”专场中,南京大学人工智能学院教授俞扬、猎户星空CSO王兵、奇弦智能创始人陆云波等嘉宾参与了“数据智能下一阶段:从感知到认知”主题圆桌。甲子光年创始人、CEO张一甲担任本场圆桌的主持人。

圆桌要点总结:

1.AI的突破方向可能在现有的认知边界之外,但是一定存在。
2.人类语言本身具有低效性,是低维向高维的映射,这也导致NLP技术试图让机器理解自然语言的尝试面临较大的瓶颈。
3.人工智能的未来方向是智能决策和智能支持。
4.深度学习与专家系统和知识图谱思路的结合可能是未来AI技术突破的方向。

圆桌实录如下:

主持人:
张一甲  甲子光年创始人、CEO
圆桌嘉宾:
陆云波 奇弦智能创始人
俞   扬 南京大学人工智能学院教授
王   兵 猎户星空CSO

张一甲:我刚才在那边的会场主持了一个圆桌,刚下来没过两分钟就被叫到这边的会场,有一种穿越的感觉。那个是“基础科学”论坛,跟北大的院长、老师、教授聊了聊基础科学,现在进入到业界,聊一聊当下最热的选题之一,数据智能。今天现场几位都是老朋友,大家用两分钟时间简单介绍一下自己。

南京大学人工智能学院教授俞扬

俞扬:我是来自南京大学人工智能学院的俞扬,主要的研究方向是决策智能。前面几位演讲嘉宾也提到了决策,但在我来看,更多是决策辅助和决策支持。我们说的决策,则是像打游戏这种场景下的决策,叫做自主决策。换句话说,原来需要人来做决断,现在完全由机器替代,这是我做的方向。

王兵:我是来自猎户星空的王兵,我们是一家服务机器人公司。行业里有非常多服务机器人公司,我们和其他公司的差别主要在于,我们是以完整AI技术链条为基础,软硬一体的综合性公司,用到的所有语音视觉识别、导航算法都是公司自主研发的,基本没有用别人的解决方案。

行业里也有很多提供算法的公司,但在服务机器人领域,对场景的要求特别高,有很多场景的环境比实验室恶劣得多。我们花了大量时间把软硬件整合,在服务机器人的应用场景里做了比较深的挖掘。

陆云波:我目前是同济大学的老师,自己做了一家公司,叫奇弦智能,三年半时间融了三轮资。呼应一下俞教授,他说智能要自主决策,要像打星际一样,我上大学本科时就打《星际争霸》、《红色警戒》,这些游戏让我想到:有没有可能企业也能像打游戏一样做经营决策?

前面说过数字孪生,美国军方一直有一个梦想,打一场战争时,把整个战场在计算机里重构出来,以替代原来的沙盘推演。

今天在某种程度上,一些实体行业,比如制造业、物流业,我们已经有相关案例,也已经把1.0版本做出来了。11月1日时,我们在同济校友科技博览会上也做了专场发布,奇弦智能希望把一个公司整体复制到计算机里,真正让智能帮老板做一些决策。

张一甲:陆教授公司11月1日在同济大学的发布会是我主持的,我亲眼目睹了发布会的过程,非常酷,让我印象深刻的是,他们完完全全把港口、物流这样的体系全息建模,然后在这个过程中支持决策,听起来好像陆教授和俞教授两个人的领域有相关性,王兵总坐在他们两个人中间有没有不舒服?

王兵:还好还好。

张一甲:对于服务机器人来讲可能不是很在乎感知还是认知,反正你都有是吗?

王兵:我们链条更长一些,从感知、认知、决策到执行,在服务机器人里都得有。

张一甲:我们两个人的立场是一样,我们俩都是需求方的立场。你是机器人的需求,我是普通人类的需求,我们一起看一看这两位誓要把AI推向认知智能领域的科学家怎么回答我的问题吧。

感知时代:自然语言的局限性

“真正解决认知问题,本质上是解决通用的人工智能。”

——猎户星空CSO王兵

“我们今天的目光聚集在那个地方,其实不一定是对的。未来的方向可能在我们的认知边界之外,在另一个地方,我相信它一定是存在的。”

——奇弦智能创始人陆云波

张一甲:最近确实有这样的说法,人工智能的下一个黄金十年在认知领域或者决策领域。那什么是感知?什么是认知?

在我的理解里,感知就是让机器看得见、听得见,数据从真实世界来到我的身体里,这是感知。认知是数据来到我的身体里之后,我怎样消化这个数据,看到一个物品要做什么样的反应、决策或行为?人类在这个世界上生存,是靠试错、学习、不断交互,不是只有感知,很大程度上需要认知,否则就跟植物没有太大区别。

人工智能在过去几年,出现一波AI“独角兽”,基本集中在感知领域。我的问题来了——AI下一个黄金十年,认知时代是不是到来了?还有认知领域是不是有可能出现下一个商汤?

俞扬:会不会出现下一个商汤,我不太好回答这个问题。

关于认知智能我是这样看的,我们可以把它看成两个不同的维度,一个维度是很宽,一个是很深

所谓很宽是我们在处理信息时需要有更多的知识和常识。比如说在做人机对话时,人经常会出现一些我们意料之外的词语,这些词语的出现,是机器难以处理的,这需要有很宽的知识。而很深就是在做决策时,要考虑很远的未来。我们想达到一个目标,比如希望有最优的营销方案、最好的风控,像这样的业务,我们现在做出的决策,对未来的影响是什么?这是我从两方面的维度想到的。

实际上这两个不同的维度,我知道有不少做知识图谱、自然语言处理、人机交互的企业正在做,但目前看起来没有像商汤这样做感知的公司那么大。我认为面临的问题很难,但对应的价值可能更多一些。

张一甲:知识图谱的公司看起来之所以长得没有商汤大,是不是因为上一波风潮找到了刚需场景?还是说感知更能解决问题?

俞扬:我的感觉是,在感知这个领域上面我们是可以用人工把数据全部标好,但是在知识图谱这样的领域里,要构建知识图谱所需的大量标注好的数据,开销极大,甚至是在构建常识图谱时,都不知道相关的知识从哪里来。所以即使拥有大量的人工标注的数据也没办法很好地完成,这是我们面临的一个很大不足。

张一甲:我们可以用语言来描述说,我看见一头大象,但是我们没有办法描述说,此时此刻我理解到了什么,很难形容出来,我们对自己的了解还如此之少。

俞扬:另外一个维度就是一个深度的维度。我们最近看到很多吸引眼球的人工智能新闻,其实都是关于深度的。机器在围棋、星际、DOTA这些游戏上,都能达到人类专家的水平,甚至完全碾压人类;但是我们看到,像DeepMind、OpenAI这么巨大估值的企业,面临的一个问题就是无法落地,不仅不挣钱,还烧钱特别快。

从这个角度看,技术好像进步得特别快,但当我们想用决策技术来创造价值时,却面临巨大困难,所以这也是我们正在突破的难题。

猎户星空CSO王兵

王兵:我们说的认知,包括自然语言理解。其实在内部我们有超过五千万的本体知识图谱,也有不同领域的知识图谱,但真正解决认知问题,本质上要解决通用的人工智能。为什么这么说?人类的智能,其实本质是对时间、空间以及时空序列的理解;对空间的理解,人和动物都有,把一只猫放出去,它能找回家,把一只鸽子放出去,它也会飞回来,对空间的理解是生命很久以前就建立的能力,这是我们说的对空间的直觉性理解能力;但是对时间的理解是人所独有,人类能产生复杂的记忆,而动物不能

张一甲:这个很有意思,你能给我们解释一下,为什么动物没有复杂的记忆,什么是复杂的记忆?

王兵:时间的本质是什么?时间的本质是变化,所以时间的本质是因果。因为有因果关系、逻辑关系,有变化的前后顺序,才有了时间,所以对这种现象的理解,本质就是对时间的理解。人有这样的能力,只有人类可以用一句话去描述未来,这就是语言带来的效果,这种能力其实很难得。

张一甲:说明人的时间感很大意义上是依赖于我们的语言,因为我们使用了一种线性的逻辑语言,我们再这么聊下去可能观众都听不太懂了。但是我确实很感兴趣的事情是,我非常同意您的观点,人类使用的语言某种意义上,是非常低效的,三体人是用脑电波交流的

王兵:对,他们是用脑电波交流的。由于物理的限制,我们发明了非常简练的语言, 所以为什么自然语言理解会非常困难, 因为它是一个从低维到高维映射的问题。我可能就说了五个字,但这五个字后面代表的信息量是极大的。但这个巨大的信息量要产生出来,取决于我们对物理世界的理解,取决于我们拥有的常识和所处的语境。比如我在今天的会议上说五个字,和我在家里说五个字,是完全不一样的意思,这就是为什么我们今天会认为,通用人工智能如此困难。

张一甲:我明白,今天上午我和搜狗的王小川聊这个事情,我和他的观点有点一致,就是说某种意义上,我们觉得NLP是一件很无奈的事情,我们非要把大自然这样一个立体的世界,用自然语言去描述,这几乎是不可能的事情。

同样一句话,我们的理解都不一样,只是一个投射,维度都不一样,那把时间都花在这样一件事情上,真的是一个长期的解决之道吗?还是说,我们干脆研究脑机接口?搞不好,脑机接口比自然语言还来得更快一点。我这只是破坏性提问啊(笑)。

王兵所以我们做服务机器人,本质必须要做到多模态的理解和记忆。只有这三五个字的话,我很难去揣测用户的意图。我要看他的表情,知道他是谁、他的历史和背景,包括当时是在怎样的一个环境,所有的这些信息加起来,才能对他的意图有一个相对准确的估计。我们所说的推销人员察言观色的能力也是这种能力,是建立在大量常识和场景化知识的基础上的。

张一甲:明白。刚刚陆总讲了,其实他已经在很多的场景找到了很好的案例,而且我亲眼见证了他的很多大客户对他的信任,不断在帮他背书。我想问一下俞教授,您刚才说这个事很难赚到钱,很难应用,那么你现在在做的事情有没有什么突破点呢?

俞扬:陆总那边在做的全息化,其实是和我们有一点类似的,我们是通过历史数据积累的场景,还原出在这个场景里的运作规律有了这个规律后,我们可以把现在所有用来打游戏的技术,全部用来解决业务场景里面临的问题,而且可以直接拿到业务场景里来用。

张一甲:陆总,您想做的事情和他有没有什么不同的地方?

陆云波:我觉得可能还是有一点共鸣的。针对前面的问题我稍微做一些补充,我觉得认知智能领域,一定会出现商汤这样的企业。我是来自经济管理学院,在企业管理这个维度上面,大家知道吗?SAP竟然是德国最大的上市公司,我们知道西门子、大众,但是其实SAP才是德国最大的上市公司,市值一千多亿美金。Oracle也是一千多亿美金,包括Salesforce也是一千多亿美金。

智能时代来了,对这个领域会带来什么变化?比如说,一个企业分成内部和外部,内部就是运营,外部就是市场。

就拿运营来看,人工智能会不会长出一个运营大脑?和现在大家说的单点智能是不一样的。这个智能的运营大脑有点接近美国军方说的作战大脑,未来一定是百亿美金、千亿美金的公司。 这条路是不是靠认知领域的突破,就能走出来呢?从个人角度来讲我很怀疑。

我呼应一下俞教授,该怎么去打这个游戏?

今天的人类,就像一群鸟群在飞舞,每一个人其实不一定看得清楚方向,我们跟着大家在走,我们过去看3D打印、智能硬件、O2O和共享经济,今天我们的目光还聚集在那个地方,这不一定是对的。

所以(未来的方向)可能在我们的认知边界之外,在另一个地方,我相信它一定是存在的。一甲也知道,我们在过去三年里,有一些合作的客户,而且取得了非常好的结果,可以说这条路初步得到了验证,它是有可能走通的。

转折点到来:认知智能

“深度学习本质用大数据来学习非线性映射的一种方法,可以解决几乎所有的直觉类的问题。”

——猎户星空CSO王兵

“我想在前面说的‘深度学习做得很好’前面加一个修饰语,在固定的数据集上面深度学习做得很好,但一旦拿到开放的业务场景下,我们经常发现没有办法在真实世界里做一些试错。”

——南京大学人工智能学院教授俞扬

张一甲:你现在和11月1日发布你产品时的状态完全不一样。你的项目做了3年,今年是第一次对外亮相,我想知道在认知智能这个领域,最近是存在了一个所谓的转折点吗?使得大家都愿意在这个时间点去谈论这件事。甚至包括刚才百分点也在这么说,他们也做了10年,但到今天这个时间点,大家都开始去谈知识图谱,谈认知。这个转折点是什么?还是说发生了一些什么事情导致了这样的一种变化?

俞杨:如果从我们做人工智能的历史来看,第二波人工智能的浪潮就是关于认知第一波浪潮实际上是在关注问题的求解,在做一些搜索、推理。

可以看到,现在很多机器学习模型并没有逻辑推理的能力。实际上,逻辑推理能力早在上世纪70年代就已做得比较好了,只不过和现在的模型没有结合在一起。第二阶段,我们发现第一个阶段里我们缺少知识,于是我们在第二阶段做了大量知识工程,把人类的知识总结出来放到机器里。

这样给了大家一个教训:对于开放的环境,如果事件搞不清楚的话,想靠写规则来解决,基本上不可能。

所以才会有第三阶段——机器学习阶段,也就是从数据里自动获取知识。

今天我们又发现,虽然现在可以从数据里面做出有用的模型,但是又和前两波发明的技术产生了断层,它没有办法和前面的技术融合。它能够感知、做物体识别的模型,但是没办法做逻辑推断,也没办法高效地利用其中的知识

这相当于是一个历史的轮回,又转回去了。所以我们今天又很关注知识图谱的建立。

张一甲:现在还想问问王总,当我们从用户的视角看,大家其实想问的是,机器能帮我干什么?在你做这件事情的过程中,这一两年有没有什么深刻的变化?比如服务机器人的某方面能力提升了,还是觉得服务机器人这条道路效果不好?我很想知道服务机器人在整个中国市场大概的规模和状态是什么样子的。

王兵:我觉得有几个点,刚才俞教授讲,最近几年主要是深度学习。深度学习的本质是用大数据来学习非线性映射的一种方法,几乎可以解决所有的直觉类问题。

比如说下围棋的本质是直觉,因为到最后你算不过来了,没法预测到50个亿级别的走法,脑容量没那么大。但是高手下过很多次围棋以后,就形成直觉,知道这个点可能是对的,做出这样的判断完全凭直觉。

其实这种直觉能力今天在非线性里已经学得非常好,因为在云端,算力非常大,存储量非常大。比如人脸识别,上一代机器人做不到,但是在今天已经学得非常好。

但是现在有一个很大的问题,深度学习本质是基于概率、基于大数据的,是在一个概率情况下得到最好的结果。回到以前,以前的专家系统,包括知识图谱,都是基于严格的规则。那么今天很大的问题,就是我们没有办法把两个系统有效地结合在一起。

想要真正研究人工智能的问题,我们就必须去研究人的记忆究竟是怎样形成的,我们得出了哪些信息,这个信息里哪些跟概率有关,哪些跟规则有关。

所以基于这个判断,我们在做服务机器人时核心追求的,不是做一个所有场景都能用的机器人,而是针对一个特定场景,把知识图谱、用户体验和整体基于规则的判断,包括一些直觉功能,在这个场景下集中起来做到最好,才能做到真正可用。

俞扬:我想在前面说的“深度学习做得很好”前面加一个修饰语,在固定的数据集上面深度学习做得很好,但一旦拿到开放的业务场景下,我们经常会发现,没有办法在真实世界里做一些试错。

王兵:所以说识别水平是特别依赖于数据的。为什么我们今天说数据的算法都需要定制?因为实验室的数据跟真实场景的数据差别非常大,真实场景有噪音、各种环境因素,做服务机器人需要把各个场景下的算法定制做好。

从左至右依次为张一甲、俞扬、王兵

张一甲:我们现在抛掉技术瓶颈的限制,去想一个问题,今天大家对服务机器人的需求到底有多大?

王兵:我觉得是非常大的。因为其实前几年就有很多服务机器人了,我认为那时普及不起来有几个原因:

一是成本太高。以前基本动不动就十几万、二十几万,而今天服务机器人可以把成本做得非常低,不超过一个手机的价格,成本下来了;

二是人口老龄化这个趋势不可改变。我们有太多的先进的医疗技术,五年之内,癌症也许可以通过基因的方法来救治,我们的生活条件好了以后,寿命延长、年轻人变少,年轻人不愿做重复劳动,这种趋势是不会改变的。

很多服务行业现在都招不到服务员,因为没有人愿意拿很低的工资去重复做一些服务机器人可以解决的事情。

张一甲:大家有没有统计过服务机器人最高频率用的功能是什么?

王兵:因为服务机器人有不同类型,很多场景是运输东西,像酒店里搬运小物品、送外卖,还包括在一些场景下提供信息服务等。

现在我们发现一个特别大的机会,我刚刚在演讲里讲到,就是帮助线下的零售企业去改进服务。推销员存在的价值什么?不是强买强卖,推销员真正存在的价值,一是找到用户需求,因为很多时候用户自己都不知道他想要什么;二是用户对商品的认知没有那么充足,这个时候他很难做决策,推销员的核心任务是帮助用户做决策,也就是个性化消费。服务机器人很容易做到这一点,它们能用很友好的态度主动发问,除此之外,采用大数据系统对用户行为进行分析,也非常高效。今天我们在手机端的消费,像“抖音”,就是个性化推荐的大数据平台,以后在线下的消费,我们也会用同样的方法去实现。

未来人机交互的新形态

“10年之内,很可能每个家庭都有一个家庭机器人。”

——猎户星空CSO王兵

“我相信一个企业也好,一个政府也好,一个组织也好,本质上是有规律的,所以本质上是可以计算的。”

——奇弦智能创始人陆云波

张一甲:我想让三位互相问一个问题。

俞扬:我想问王总的服务机器人,因为我也对这个很感兴趣。这个场景,现在非常难处理的是开放环境,没有可以用来定义环境的东西,如何能把环境收缩到一个可以确定的场景下提供服务?

王兵:这也是我们面临的最大问题,其实我们每天花很多时间研究场景,哪个场景下最先落地?哪个场景下需要什么功能?哪个场景还需要时间?

核心要点第一个是行业,先确定哪个大行业;第二是这个行业下的哪个场景或者哪个功能,能够帮企业去降低成本?总体的核心就是找到这两个点。

比如说商场零售的场景,推销员这个角色其实是现在企业特别需要的,但如果真培养出来一个顶级销售,可能转头就被别人挖走了。

甲子光年创始人、CEO张一甲

张一甲:请问一下现场观众,假如去零售店铺看到服务机器人跟你推销产品,会愿意在他身边停留很长时间吗?会在他身边停留的举手,会停留超过三个回合的举手,会停留超过五个回合的举手,会和机器人聊天以达到你的目的的举手。

(一位观众持续举手)为什么这位先生您对服务机器人那么有执念呢?。

观众:我想找BUG。

张一甲:样本调查永远都是有偏差的。我再问一个关于服务机器人的问题,因为之前有一个朋友也是做服务机器人的创业,他问我说,国内到底没有服务机器人单品销售超过1万台?

王兵:我们今年大概达到了这个目标。

张一甲:具体哪一款?

王兵:商场垂直场景机器人豹花瓶大几千台,还有几十个不同场景都有,今年加起来应该超过1万台。

张一甲:为什么他们愿意付费呢?谁愿意付费?

王兵:比如博物馆,培养一个很好的讲解员非常困难。

张一甲:可是我去博物馆不愿意听机器人给我讲解。

王兵:不知道我们的机器人你有没有体验过?核心是这样,它能够带你走,和真实的讲解员是一样的,还能路途中陪伴你,对整个讲解,它提供的背景信息足够丰富。核心是:是不是真的能替代,能不能做得足够好,还有成本是否有优势。

张一甲:比如说你认为20年后,我们世界的服务机器人应该是什么样的?我三年前跟(达闼科技创始人兼CEO)黄晓庆聊天,他认为10年之后每个人身边都应该跟着一个机器佣人,机器佣人帮你解决各种问题。你认为10年之后服务机器人的状态是什么样的?

王兵:我觉得不用10年,10年之内,很可能每个家庭都有一个家庭机器人,不一定跟人长得像,但可以解决大部分问题,你所有需要的问答。

比如说帮你做一些简单的清理工作,进行老年人监护,提醒老人吃药,提醒小朋友做作业,包括监测小朋友是做作业还是玩手机这类的,我们的最终目的是让大家享受到贵族生活。贵族生活的话,第一件事是有管家,我们的家庭服务机器人替代了管家。

张一甲:不是每个人都享受贵族生活,会觉得不自由,一直有人盯着。

王兵:你随时可以让他走。

张一甲:科技分两种,一种是服务机器人,小朋友都可以脑补想象的;另一种是俞扬和陆云波在做的。你们怎么判断自己对于未来的设想是对的?怎么相信每个人身后跟着一个机器人是对的?另外一个人说,不是啊,智能应该是分布式的,你怎么相信现在的你所定义的路线是应该存在的?在我看来,NLP都不用做,可以直接用脑机接口。

俞扬:如果我们有一个完整的逻辑能够讲清楚这件事情,如果这是所有人都能看到的未来,那这可能不是真的方向,因为有时真理掌握在少数人手中,重要的是,我自己相信它是未来,并动手创造出这种未来。

张一甲:还是回到今天上午那一句话,关键不是你的所见,而是你的目光,创业还是主观的事情。不知道你们两位如何看待这个事情?你如何相信你所相信的事情是正确的?

陆云波:第一个方面还是比较客观一点,呼应一下一甲上午所说的,今天这个时代越来越复杂了,大家看看周边,尤其是企业的决策者们,看看每天面对的问题,包括公共安全和我们的国家,真的越来越复杂了。再这样发展下去,如果没有相应的手段科技赋能的话,社会就要走向一种失控,虽然《失控》这本书描绘的是美好的未来,但也有可能出现不好的结果,这就需要技术和科技来解决这个问题。

另外一点是主观,每个创业者某种程度上相信着自己心中的力量。今天移动互联网科技的发展,让整个社会变得越来越量子化,原来只有大人物才能改变这个世界,现在一个小人物,一个娱乐事件,一场蝴蝶效应,就有可能改变很多事情。

所以明天是什么?未来是什么?某种程度上就是量子的叠加态。创业者就是穿越时间和空间,看到那个点并把资本、产业和消费者等所有人的目光聚焦在那一点的人。当你真正做到把所有人的注意力聚集在那个点的时候,那个点就会真正出现,这是主观的力量。

但主观还是没有办法对抗客观。要在物理和社会规律下,去相信“相信”,你才能拥抱未来。

王兵:我觉得长远来讲,世界肯定变得越来越复杂,而且越来越不可预测。但长期的大趋势是可以判断的,那就是人工智能必将很大程度上改变我们的生活,就像2000年时的移动互联网改变我们的生活那样。当时大家对互联网非常悲观,很多公司倒闭,但今天来看,互联网取得的成就比当时最乐观的预计还要大,我觉得人工智能也是类似的情况。

张一甲:三位都认为未来其实是不可预测的,我们没有办法严丝合缝地论证某个人是对的,某种意义上你们认为服务机器人的存在也好,这个世界的智能应该以什么样的面貌存在在我们的身边也好,都是我们的相信。但就像那句话所说的,最好预测未来的方式,就是把它变成我心中想要的样子,而不是去等待。因为未来并不是一成不变的待在那里,今天我们讲的每一个事情都是未来该有的样子。

最后请每一个人一句话给我们做一个总结。大家都来看数据智能,数据智能这个词从2015年到今天,大大小小的论坛我主持了不下50场,有没有什么新鲜的东西?想请各位用一句话来概括未来数据智能该关注什么,请说一个最具体的事情。

俞扬:我最关注的就是决策,决策就是在创造未来。

王兵:今天的数据质量决定了智能程度,所以我觉得用服务机器人获得高质量的数据是非常重要的事情。

陆云波:我相信一个企业也好,一个政府也好,一个组织也好,本质上是有规律的,所以本质上是可以计算的。我们的使命就是让组织变得可以计算,谢谢。

END.

(0)

相关推荐