通用型和功能型的人工智能,哪个是趋势? | 科技特训营干货
科技特训营第二期 第一模块干货继续奉上:
讲师:王小川
搜狗 CEO
课程主题:《人工智能技术与应用思考》
以下为课程精华部分节选:
人工智能来了以后,民间都这么问:什么职业会被取代?特别是孩子的爸妈,问上学学这个学科有没有用?也有更加长远的,问机器把人类取代了,人类灭亡了怎么办?其实有点杞人忧天。
正经地讲,人工智能在今天爆发之前经历了三个阶段,现在是第三个阶段。
从 1960 年到 1980 年是第一个周期,那时候是专家系统,设法让计算机专家解决问题,把人的知识交给计算机,写程序,做一些判断,但最后的决策系统不成功。比如医疗领域,我们人很难找到办法,把自己对事物的理解变成某种知识教给机器,人的知识提取、描述不出来,所以机器失败了。
失败了之后我们能怎么办?就到第二个阶段,学习。
没有办法把知识教给机器,就给机器一些特征。比如看病,把体温、验血指标、头发颜色、发热是什么病等关键特征告诉机器,给机器更多病人样本,如果一些病人具有以下特征,就告诉机器一个最终答案,这个人可能得了肺结核或者其他什么病。
其实就是给他样本和最后的答案,样本中间由特征来描述。在这个阶段里,人发生了变化,把样本和知识特征交给机器,这是数据驱动的方式。这个方式取得了一定的成功,这叫特征成功,从专家走向特征的方法。
但这个方法还是不灵,问题在哪儿?
当我们描述这个特征的时候会变得非常困难。我们就拿图像识别举例子,在这 20 年里,我们有两类论文。第一种,找到不同的特征描述图片,发现新的计算特征使图像识别更加准确,可以发论文。第二种,基于不同的特征,研发识别算法也可以发论文。
在两个领域里,一个领域要去找特征,一个领域要研究算法,都可以提高生物识别图像率。但是整个效果非常有限,第一波跌下来了,第二波起来之后效果也不好,图像识别一定比人差。第二波人工智能也没有取得成功,研究人工智能的教授出去会说我是搞计算机的,不是搞人工智能的。
2000 年是一个大的时代,开始进入深度学习的时代。
这算是什么时代?源头是 2006 年一篇论文,大家从原来的算法走向了神经元的方法,之后的一个突破是百度的首席科学家。
一开始是找猫的系统,识别人脸和识别猫很难的一件事情。一千万张图片里,有的图片有猫,有的图片没有猫,大概用了1.2万个CPU计算核心,每张图片不是按照猫耳朵、鼻子图像提取特征,每个猫是200×200点阵,4万个初始的数据输入进去,给了一千万猫的照片,我们叫标注数据,有的照片上面写了这里面有猫,这里没有猫,再给计算机,告诉它这是答案,不断做训练,达到75%的准确度,这是深度学习的方法。今天看来准确度不高,但当时是突破性的进展,证明图像识别是有用的。
这跟前面的过程有什么区别?
第一,需要更多的数据,第二,需要更大的计算力。最大的好处把人解放了,最开始我们把知识交给机器失败了,到第三个阶段,我们放弃了人的经验,把数据交给机器,这就是今天跟原来的一个巨大区别。
这个区别很意义在哪儿呢?
比如做医疗系统,既需要工程师写代码,也需要工程师对医疗知识足够精通,这个很困难。写代码并不一定能传达知识理解,今天这样一个时代到来之后,以深度学习为核心,工程师们并不需要对专业知识理解了,可能只需要商务人员对这个事情有理解,然后把数据给工程师让他建模型。这个变化使得我们重新面对问题,组建公司的时候,可以分而治之,不需要找有行业经验的工程师。
机器最终的目标是什么?最后是创造生命,给机器一个目标,在地球表面活下去。这种情况,可以重演一次进化史。现在第三个阶段已经达到了,而且用的非常充分,只要原始数据非常规范,数据可解这是人工智能的阶段。2000 年到 2020 年,也许 20 年之后会走到第四个阶段。
这个话题很有意思,是通用型还是功能型的人工智能?
在人工智能有两大流派,我们到底做通用智能还是功能智能?通用智能能处理所有的问题,可以跟你对话,可以做图象处理,同时可以语音识别等。专用的人工智能,就是解决一个特定的问题,比如能够语音识别,这是一个专业的问题,图像识别是另个专业的问题。阿尔法狗就是功能型的人工智能,只能下围棋。
我个人判断,这个事情没有行业的定论。从我们的需求到我们的能力,现在我们只会做功能型的人工智能,通用的人工智能没有标性,还没有能力去做到。
其他讲师精彩内容
敬请期待
讲师:瞿昆教授
青年千人、生命科学学院、医学中心、
中科院天然免疫和慢性疾病重点实验室
中国科学技术大学
课程主题:《生物大数据和精准医疗》