人工智能之旅,真的特别费人工!
公众号后台回复:管理1905,免费下载本月推荐精品管理类图书
公众号后台回复:人文历史1905,免费下载本月推荐精品人文历史类图书
加入“ICT销售和大客户联盟”(微信ID:ICT-League),寻找志同道合的小伙伴!
您的关注就是我们最大的动力,这里有大量企业家高净值粉丝,每天分享最新商业资讯、趋势、深度好文、把握财经动态。喜欢学习和阅读的朋友请关注我,文章每天都会更新,欢迎转发阅读!
白笺黑字,道不尽人工智能,飞龙在云鱼在水,此情梦想难寄!旭日独倚东楼,鸿雁巧上帘环,太公不知何处,直钩依旧沉浮。
人工智能在未来社会中将会继续开发,成功地将人工智能付诸行动并不是商业的一次尝试,商业需要对它进行根本性的反思。
(图片来源于互联网)
01
图灵测试(Turing Test)
横亘在人工智能面前的壁垒
图灵测试示意图(图片来自网络)
1950年,英国数学家艾伦.麦席.图灵提出的关于区分人工智能的一个测试,测试中要求一个“人”和一台拥有“智能的机器设备”在互不相知的情况下,进行随机的提问交流。如果超过三成的测试者没有发现对方是机器设备,那就代表了这台设备拥有“人类智能”。
图灵当时预测人工智能通过“图灵测试”的时间是2000年左右。
看来这是一个失败的预测,图灵先生太乐观了。
70年过去了,一个伟人曾经说过:“三十八年过去,弹指一挥间!”,这都弹了两下响指了,还是不能挥去这个幽灵般存在的壁垒。
七十年,好多人都被灭霸的响指弹的灰飞烟灭了,可这个壁垒依旧存在!
历经七十年,人工智能在深度学习、大数据分析、混沌模拟、模糊识别、神经网络等方面已经取得了长足的进步,而且,似乎每隔几年,就会冒出一则“大新闻”:“某某计算机又完全通过了图灵测试”!
但是,但是,但是却依然没有“任何一个”,此处要敲黑板了,注意,是没有任何一个人工智能真正地通过图灵测试!全球的科学家们,依然徘徊在图灵测试的壁垒之前,举步维艰。
(图片来源于互联网)
02
人工智能三阶段
伴随思维的提升而提升
一直以为,人工智能离我有点儿距离,光听听这个高大上的名字已经把我吓尿了。经历了若干年的研发产品和实际项目之后,却发现其实我早在1985年就已经开始了这段旅程,原来他一直就在我身边,一直在陪伴着我,只是,他太狡猾了,每隔几年换一个名字!而我,一直到这几年才搞清楚,他原来一直就有个大名“人工智能”。
自动化旅程,我的第一段人工智能之旅始于1985年,那一年,我用乔帮主的Apple II写下了第一段人工智能代码。
很简单,就是if......,goto......;的集合,通过这些代码,控制了机械操作的各种行为和动作。真的是好痛苦的,我要针对所有的可能性都加一个“if”和“goto”或者“then”,去做要执行的事情。那个时候“人工智能”的名字叫做“自动化”或者“自动化控制”。工作量特别大,其实更主要的是特别费脑,是靠人脑来遍历和穷尽各种可能性,并为每种可能性写出要执行的操作。
这段旅程现在看来很简单,但它却让不少的操作工失去了饭碗,效率得到了大幅度的提高。罪过啊!
原来我一天只能完成2次正交实验,变成了一天可以做12次,这是6倍的效率提高。
显然,这种人工智能的智慧是永远不可能超过人类,不,是不可能超过我的智力的。它所有的知识都是我赋予给它的,而它只能简单机械的去执行,它根本就没有灵活性,我有多傻它就有多傻!一旦遇到我没有考虑到的,它就不知所措,黑底绿字的屏幕就会一闪一闪亮晶晶的看着我。
遍历旅程,进入21世纪,计算机的计算速度一秒可以算几百万次甚至更快,这对人工智能来说是一个福音啊。我总算可以编写一个程序,然后,让程序去把所有的可能性都去尝试一遍,并将尝试结果依次展现出来。这个时候的代表作就是IBM的“深蓝”,他打败了人类国际象棋的第一高手。当时,很多不负责任的编辑就开始猜测“深蓝”何时能主宰人类了。但事实是,这种遍历算法虽能穷尽所有可能性,但是如果需要遍历的可能性太多,就算是超级计算机无能为力。所以,那个时候的“深蓝”无法战胜围棋选手。看似只有19*19个交叉点的围棋,其变幻是无穷的。真的计算一下的话,假设我们一秒钟数过一种棋形变幻,要把全部的棋形数完,大约要数亿年的时间。即使是计算机也不可能很短时间内去尝试每种可能性。
遍历旅程中的人工智能虽强大,却无法应用在遍历可能性过多的领域里,所以通用性不强。因而也就没有太多的用武之地!
神经网络阶段,伟大的摩尔定律驱使着芯片的快速发展,这次总算吧我们带到了第三段旅程了。20世界40年代被提出的神经网络算法使得人工智能趋于完美。
与数字计算机比较,人工神经网络在构成原理和功能特点等方面更加接近人脑,它不是按给定的程序一步一步地执行运算,而是能够自身适应环境、总结规律、完成某种运算、识别或过程控制。人们只需要预先给出大量的数据,然后设计一套通用的神经网络模型,再把这些数据带入神经网络,让网络自己反复计算,这个过程就叫训练,一旦训练次数足够多,其自己积累的知识和经验就会出现爆发式的增长,计算机在很短时间内完成计算并让神经网络学会某项技能。
AI现在才开始智能。
即便如此,我们现在仍然不得不承认,要通过图灵测试,人工智能依然可能是在短时间内无法突破的瓶颈。
(图片来源于互联网)
03
人工智能受限于数据
人工智能也许并不智能
人工智能在今天已经得到了愈加广泛的重视。并在机器人,经济政治决策,控制系统,仿真系统中得到应用。
人工智能比较合适的应用范围:机器翻译,智能控制,专家系统,机器人学,语言和图像理解,遗传编程机器人工厂,自动程序设计,航天应用,庞大的信息处理,储存与管理,执行化合生命体无法执行的或复杂或规模庞大的任务等等。别开这些高大上的名词,用我们能听懂的话来说就是:指纹识别,人像识别,文字识别,图像识别,车牌识别、语音识别等应用逐渐成熟,自动驾驶已经推出,智能搜索、计算机视觉和图像处理、机器翻译和自然语言理解、数据挖掘和知识发现也已经被大幅利用在互联网技术上。
值得一提的是,被某些以商业目为出发点的公司宣称的机器翻译是人工智能的重要分支和最先应用领域。不过就已有的机译成就来看,机译系统的译文质量离终极目标仍相差甚远!
神经网络计算之旅让我们看到了希望,但是,这一旅程确实是一个苦旅。
期间,我们需要人事先将数据准备好,然后才能喂给神经网络自己去训练。但是,搜集数据的过程,工作量实在是非常非常巨大的。
在人工智能飞速发展的时代,机器已经初步具备人的视觉、听觉、语义识别的能力。同时如果要让机器变得越来越“聪明”,需要大量优质的数据来提升机器学习的准确性。
下图是人工智能在智能呼叫中心总的一个应用。
(图片来源于华云数创)
看似简单的一个架构,要让机器变得越来越“聪明”,需要大量优质的数据来提升机器学习的准确性。
要完成这样一个智能机器人坐席,必须经历“数据采集---数据标注---建模---用标注好的数据训练模型---模型反复测试---智能机器坐席”这样一个冗长的过程。在这个过程中数据采集和数据标注是工作量最大的两个环节,需要大量人工采集数据,以及大量人工标注数据、反复检验数据。之后,才可以提供最优质的数据给到机器做学习和训练。
人工智能最基础的、最最重要的一环却是最不智能的一环。网上,有很多的号称作标注的公司的收费都是按小时计的,价格相当的昂贵。为什么?因为是人工啊!
华云数创(北京)科技有限公司拥有极强的数据治理能力和工具,但是他们也只能在数据采集这一层做到主动搜集需要的数据,多源异构、结构化、半结构化、非结构化等对于华云数创来说都是小菜一碟,他们的工具还能做到自动的数据治理,包括数据目录、元数据管理、血缘分析、ETL等等。但是当笔者问及,在他们做的这个人工智能智能呼叫中心时,如何能提高机器训练的准确性、如何提高语音、语意和识别率和理解力等问题时,华云数创的技术负责人也只能苦笑,给了笔者一个字的答案,就是“人”。这是一个费人工的活,目前还没有其他好的办法!
上表给了一个特殊的例子,对住宅小区名字的识别,我国小区取名字是很有意思,跟我们个人取名字一样,存在大量的同音、近音字的现象,而且由于南方人发音严重不准,要想准确让机器识别出目标小区,是一件困难的事情。当然,这难不住人,功夫不负人力,大量的人力帮助了人工智能的智能,上面的抽样结果看到了一些智能的感觉。
不知道以后技术的发展能否做到不在这么费人工的人工智能呢?让计算机自己去扩词、去标注、去训练,然后自己去评估学习效果,那这就更加完美,我一起去期待吧!
04
深度学习是本轮人工智能爆发的关键技术
但似乎仍是“曲线拟合”,具有学到结果的不可解释性
人工智能视觉和自然语言处理等领域取得的突破性进展,使得人工智能迎来新一轮爆发式发展。而深度学习是实现这些突破性进展的关键技术。
基于深度卷积网络的图像分类技术已超过人眼的准确率,基于深度神经网络的语音识别技术已达到95%的准确率。
1、深度学习随数据规模的增加可不断提升其性能
2、深度学习可从数据中直接提取特征,削减了对每一个问题设计特征提取器的工作
卷积神经网络广泛应用于计算机视觉领域,在图像分类、目标检测、语义分割等任务上的表现大大超越传统方法。
撇开深度神经网络的模型复杂度高,巨量的参数导致模型尺寸大、模型训练所需的数据量大,训练数据样本获取、标注成本高、有些场景样本难以获取、应用门槛高,算法建模及调参过程复杂繁琐、算法设计周期长、系统实施维护困难等问题不谈。
图灵奖得主贝叶斯网络之父Judea Pearl指出当前的深度学习不过只是“曲线拟合”,缺乏因果推理能力。
由于内部的参数共享和复杂的特征抽取与组合,很难解释模型到底学习到了什么,存在学习结果可解释性问题。
(图片来源于互联网)
05
市场是路由器
转化和优化的结果就是推动人工智能的创新
人类最重要的一个发明可能就是市场。参与市场的结果就是导致了对别人有价值的服务和体验和产品。
我们每个人为了自己的意愿,不管这种意愿是什么目的,当基本上都是为了自己的利益或者梦想出发的,很有意思的是,其结果却是给其他人带来了利益。
市场的快速无情的反馈,会对任何好的思想,有生命力的技术,有高价值的场景,起到推波助澜的作用。任何淘汰的落后的东西,市场一定会有信号指示,并被快速滤掉。
多年前,对于大量多源异构数据的处理也是存在于数据报表领域的一个大难题,需要大量的人力进行处理和导入;同样,对于统一财务系统中大量重复性流程劳动也是需要大量的人力来处理;这类费时费力的低价值的劳动,在今天的人工智能时期,对了,应该叫做“弱人工智能”时期,有其必要性,相信在不久的将来,通过市场这个最有效的途径,很快会有新的突破。
也许人工智能目前真的是人工为主,就像是无尽的黑暗,但黑暗的尽头是人类文明新的征程。
分享是一种美德,转载请注明来源和出处!