机器学习的崛起
Deep-Sci:"-sci-"源自拉丁语的"scientia"(知识)
小科
物语
+
熟悉人工智能发展历史的人知道,这,其实是一次失败者的逆袭。
【每日一篇】
道生一,一生二,二生三,三生万物。万物负阴而抱阳,冲气以为和。人之所恶,唯孤、寡、不毂,而王公以为称。故物或损之而益,或益之而损。人之所教,我亦教之。强梁者不得其死,吾将以为教父。
——《道德经·损之而益》
这是一个机器学习的时代。
熟悉人工智能发展历史的人知道,这,其实是一次失败者的逆袭。
一切开始于20世纪60年代的一个夏天。
一群顶尖学者汇聚在一起讨论如何制造一台“模拟人类各方面智能”的机器。
这些来自世界各地的年轻气盛的科学家们耗费了两个月的时间,在雄伟的佐治亚尖塔和郁郁葱葱的达特茅斯学院花园里进行头脑风暴。
活动的组织者曾经大胆预言:如果我们精心挑选出一组科学家通力合作,至少一个关于计算的问题将会获得重大推进。
在这次活动中,他们一致认可了“人工智能”这个概念。
那是一个理想主义的时代。
年轻人们把科技创新赞美为通往永恒和平与繁荣的必经之路。
在这场严肃的讨论中,几乎没有人注意到大会中乐观的目标完全没有达成。
在世界顶级的人工智能实验室中,充满了不修边幅的天才和古灵精怪的奇人。
休息时,奇特的电子音乐会充斥于大厅之中。
机器人偶尔会毫无目的地在停车场游荡。
逻辑学家和哲学家们争论着机器是否可以有思想。
早期的时候,人工智能的很多努力都专注于通过把逻辑公理串起来从而获得结论。
这,是一种数学形式的证明。
科学家们不仅把类似的技术应用到了数字上,同时也用在了处理字母、词语以及文件上。
他们只是进一步把可以被处理的数据类别扩展到任何类型的符号上。
这类符号包括早已存在的符号,也包括因为特殊目的而新发明的符号,比如下象棋。
最终,这种风格的人工智能被归纳为符号系统法。
这种方法很快遇到了瓶颈。
无论计算机有多快,它也无法驯服所谓的“组合爆炸”问题。
用按部就班的分析方式解决真实世界的问题时,总会遇到精疲力竭的情况。
随着问题变得越来越复杂,编程的方法很快就变得过时了。
很多努力都转向了启发法研究。
这种方法可以被粗略地解释成把问题减小到可管理程度的“经验法则”。
当情况变得严峻时,你需要根据法则来绕过那些浪费时间的无用备选方案。
这个过程被称为“修剪搜索空间”。
阶段性的辩论爆发了,争论的重点在于这些程序中的智能究竟存在于哪里。
“启发编程”的研究者们很快就意识到,重点并不在于对答案的机械搜索,也不在于把逻辑命题串起来的过程,而在于用于修剪搜索空间的规则。
专门采访专家,并把专家的技能融入到人工智能程序的程序员被称为“知识工程师”,最终生成的程序被称为“专家系统”。
所以这自然就会产生一个疑问:专业的本质是什么?
专业从何而来,计算机程序可以自动成为一个专家吗?
显而易见的答案就是,你需要大量的练习以及很多和相关案例接触的机会。
一个成熟的赛车手并不是生来就具有把汽车开到极限速度的能力。
艺术大师也并不是抱着小提琴出生的。
但是,你如何才能让计算机程序从经验中学习呢?
有这样一小组边缘的人工智能研究者。
他们从一开始就认为模仿人类大脑功能可能才是最好的方法。
并且认识到,“做这个,然后做那个”并不是为计算机编程的唯一方式。
而且大脑似乎采取了一种虽然不同,但是更加灵活的方法。
但问题在于,我们对于大脑知之甚少。
而且,大脑中还包含很多以复杂方式连接的细胞。
这些细胞被称为神经元,它们彼此之间交换着化学信号和电信号。
根据人工智能研究者喜欢人格化的癖好,他们把这些程序称为“神经网络”。
但是这些程序是否真的能够像大脑一样工作并不是重点。
它只是另一种编程方法而已。
对于人工智能来说,符号系统法和神经网络的最大区别在于:
符号系统法前者需要程序员预先定义符号和逻辑规则来组成问题的论域。
神经网络则仅需要程序员提供足够的示例。
一种方法是告诉计算机如何解决问题,另一种方法则是给计算机展示示例,告诉它你想让它做什么。
听起来很不错,但是在现实中,神经网络的方式并不见效。
至少,刚开始时是这样的。
后来,我们见证了这种技术的回潮。
同时,还伴随着具有说服力的成果。
这些程序被重新包装为机器学习和大数据。
同时,也因为先进的架构、技术以及对统计学的利用而变得更加强大。
这些技术开始在真实照片中识别物体、在口语中识别词语。
还能识别以其他任何形式呈现出一定模式的信息。
回顾机器学习的过去,之所以在20世纪晚期没有能力和符号系统法一争高下,背后有着非常重要的原因。
那是因为,我们通常所说的信息技术,特别是计算机改变了。
这种改变既不是一点点改变,也不是很大的改变。
而是发生了彻头彻尾的改变。
今天的计算机从根本上说和50年前的已经完全不同了。
这种变化的规模之大,让我们很难想到任何有意义的类比。
“指数级增长”这个词总被不准确地到处使用,但很多人并不理解这个词的真实含义。
至少在之前的半个世纪,计算的重要指标如处理速度、晶体管密度以及内存等,差不多经过每18~24个月就会翻倍,而这就是指数级增长(2的幂)。
在计算机革命的开始阶段,没人能够断言这些机器的能力会在一段时期内实现稳定的指数级增长。
英特尔的联合创始人戈登·摩尔在1965年就注意到了这样的趋势,即摩尔定律。
这样的趋势可能明天就会结束,就像忧虑的行业观察者们在过去几十年中警告的那样。
但是到目前为止,其发展势不可挡。
你可能在毫不知情的情况下经历了这个无与伦比的成就。
摩尔定律、大数据和算法……人工智能时代已经来临。
▼ 人类将会向机器乞讨吗
✨星星发亮是为了让每一个人有一天都能找到属于自己的星星
▼