人工智能整体技术体系和国内外发展情况
作为新一轮产业转型的核心驱动力,人工智能将进一步释放以往科技革命和产业变革积累的巨大能量,创造新的强大引擎,推动智能经济和智能社会的发展。本文试图从根技术、核心共性技术、智能应用技术和典型应用场景四个方面概述国内外人工智能技术的总体技术体系和发展。
近年来,人工智能已经成为国际科技竞争的新焦点。人工智能技术作为一种跨学科的结果和普遍的技术,已经与上下游的相关技术和应用一起形成了一个复杂的技术系统网络。目前,这一网络正在形成,但仍处于快速更新和剧烈变化的动态之中。在收集整理各种数据后,本文试图从根技术、核心共性技术、智能应用技术和典型应用场景四个方面概述人工智能技术的总体技术体系和国内外发展状况。据初步研究,目前人工智能产业发展有两大趋势:一是不断拓展和挖掘核心技术;二是积极寻求传统产业的应用空间。
(红色标记是国内机构)
一、根技术:广泛集成和持续扩展
数学和工程一直是人工智能发展的重要基石。例如,自1956年达特茅斯会议以来,控制论一直是人工智能研究中的主导理论。机器学习算法的发展过程可以看作是数学方法的不断进化过程。
20世纪80年代,人工智能的主流理论逐渐演变成信息论。与此同时,深度学习算法也诞生了。深度学习算法近年来的成功不仅是由于其自身算法的不断改进,也是由于近30年来信息学和计算机科学的快速发展。尤其是大数据技术的发展提供了前所未有的丰富数据,使得各种机器学习算法获得了充足的学习资源。计算性能的提高也保证了其潜力的充分发挥。
出于对人类智能的追求,脑科学和认知科学是人工智能发展各个阶段的主要参与学科之一。例如,人工神经网络数学理论的雏形是在心理学家沃伦·麦克库洛奇的参与下产生的。目前,类脑智能被认为是人工智能未来的发展方向之一,因此脑科学和认知科学的研究仍将受到广泛关注。相关研究可分为两类:“硬件研究”侧重于基因、蛋白质、神经元、化学信号和电信号,“软件研究”侧重于认知、行为和心理学。目前,人们普遍认为后者对类大脑智能的研究和发展更有指导意义。
许多不同的根技术的广泛集成导致了当前人工智能技术的快速发展。与此同时,整合的范围仍在扩大。例如,随着智能芯片的发展,集成电路相关技术已经成为人工智能技术系统的一部分。量子计算也包含在人工智能的技术网络中。人工智能的跨学科特征将越来越突出。
二、核心共性技术
核心共性技术大致可以分为三类:人工智能芯片、基本算法和系统平台。在具体应用中,各种算法是系统平台的基础。人工智能芯片作为硬件是算法的基础。然而,在实际的创新链中,人工智能芯片也是基于基本算法的特点、要求和指导而开发的。基本算法是人工智能技术发展的根本核心。
基本算法:主动创新,任重道远
早期的计算智能算法主要模仿人类智能的“知识表示和推理”功能。尽管有专家系统、几何证明机和“深蓝”等案例,但仍存在效率低、可维护性差、性价比低等不可克服的问题,未能取得商业成功。
机器学习算法走得更远,正式模拟人脑的学习功能,也就是说,重复训练次数更多的“思考”过程将得到加强。这一突破性进展可以大大提高人工智能系统的运行效率,降低编码成本。人工神经网络算法是机器学习算法的一个重要分支,它借鉴了人脑神经元的一些运行机制。深度学习算法是人工神经网络算法的扩展。通过多层神经网络,它形成了比简单的浅结构学习更强大的从几个样本集中归纳数据集本质特征的能力。近年来,算法研究一直处于频繁更新和快速迭代的状态。目前,简单的深度学习算法已经有点“过时”。在此基础上发展起来的卷积神经网络、循环神经网络和递归深度神经网络已成为最新的前沿。此外,现有算法的交叉组合,如深度学习算法和强化学习算法相结合形成的深度强化学习方法,也逐渐成为新的热点。欧美大学在计算智能算法和机器学习算法的研究和开发中占据绝对领先地位。在世界前30所大学中,美国的比例最高,达到22所。我们国家没有一所大学在名单上。
尽管目前已经取得了一定的成功,但是机器学习算法的机制仍然是统计拟合和暴力计算,不具备真正的基于理解的学习、推理和决策能力,因此在应用上仍然存在很大的局限性。一些专家甚至认为机器学习算法不能真正解决热点问题,如自然语言翻译和全自动驾驶。目前,先进的机器学习仍然无法突破机器学习的框架,在相对清晰的算法基础上面向未来。量子计算主要与高级机器学习的发展相协调。许多专家认为类大脑智能计算是新一代人工智能技术的突破。最近,美国、日本、德国、法国、欧盟、以色列等主要国家和地区开展了脑科学和人工智能的联合研究。然而,现有的许多类脑智能研究主要使用人工智能工具来研究脑科学,人工智能研究的推广还不够。只有少数几所大学,如麻省理工学院、卡内基梅隆大学和加州大学伯克利分校,将这两方面的研究紧密结合在一起。总的来说,新一代人工智能基本算法的研究还有很长的路要走。
人工智能芯片:多途径竞争,分领域发展
目前,人工智能芯片按照技术路线可以分为三类。首先是通用的中央处理器和图形处理器芯片。CPU的体系结构和指令集与神经网络计算不兼容,性价比和计算效率较低。然而,英特尔和ARM在新的CPU产品Xenophi和DynamIQ中加强了对神经网络计算的支持。GPU架构比CPU更有利于相关算法的运行。传统的图形处理器制造商Avida和AMD分别推出了特斯拉V100和RadeonInstinctMI25,以开拓人工智能芯片的市场空间。英特尔还通过收购推出了Nervana,以进入图形处理器领域。
第二种是现场可编程门阵列芯片。FPGA具有可定制的特点。用户可以对芯片进行二次开发,使其更适合特定的计算环境。由于通用性的牺牲,FPGA芯片比CPU和GPU更便宜。目前,Xilinx、Altera、Microsemi、Lattice等少数厂商基本垄断了FPGA生产。英特尔还通过收购Altera进入了FPGA芯片的生产领域。基于外包芯片,微软和百度等领先企业拥有强大的二次开发能力。百度推出了一款基于FPGA的百度大脑芯片。
第三种是专用集成电路芯片。这种芯片完全专用,没有编辑功能。设计新的专用集成电路芯片的初始投资相对较高,但批量生产后可以实现极低的成本。专用集成电路芯片对于特定的计算非常有效,但是它们只能应用于特定的计算。目前,专用集成电路芯片分为两个技术方向。(1)脉冲神经网络芯片,以国际商用机器公司的TureNorth为代表,通过脉冲长度模拟大脑神经元之间的交流活动。(2)以谷歌TPU和中国寒武纪为代表的机器学习芯片,模拟大脑神经元之间概率变化的交流活动。相比之下,后者直接针对机器学习算法的需求,目前在商业应用的竞争中占据优势。高通公司的Zeroth正在从早期的脉冲神经网络芯片向当前的机器学习芯片方向转变。前者仍需要忆阻器等基本元件的进一步发展,但对类脑算法的研究具有长远意义。
总的来说,三种人工智能芯片各有特点,并有相应的潜在细分市场。不同场合对通用性、成本和性能的不同要求会产生不同的解决方案。苹果A11、华为麒麟970和谷歌TPU的人工智能模块仅用于配合中央处理器完成特定操作。
系统平台:多方争夺地盘
在实际应用中,可能使用的大量不同的基本算法需要集成到集成的和高度兼容的软件工具中来发挥它们的作用。相对完整的工具软件包形成了稳定的系统环境。围绕一些开源系统,一个在世界范围内共享研究成果的平台将会经常形成。在系统平台领域抢占话语权,可以形成类似于个人电脑时代的视窗系统或人工智能时代的手机时代的安卓系统的优势市场地位。目前,人工智能系统平台正处于积极发展和普遍竞争的状态,尚未产生稳定的格局。像脸谱网、IBM和许多小型初创公司这样的大公司已经启动了他们自己的开源项目。苹果公司通过收购Turi涉足这一领域。中国的百度最近也推出了自己的开源平台“桨”。另一方面,谷歌完全基于其张量流平台设计了TPU芯片,在战略层面上开放了软件和硬件市场的布局。
第三,智能应用技术:感知、决策和执行的集成
智能应用技术是基于核心共性技术的具体应用研究,主要是针对特定类型问题的解决方案。特定的技术可以用于许多不同的应用场景;特定的应用场景通常包括许多特殊的技术。
就智能传感器而言,目前国际一流的传感器市场基本上被外国公司垄断,中国的产业和R&D的实力明显处于劣势。从广义上讲,模式识别不仅包括一些常见的理论,还包括语音、图像、自然语言分析等方面的具体识别技术,分别表现为模式识别理论和感知理解技术。智能决策分析主要关注数据挖掘方向的特殊应用。机器人、无人驾驶飞行器和无人驾驶飞行器也开始应用大量基于机器学习的智能控制技术。此外,人机交互也是当前的重点之一。
过去,在机器人和自动化的研究中,其技术系统往往按照感知、决策和执行三个环节进行分析,而人工智能的发展逐渐模糊了这三者的界限。例如,机器视觉不仅包括基于视觉传感器的感知环节,还包括分析、处理和判断视觉信号的决策环节。人机交互包括对人类物体的感知和执行。未来,人工智能技术将进一步提升感知、决策和执行的集成水平。
4.典型应用场景:关注热点,每个热点都展现出自己的魔力
基于新加入企业的业务方向,近年来人工智能行业最受关注的子行业是机器视觉、自然语言处理和自动驾驶。这三种特殊智能技术衍生的应用场景也是当前人工智能市场的主要热点。例如,机器视觉技术开发的应用包括网络图像检查、人脸识别、虹膜识别、设备登录验证、金融身份验证、安全监控等。自然语言处理技术开发的应用包括语音输入、机器翻译、个性化通信、智能客户服务等。
在这些重点应用中,成熟的自然语言处理、机器视觉、图像识别、语音识别等。基本上局限于信息产业。尽管与实体经济相关的自动驾驶受到了广泛关注,但在短期内仍难以突破。目前,寻找能够连接传统制造业和服务业的应用点是人工智能产业发展的重要任务,也是人工智能“通用”应用的必然需要。
目前,探索新的应用领域主要分为三种情况。(一)领先,即龙头企业推动新应用市场开放,利用技术、资金、影响力等方面的优势暂时处于无竞争状态的战略意愿。例如,IBM基于沃森提供的医疗诊断、法律咨询和其他服务,以及阿里巴巴提出的城市大脑。(2)主动吸收,即一些高度专业化的行业积极吸收人工智能方法来提高自己的产品水平。主导因素是该行业最初的成熟学科,而不是新兴的人工智能企业。这也是最能体现人工智能“通用”类型的应用程序类型。例如,财务分析、科研援助、混合交易分析等。(3)有待开发,即理论上人工智能有可能应用于相关领域,但仍缺乏实用性强、市场空间大的成熟产品。例如,防灾减灾、基础设施维护、智能制造、智能教育等。
作者:沈应龙,上海理工大学产业创新研究室助理研究员、博士。
本文转载自微信公众号《再思考》
标题:人工智能整体技术体系和国内外发展情况
如若转载,请注明出处:http://www.ikepu.com/wenzhang/75897.html