AI的发展(一)
人工智能是集合了计算机科学逻辑学生物学心理学和哲学等众多学科,在语音识别图像处理自然语言处理自动定理证明及智能机器人等应用领域取得了显著成果人工智能在社会发展中扮演着不可或缺的角色人工智能在提升劳动效率减低劳动成本优化人力资源结构及创造新的工作岗位需求方面带来了革命性的成果
人工智能的出现为疲软的全球经济提供了新的动力,提升了全球GDP的增长速度人工智能规模发展迅速,截至2018年,中国人工智能市场规模已达238.2亿元人工智能的产生已经为人类创造出很大的经济效益,正在惠及生活的方方面面,无人驾驶人工智能医疗及语音识别等,为人类的生活提供了便利同时人工智能的出现,取代了很多传统岗位,同时也创造了很多新的岗位来消化社会劳动力人工智能的出现极大地推动了社会发展,让社会发展步入新的时期
(一)人工智能发展历史
人工智能雏形的出现是在1955年,在一次“学习机器讨论会”上,著名的科学家艾伦·纽厄尔和奥利弗·塞弗里奇分别提出了下棋与计算机模式识别的研究在次年的达特茅斯会议上,提出了“人工智能”一词,并讨论确定了人工智能最初的发展路线与发展目标之后由阿瑟·塞缪尔提出了机器学习理论,根据这一理论编写完成了能够与人类进行对弈的西洋跳棋程序,并于1962年战胜了美国的西洋跳棋大师
20世纪70年代中叶符号学派走向低谷,以仿生学为基础的研究学派逐渐火热神经网络由于BP算法的广泛应用获得了高速发展在大环境下,专家系统的大量使用使工业界节约了大量成本,提升了产业效益例如价值上亿的矿藏由PROSPECTOR专家系统成功地分析得出在此之后,人们开始尝试研究具有通用性的人工智能程序,却遇到了严重的阻碍,陷入停滞人工智能又一次步入低谷
1997年,“深蓝”的成功让人工智能的发展又提上日程随着算力的增加,人工智能的瓶颈被打破,为基于大数据的深度学习与增强学习提供了发展的可能GPU不断发展,与此同时定制化处理器的研制成功使算力不断提升,为人工智能的爆发提供了基础
在无人驾驶领域北京地平线信息技术有限公司,发布了一款嵌入式视觉芯片,主要针对无人驾驶汽车领域阿里投资千亿成立“达摩院”,在机器学习等方面开展研究和进行产品开发人工智能步入了快速发展期
人工智能自出现以来,经历了两次低谷三次浪潮,现在正处于人工智能的第三次浪潮,人工智能正在快速发展,为生产力的提升提供变革的动力
(二)人工智能技术核心
1计算机视觉
人们认识世界,91%是通过视觉来实现同样,计算机视觉的最终目标就是让计算机能够像人一样通过视觉来认识和了解世界,它主要是通过算法对图像进行识别分析,目前计算机视觉最广泛的应用是人脸识别和图像识别
图像分类
传统图像分类的方法主要经过2个步骤:特征提取和训练分类器特征提取通用的方法主要包括2种,使用通用特征提取和使用自己设计的特征提取例如在人脸识别中,使用HOG,LBP等通用特征进行检测选定特征之后,使用传统的机器学习方法,例如adaboost等建模方法训练分类模型,然后选择效果最好的模型进行调参,最终生成人脸检测模型
自2015年之后,图像处理使用深度学习进行分类的方法得到了广泛应用神经网络通过神经元构建成网络,通过激活函数使模型具有非线性拟合能力只需要给模型设计好输入和输出,模型就能自动学习特征提取和训练分类器的过程深度学习的使用让图像分类过程中最为费时费力的过程得以简化,提升了图像分类的效果和效率VGG,ResNet(残差神经网络),inception这几种结构是工程中最常用的工程上使用的模型必须要兼顾效率和效果,即在保证精度的同时也要保证速度所以,在训练好模型之后会对模型进行微调和缩减FRCNN,Mask-RCNN,YOLO是现在常用的网络模型,这几个模型拥有的共同点就是精度高速度快例如应用在人脸识别领域,这几个模型都可以实时检测并得出结果
目标跟踪
目标跟踪主要有3类算法,相关滤波算法检测与跟踪相结合的算法和基于深度学习的算法相关滤波(CorrelationFilter,CF)是当前研究的一个重点,最初它应用在信号领域,之后引入目标跟踪领域它引入了快速傅里叶变换从而使得算法效率得到有效提升MOSSE是目标检测算法中应用最早的算法在研究过程中在实时性应用方面做出突破的算法是CSK在CSK的基础上进行改进,产生了KCF算法之后还提出了CN,DSST,SRDCF等算法
检测与跟踪相结合的算法,简单来说就是目标跟踪的判别式算法算法的实现理念是先找出目标的位置,然后再对目标进行跟踪深度学习的推广也影响到目标跟踪研究基于深度学习的算法有分类和回归两类R-CNN,FastR-CNN,FasterR-CNN是基于分类的算法3种算法最大的不同在于检测窗口的选择,R-CNN采用滑动窗口,FastR-CNN采用SelectiveSearch,FasterR-CNN采用RPN
语义分割
计算机视觉就是将图片分割成像素,然后对像素进行处理语义分割的意义是理解分割后像素的含义,例如图片中识别人摩托汽车及路灯等,它需要对密集的像素进行判别卷积神经网络推动了语义分割算法的发展语义分割中最基础的方法是通过滑动的窗口进行分类预测
2014年,全卷积神经网络(FullyConvolutional Networks,FCN)的出现替代了网络全连接层基于FCN研究出Encoder-Decoder架构Encoder是降低空间维度的操作,Decoder是恢复空间维度和细节信息的操作之后空洞卷积(Dialated/Atrous)取代了Pooling操作空洞卷积的优点是它可以保持空间分辨率除了之前的几种方法,还有一种叫条件随机场(ConditionalRandom Fields,CRFs)的方法来提升分割效果
2机器学习
机器学习的基本思想是通过计算机对数据的学习来提升自身性能的算法机器学习中需要解决的最重要的4类问题是预测聚类分类和降维机器学习按照学习方法分类可分为:监督学习无监督学习半监督学习和强化学习
监督学习
监督学习指的是用打好标签的数据训练预测新数据的类型或值根据预测结果的不同可以分为2类:分类和回归监督学习的典型方法有SVM和线性判别回归问题指预测出一个连续值的输出,例如可以通过房价数据的分析,根据样本的数据输入进行拟合,进而得到一条连续的曲线用来预测房价分类问题指预测一个离散值的输出,例如根据一系列的特征判断当前照片是狗还是猫,输出值就是1或者0
无监督学习
无监督学习是在数据没有标签的情况下做数据挖掘,无监督学习主要体现在聚类简单来说是将数据根据不同的特征在没有标签的情况下进行分类无监督学习的典型方法有k-聚类及主成分分析等k-聚类的一个重要前提是数据之间的区别可以用欧氏距离度量,如果不能度量的话需要先转换为可用欧式距离度量主成分分析是一种统计方法通过使用正交变换将存在相关性的变量,变为不存在相关性的变量,转换之后的变量叫做主成分其基本思想就是将最初具有一定相关性的指标,替换为一组相互独立的综合指标
半监督学习
半监督学习根据字面意思可以理解为监督学习和无监督学习的混合使用事实上是学习过程中有标签数据和无标签数据相互混合使用一般情况下无标签数据比有标签数据量要多得多半监督学习的思想很理想化,但是在实际应用中不多一般常见的半监督学习算法有自训练算法(Self-training)基于图的半监督算法(Graph-basedSemi-supervisedLearning)和半监督支持向量机(S3VM)
强化学习
随着AlphaGo的火热,强化学习成为了当前最火热的研究领域之一,强化学习词热点居高不下强化学习是通过与环境的交互获得奖励,并通过奖励的高低来判断动作的好坏进而训练模型的方法强化学习中探索和开发的权重高低是一个难题:为获得更好的奖励必须尽量选择能获得高奖励的动作,但是为了获得更好的奖励,也必须要挖掘未知的动作
强化学习的基础来源于行为心理学在1911年Thorndike提出了效用法则,即在环境中让人或者动物感到舒服的动作,人或者动物会不断强化这一动作反之,如果人或者动物感觉到不舒服的行为,人或者动物会减少这种动作强化学习换言之是强化得到奖励的行为,弱化受到惩罚的行为通过试错的机制训练模型,找到最佳的动作和行为获得最大的回报它模仿了人或者动物学习的模式,并且不需要引导智能体向某个方向学习
智能体可以自主学习,不需要专业知识的引导和人力的帮助基础的强化学习算法有使用表格学习的q_learning,sarsa以及使用神经网络学习的DQN,直接输出行为的PolicyGradients及Actor Critic等