人工智能研究挑战究竟在哪里?株式会社日本首席科学家顾泽苍教授深度解读新型人工智能模型
人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大。2016年,谷歌人工智能AlphaGo战胜了全人类棋手,标志着人工智能已经达到极高的水平 ,这使全世界为之震惊!“深度学习”就此可以大范围的推广了吗?人工智能的研究和推广还面临着哪些挑战呢?请看株式会社阿波罗日本首席科学家顾泽苍教授为我们深度解读新型人工智能模型。
人物介绍
(《机器人技术与应用》常务副主编王伟先生为顾博士赠送机器人大讲堂荣誉证书,右一为 顾泽苍博士)
顾泽苍
株式会社阿波罗日本首席科学家
工学博士
日本电子情报通信学会(IEICE)正会员
日本画像电子学会(IIEEJ)正会员
日本人工知能学会(JSAI)正会员
南开大学教授
中国科学院客员研究员
研究经历
94-99年: 为了同神经网络对抗,创建 “概率尺度自组织”的机械 学习理论,并在模式识别领 域中进行了大量的应用。
00-14年: 在国际上首先提出“具有隐形结 构的二维码”,以及“图像直接 变换二维码的ITC算法”,“概 率空间距离的定义”。
14-16年: 将概率尺度自组织同神经 网络结合,提出“SDL理 论”
大家知道2016年,谷歌的AlphaGo战胜了全人类的围棋,这就使人工智能的关注度达到了最高潮。那么在这种情况下,我们可以马上进行产业化吗?其实我们看得很清楚,尽管它有这么辉煌的战果,但是存在它不可解决的问题。
在九十年代初期,我们曾经运用模糊事件概率测度理论解决了大规模集成电路的多目的最佳的组合的难题。在九十年代末期,我们看到了传统的神经网络它是一个大数据的组合的问题,所以它在应用上必然存在它解决不了的,比如人们都知道的黑箱的问题。
所以在那个时候我们就提出了和传统神经网络进行对抗,提出了一个我们称之为概率尺度自组织,一个很强大的学习机械模型。
于是,就决定了搞出一个全新的人工智能的模型,做这个机械学习,要解决一个模式识别问题的时候,在我们看来我们是要解决一个在欧几里得空间到概率空间的关系问题。
以上是一个最典型的从机械学习这个角度来看,模式识别是一个什么样的模型,是两个概率分布,中间有一个背测图像或者说背测声音的数据,这个数据是一个特征值,与哪个数据之间有什么样的关系,这里面就引出了概率空间尺度的问题。
从数学上讲,如果要是给出一个两个空间,而且是一个概率尺度完全不同的公式,是很难的。我们怎么解决这个问题呢?我们摸索到了一个想法,我们看到数据在欧几里得空间进入到概率空间之后,距离发生了变化,就把这个变化作为一个误差,很简单就把这两个距离统一起来了。这个公式很容易理解,比如在穿越概率空间的时候就不存在空间的分布,经过了概率空间产生了概率的实践了,那么就会有一个公式来表现,就很简单的把两个空间的距离统一了。这个距离找到以后,使我们的机械学习简化了很多。
目前国际上普遍认为无监督学习只能依赖聚类算法,但是,在实施 中都不能得到理想的机器学习的应用效果,因为无监督学习,聚类的尺度是欧几里得的尺度。
而新的自组织具有可以朝着大概的方向,自己自动迁移的这样的特性,初始值放在什么地方,结果是一个结果,为什么?因为它用了一个概率的尺度。所以这个模型我们称之为概率尺度自组织模型。
自组织可以通过机械学习把特征值的概率分布找出来,它通过学习最后能够得到一个超越我们目前数学上一切优化结果的最优值,甚至它可以颠覆统计学两个参数,所以它是很强大的。
新一代人工智能模型是三层神经网络,是一个新的,跟现在完全不同的模型,它第一层是感知层,第二层是神经层,第三层是脑层。增加了它的层数是一个非常大的复杂度,而用这样的模型增加它的深度,不会影响它的复杂度。
优点1 :独特的基于空间映射理论的图像特征抽出方法
在模式识别中,信息抽出的质量的重要性要远高于机器学 习的分类算法,基于空间映射理论,将原图像通过物理模 型映射出若干个图像,可以将原图像的深层信息直接抽出, 每一个特征信息区域对应着一个机器学习,可以把所对应 的图像区域中的「高阶最大几率」的值*抽出,这是史无 前列的独特的图像信息抽出方式,而且每一个特征区域都 对应一个强大的无监督学习,由集中学习发展为分散学习, 所以这是一个具有巨大能力的机器学习模型。
优点2:直接通过概率尺度自组织得到特征值概率分布
概率尺度自组织机器学习的一个功能是可以在给定的若干个 数据,通过机器学习得到一个可以超越任何优化结果的「高 阶最大几率」的解,另一个功能是可以对给定的概率分布的 数据快速的直接进行概率分布的标定,标定的结果只需要保 留标定的概率分布的位置信息,无需GAN那样需要大数据 来承载概率分布信息,而且不存在黑箱问题。
优点3:在神经层与脑皮层之间通过强对抗学习进行最后决策
在新一代神经网络的神经层与脑皮层之间,让采样的图像 特征向量与已经学习过的m个n维概率空间的概率分布数据 之间,通过模糊事件概率测度预选出采样的图像的特征向 量与两个最接近的概率空间的数据,然后对这两个数据的 每一维数据进行最大信赖度的评价,剔除不符合要求的某 些数据,再以模糊事件概率测度为尺度,让采样图像的特 征向量,在筛选后的这两个概率空间之间,进行微观数据 的强对抗,得到一个宏观数据的强对抗的结果,在此基础 上得到一个最终决策的阀值,通过这个阀值决定识别结果。
新型AI模型建立在颠覆传统的统计学的基础上,可以将随机分布的数据处理到接近母集合的水平,通过穿越欧几里德空间与概率空间的距离关系与模糊事件 概率测度关系的融合,可以实现「高阶最大几率」与「最大信赖度」的模式识 别结果,还可以发展到模式理解,以及视频检索,动态识别等应用场景。
特点
新型AI模型可以进行强对抗,可以进行视频的检索,它有它独特的特点,它是放在机器人的视觉里面的,这个是我们认为当今最好的模型。它可以进行流行的学习,不仅在图象识别的时候性能非常的好,它也可以用一个最小的芯片来实现。
1
图像直接变换代码ITC(Image To Code)技术
来源:第四届中国机器人峰会