未来已来——解读人工智能和深度学习对机器视觉的影响
通过采用深度学习技术和人类用于发展大脑的其他功能,在机器视觉中融入人工智能将使机器思考得更像人类。
当20世纪50年代出现了“思维机器”的概念之后不久,人们就开始对人工智能(AI)领域发出了不安的警告。自从1968年的标志性电影“2001:太空漫游”到2014年的科幻大片“机械姬 Ex Machina”,对“机器崛起”的恐惧一直在流行文化中发酵着。
虽然AI仍然没有像人们担心的那样“接管”社会,但是随着数据存储和处理能力的提高,像IBM Watson这样的认知系统的开发使得未来代替人类决策的猜测成为可能。不过目前而言,大多数AI的迭代处理还是诸如对象识别等更为“温和”的任务。
AI技术的运用,将使机器视觉能够具有超越现有解决方案的能力,胜任更具有挑战性的应用。但是加入AI的机器视觉是否已经做好准备用于工业应用呢?
深度学习能力
AI在机器视觉中的适用性依赖于机器学习技术,更准确的说是深度学习能力。从最广泛的层面上来说,AI可以被定义为计算机模拟人类智能的能力。机器学习使计算机能够在没有明确编程的情况下进行操作。深度学习,是机器学习的一个子领域,使计算机能够从经验中不断学习。
过去十年的一些发展使得在机器视觉中应用深度学习技术成为现实。“基于神经网络的新技术,图形处理单元(GPU)足够强大的计算能力以及丰富的数据,现在我们已经可以使用人工智能进行图像处理。”来自ViDi Systems业务发展部门的Olivier Despont谈道。该公司2017年4月已被康耐视公司收购,其主要产品是基于深度学习的工业图像分析软件。
深度学习为传统的机器视觉技术带来了希望,因为它与使用基于规则方法的传统图像处理软件不同。“AI使我们在遇到不容易表征或非线性的应用时,赋予机器更高水平的可重复性。”FISBA LLC定制光学系统销售总监Wallace Latimer说:“如果把线性算法比喻成创建一个非常窄的桶,那么AI 或深度学习就是创造更大的桶,可以接受更多的变化。通过更宽泛的接受度,您可以专注于最重要的事,减少投入的变化。”
目前,机器视觉用户已经可以在市场上找到深度学习系统软件。例如,第一款深度学习工业图像分析软件ViDi Suite已经投入商业运营。通过与标准图像处理库集成的软件,它可以像小孩子一样进行学习。
“你不会用一个基于规则的方式跟孩子解释房子是什么。” Despont说,“通过很少的例子,即使在年幼的时候,我们的大脑也能够认知到房子是什么。在这方面,我们的深度学习系统与人类大脑运作相似。”
相较于传统机器视觉解决方案,深度学习的另一个优点是可以减少开发机器视觉程序所需的时间。“通常来说,大多数机器视觉应用程序需要60多天的软件开发和可行性测试,而采用ViDi Suite半天就可以完成开发。” Despont说。
与建构在“服务器群组”基础上的AI系统不同(例如由Facebook、Google和IBM开发的软件),ViDi使用单个高端NVIDIA GPU在几分钟内就可对系统进行训练。根据Despont的说法,这会节省大量时间,例如使用IBM Watson来编程和参数化可能需要几天甚至几个月的时间。
“我们建议从30到50个代表性的优质图像开始教授系统,而不是使用数百万或数十亿个图像。”Despont说,“我们不会将图像发送到基于云的服务器农场进行处理或培训。客户很高兴,他们可以使用一个GPU在一台PC上运行所有内容,并保持其图像的所有权。”
机遇与挑战
深度学习为一些采用传统视觉系统面临挑战的应用带来了希望。 Teledyne Dalsa公司的软件项目经理Bruno Ménard说:“AI真的很适合于食物检查,尤其是当您想要检查甜甜圈或一块显示出明显差异的肉时”。
不仅仅是有机检测应用能从AI中获益,Ménard还引用了传统的缺陷检测应用作为另一个例子。“使用传统算法来编程计算机难以定义缺陷,需要在每次出现新的缺陷时重做设置。” 他说,“但是通过拥有大量样品的人工智能,您最终可以得到一个非常清晰的了解,知道哪些部分是好的,哪些是不好的。”
随着AI在机器视觉方面的兴起,该技术将适用于更多的检查任务,最终超越工业自动化领域。Latimer认为,深度学习在医疗、生命科学、食品、假冒检验和木材分级等行业都将有很好的发展前景。
“在这些应用中都有很多不太容易做出判断的决定点。” Latimer说,“例如,那个苹果还好吗?就很难说出一个线性的规则去判断。而通过深度学习应该可以使许多应用变得更加高效和可重复。”
未来,在医疗诊断、监视、自动驾驶和智慧农业等领域将会更多地引入深度学习技术,以实现检查或地图分析等功能。Despont说:“AI是未来的发展趋势,很快就能帮助人们解决一些复杂的任务,因为计算能力几乎每一年半都翻倍。”
许多机器视觉专业人士已经认识到AI和深度学习将对视觉行业带来重要的影响,但他们认为AI的全部潜力可能至少要在3到5年之后才会爆发。此外,AI也并不是解决所有传统机器视觉和图像处理问题的唯一方法。
Ménard指出了AI系统的两个主要缺点。“首先,你需要大量的培训,你需要创建专家团队,以便于达到下一个级别的分类。”他说,“第二个缺点是一旦被训练完,发现分类失败,就很难解决这个问题。你别无选择,只有再培训一个新的样本。”
人工智能在机器视觉中变得越来越普遍,行业专家建议应该根据企业自身的情况有侧重的发展。 “从利基市场来看,世界各地的谷歌正在将这项技术推向难以置信的投资和细化水平。” Latimer说,“在工业领域,我们可能无法投入如此大规模的时间和资本,因此我们要善于利用它的优势。”
本文来自于《控制工程中文版》(CONTROL ENGINEERING China )2017年8月刊《机器视觉专刊》栏目,原标题为:人工智能对机器视觉的影响。