未来已来——解读人工智能和深度学习对机器视觉的影响 / 四六文摘

摘要

通过采用深度学习技术和人类用于发展大脑的其他功能，在机器视觉中融入人工智能将使机器思考得更像人类。

当20世纪50年代出现了“思维机器”的概念之后不久，人们就开始对人工智能（AI）领域发出了不安的警告。自从1968年的标志性电影“2001：太空漫游”到2014年的科幻大片“机械姬 Ex Machina”，对“机器崛起”的恐惧一直在流行文化中发酵着。

虽然AI仍然没有像人们担心的那样“接管”社会，但是随着数据存储和处理能力的提高，像IBM Watson这样的认知系统的开发使得未来代替人类决策的猜测成为可能。不过目前而言，大多数AI的迭代处理还是诸如对象识别等更为“温和”的任务。

AI技术的运用，将使机器视觉能够具有超越现有解决方案的能力，胜任更具有挑战性的应用。但是加入AI的机器视觉是否已经做好准备用于工业应用呢？

深度学习能力

AI在机器视觉中的适用性依赖于机器学习技术，更准确的说是深度学习能力。从最广泛的层面上来说，AI可以被定义为计算机模拟人类智能的能力。机器学习使计算机能够在没有明确编程的情况下进行操作。深度学习，是机器学习的一个子领域，使计算机能够从经验中不断学习。

过去十年的一些发展使得在机器视觉中应用深度学习技术成为现实。“基于神经网络的新技术，图形处理单元（GPU）足够强大的计算能力以及丰富的数据，现在我们已经可以使用人工智能进行图像处理。”来自ViDi Systems业务发展部门的Olivier Despont谈道。该公司2017年4月已被康耐视公司收购，其主要产品是基于深度学习的工业图像分析软件。

深度学习为传统的机器视觉技术带来了希望，因为它与使用基于规则方法的传统图像处理软件不同。“AI使我们在遇到不容易表征或非线性的应用时，赋予机器更高水平的可重复性。”FISBA LLC定制光学系统销售总监Wallace Latimer说：“如果把线性算法比喻成创建一个非常窄的桶，那么AI 或深度学习就是创造更大的桶，可以接受更多的变化。通过更宽泛的接受度，您可以专注于最重要的事，减少投入的变化。”

目前，机器视觉用户已经可以在市场上找到深度学习系统软件。例如，第一款深度学习工业图像分析软件ViDi Suite已经投入商业运营。通过与标准图像处理库集成的软件，它可以像小孩子一样进行学习。

“你不会用一个基于规则的方式跟孩子解释房子是什么。” Despont说，“通过很少的例子，即使在年幼的时候，我们的大脑也能够认知到房子是什么。在这方面，我们的深度学习系统与人类大脑运作相似。”

相较于传统机器视觉解决方案，深度学习的另一个优点是可以减少开发机器视觉程序所需的时间。“通常来说，大多数机器视觉应用程序需要60多天的软件开发和可行性测试，而采用ViDi Suite半天就可以完成开发。” Despont说。

与建构在“服务器群组”基础上的AI系统不同（例如由Facebook、Google和IBM开发的软件），ViDi使用单个高端NVIDIA GPU在几分钟内就可对系统进行训练。根据Despont的说法，这会节省大量时间，例如使用IBM Watson来编程和参数化可能需要几天甚至几个月的时间。

“我们建议从30到50个代表性的优质图像开始教授系统，而不是使用数百万或数十亿个图像。”Despont说，“我们不会将图像发送到基于云的服务器农场进行处理或培训。客户很高兴，他们可以使用一个GPU在一台PC上运行所有内容，并保持其图像的所有权。”

机遇与挑战

深度学习为一些采用传统视觉系统面临挑战的应用带来了希望。 Teledyne Dalsa公司的软件项目经理Bruno Ménard说：“AI真的很适合于食物检查，尤其是当您想要检查甜甜圈或一块显示出明显差异的肉时”。

不仅仅是有机检测应用能从AI中获益，Ménard还引用了传统的缺陷检测应用作为另一个例子。“使用传统算法来编程计算机难以定义缺陷，需要在每次出现新的缺陷时重做设置。” 他说，“但是通过拥有大量样品的人工智能，您最终可以得到一个非常清晰的了解，知道哪些部分是好的，哪些是不好的。”

随着AI在机器视觉方面的兴起，该技术将适用于更多的检查任务，最终超越工业自动化领域。Latimer认为，深度学习在医疗、生命科学、食品、假冒检验和木材分级等行业都将有很好的发展前景。

“在这些应用中都有很多不太容易做出判断的决定点。” Latimer说，“例如，那个苹果还好吗？就很难说出一个线性的规则去判断。而通过深度学习应该可以使许多应用变得更加高效和可重复。”

未来，在医疗诊断、监视、自动驾驶和智慧农业等领域将会更多地引入深度学习技术，以实现检查或地图分析等功能。Despont说：“AI是未来的发展趋势，很快就能帮助人们解决一些复杂的任务，因为计算能力几乎每一年半都翻倍。”

许多机器视觉专业人士已经认识到AI和深度学习将对视觉行业带来重要的影响，但他们认为AI的全部潜力可能至少要在3到5年之后才会爆发。此外，AI也并不是解决所有传统机器视觉和图像处理问题的唯一方法。

Ménard指出了AI系统的两个主要缺点。“首先，你需要大量的培训，你需要创建专家团队，以便于达到下一个级别的分类。”他说，“第二个缺点是一旦被训练完，发现分类失败，就很难解决这个问题。你别无选择，只有再培训一个新的样本。”

人工智能在机器视觉中变得越来越普遍，行业专家建议应该根据企业自身的情况有侧重的发展。 “从利基市场来看，世界各地的谷歌正在将这项技术推向难以置信的投资和细化水平。” Latimer说，“在工业领域，我们可能无法投入如此大规模的时间和资本，因此我们要善于利用它的优势。”

本文来自于《控制工程中文版》（CONTROL ENGINEERING China ）2017年8月刊《机器视觉专刊》栏目，原标题为：人工智能对机器视觉的影响。

未来已来——解读人工智能和深度学习对机器视觉的影响

相关推荐