成员自1984年以来

了解更多

AIA - 推进的视觉+成像已转变为推进自动化协会,愿景+成像,机器人,运动控制和工业AI产业的领先全球自动化贸易188jinbaobo org协会。

内容提交:

工业:
N/A

应用程序:
N/A

如何彻底改变,而不是更换机器愿景

发表于08/20/2019.

 | 作者:Dan McCarthy,特约编辑

在短短10年时间里,人工智能(AI)188金宝搏下载界面已经从实验室里的奇闻异事发展成为我们日常生活中越来越普遍的一部分。尽管我们中的许多人可能没有认识到为我们与智能手机、语音助手、电子商务网站或流媒体服务的日常互动提供动力的人工智能系统,但这些系统肯定认识我们,它们可以越来越准确地预测我们的偏好。

尽管这看起来很诡异,但许多AI系统只是将我们的选择与包含类似选择的结构化数据库进行比较。例如,Netflix的人工智能可以通过交叉引用类似标签的电影,得出我们对黑色电影的偏好。但如果没有这些标签,它将需要深度学习算法和相关图像库来区分黑色电影场景和埃斯特·威廉姆斯(Esther Williams)的游泳序列。

深度学习通常被定义为机器学习的子集(它本身也是人工智能的子集),它使用神经网络和算法,使机器能够在不被明确编程执行特定任务的情况下学习。除了图像,这些数据还可能包括音频文件、业务文档或天气模型。

Within the consumer realm, most applications of deep learning to imagery concern recognition and classification, and they range from frivolous smartphone apps (e.g., Not Hotdog) to the powerful systems that enable Facebook to automatically identify images of the lump of fur on your couch as a cat for later search, reference, and possibly, targeted ad placement.

深度学习还支持谷歌的Vision AI API,该API利用该公司约1万个视觉可识别对象的本地目录,执行相当于在万维网上进行反向图像搜索的功能。谷歌的深度学习平台除了可以列出现有的主题,用于在图像出现的任何地方添加标题外,还可以生成新的图像标签,例如,在每日新闻中出现的随机事件。

人工智能革命从这里开始
While most consumers aren’t interested in what is inside deep learning’s black box so long as it works, the capabilities illustrated by Google’s Vision AI API have clear implications for the machine vision industry, which has relied for decades on fixed rule-based approaches and pass/fail interpretations of image data.

如果基于规则的编程在测量和对准中卓越,深度学习工具使图像数据的分类能够执行复杂的化妆品检查,区分不同的材料,验证程序集,并且通常适应非结构​​化的图像数据。这并不是说深入学习将有一天替代传统的机器视觉,而是扩大其能力。

“深度学习是一种简单而强大的解决方案,在使用人眼中易于检测的应用中,但使用基于规则的方法时,困难,”MVTEC Software GmbH的MVTEC Software GmbH的产品所有者Halcon Library说。

例如,深度学习解决方案可以帮助视觉系统在图像中区分杂草和作物,帮助农民识别并适当调整对策。事实上,Hünerfauth指出,几乎任何涉及天然材料检测的食品工业应用都可以受益于深度学习工具。“设计用于测量或blob分析的基于规则的方法发现这相当困难,但通过深入学习可以很容易地解决这些挑战,”他说。

作为机器学习的一个子集,深度学习技术不仅仅解释图像数据,它还帮助扩展图像数据,使图像处理系统变得更加精确。与传统的机器视觉解决方案依赖开发者来定义和验证目标特征不同,深度学习软件利用了神经网络,这些神经网络和人类智能一样,可以经过训练来区分图像中的特征,同时容忍变化。当系统捕获新图像时,软件识别对象和异常,并将新图像数据分配给适当的类。

“如果你想训练一个神经网络,你只有100张图片,但你需要1000张图片,你可以人工生成,”Teledyne Dalsa的软件总监Bruno Menard说。“这是一种数据增强的形式,”他补充道。

揭开了这个秘密
深度学习并非没有挑战。编译图像库和培训神经网络可以像对象检测或分割等应用程序的编程一样费力,如对象检测或分割。作为响应,MVTEC和Codgex等视觉提供者正在开发更简单的接口和预读读取工具,帮助简化部署Dee Degres学习工具所需的图像库。

另一个挑战是,机器视觉工程师和终端用户往往不像消费者那样愿意忽视黑盒内部的内容。Hünerfauth表示:“如果你对系统进行了培训,并取得了良好的结果,那就没问题,一切都很好。”“但如果结果是错误的,就很难解释原因,在某些行业,这是非常难以接受的。所以,我们必须把黑盒子变成灰盒子,以便向这些客户提供更好的反馈,并试图解释里面发生了什么。”

在这里,谷歌的研究也可以提供见解。该公司最近与Openai合作,探索如何通过机器视觉系统观看世界时所看到的方式 - 或者相反。利用他们称之为“激活atlases”,协作者正在绘制单个算法如何激活,以将抽象形状,颜色和模式转换为可识别的图像。通过有效地抬起盖子的黑匣子,其中视觉数据算法得出结论,研究旨在支持更强大的算法的发展。这种见解可能在深度学习的机器视觉应用中证明有益,这为验证图像进行了更高的标准。

互补技术
基于其强大的能力和适应性,深度学习将彻底改变机器视觉,而不是取代它。它们是互补的技术。机器视觉在图像数据中识别几何图案和边缘的能力,仍然是实现高精度测量亚像素精度的最佳方法。深度学习有望通过引入一种类似人类的判断和从图像数据中学习的能力,扩展该学科的能力。但深度学习仍然受益于人类训练师——尤其是一位精通传统机器视觉技术的训练师。经验丰富的工程师通常会发现他们的应用专业知识在优化深度学习的学习能力方面很有价值。