文/Takashi Someda
机器视觉技术随着市场不断发展。例如,基于模式匹配的机器视觉算法,已被诸如深度学习之类的人工智能(AI)技术所取代。但是,除了深度学习之外,其他类型的AI软件也为机器视觉系统提供了独特的优势。例如,稀疏建模提出了一种新颖的数据建模方法,对于使用小型数据集的基于图像的检测任务特别有用。本文将介绍这种数据建模方法,并将其与深度学习技术进行了比较。
深度学习与稀疏建模
深度学习是机器学习的一个子集,它试图通过多层(因此称为深度)提取推理,尝试从原始数据中合成表达,类似于人脑如何学习或处理信息。默认情况下,此过程需要大量数据。深度学习方法能够理解数据中的复杂结构,因此适合异常检测。但是,深度学习并不适合所有机器视觉应用。
通常,有效部署深度学习所需的条件难以达到,包括大量有缺陷的样本数据,以及用于分析数据的重要基础架构。深度学习决策过程的黑盒子性质(尤其是在使用无监督学习时)具有另一项潜在的缺点,因为丢失了显示带来解决方案的多层处理的能力。
丰田公司建立了著名的“5why分析法”,该方法提供通过询问多层“为什么”,来确定一个问题根本原因的方法。虽然深度学习提供一种探测出缺陷是什么的有效方法,但并不能回答为什么那是缺陷的问题。如果探测异常以防止重复发生是目标,知道为什么与知道是什么同等重要,那么深度学习在这里就不尽人意了。
另一方面,基于稀疏建模的AI可以从少量数据中提供学习和推理提取能力,并且可以在人类语境下进行解读,但不会受困于前述性质,仍然提供准确的结果。稀疏建模的基本原理是:大多数数据特征无关紧要,并且可以从相对少量的基本信息中获得洞察力。
深度学习专注于通过使用前向问题方法,分析大型数据集的输入x和输出y之间的函数或对应关系,该方法观察输入x以推断输出y(或如何预测输出y)。相反,稀疏建模使用逆问题逻辑,从少量综合原因中分析复杂数据,该逻辑观察输出y,从可观察的数据中提取因果关系,或推断输入x导致y的原因。由于它本质上使用的数据较少,因此在稀疏建模中处理数据所需的总能量和计算能力,比深度学习要少。
使用稀疏建模的一个潜在的众所周知的例子,是国际事件视界望远镜捕获到黑洞的第一张图像。该团队使用甚长基线干涉测量(VLBI)捕获了黑洞的部分图像,这些在天文尺度上产生非常小的特征(见图1)。在图1中,U和V代表散布在地球表面的单个射电望远镜的物理位置。随着地球自转,相对于远空间的望远镜位置逐渐变化。每条迹线代表特定望远镜的位置变化。由于分布在地球上的10多个射电望远镜进行了黑洞成像,因此图1显示了10条以上的迹线(更多信息请访问http://bit.ly/VSD-SPARSE)。该数据帮助生成了目前已知的第一张黑洞图像。
图1:事件视界望远镜背后的团队,使用甚长基线干涉测量(VLBI)捕获了黑洞的部分图像,这些在天文尺度上产生非常小的特征。这些观察到的数据帮助生成了已知的第一张黑洞图像。
稀疏建模提供的另一个好处是无需图形处理器(GPU),就可以创建用于在边缘设备上进行训练和推理的便携式工具。换句话说,稀疏建模软件可以在中央处理器(CPU)上运行,没有GPU,从而可以在具有旧硬件的站点中部署,或集成到现有硬件中。
另一方面,深度学习可能需要云平台来处理用于训练和重新训练AI模型的工作负载,从而迫使用户将敏感数据发送给外部源。这样做可能导致网络安全风险成为一个主要问题。利用稀疏建模,可以执行边缘训练,无需将数据发送到外部位置(例如云服务器),从而减少了对数据安全性的担忧。无需互联网连接或机器间数据传输即可设置检查目标或图像条件的新配置,可以提供机密数据保护。
视觉检测使用案例
日本HACARUS公司提供稀疏建模软件,并且已经在不同领域开发了定制的客户端解决方案。该公司的视觉检测软件SPECTRO适用于基材、精密零件、金属、塑料和食品检测应用。该软件提供易于理解的输出,例如热图可视化,提供了透明的可解释性和交并比(IoU)/异常评分,可以进行更有效的评估和检测。SPECTRO CORE采用SPECTRO的检测算法,允许系统集成商和机器制造商将SPECTRO集成到工厂设备或边缘设备中。
光伏太阳能电池的制造缺陷(例如材料缺陷、细栅线断开、微裂纹和电池退化)可能导致太阳能电池板上出现热点。如果不加以控制,这些热点甚至可能引起火灾。美国康奈尔大学使用卷积神经网络和支持向量机技术进行了一项探测缺陷的研究。为了进行比较,HACARUS将SPECTRO应用于同一问题,以针对这些方法对稀疏建模进行基准测试(见图2)。
图2:该性能评估图比较了支持向量机、卷积神经网络和稀疏建模技术。
SPECTRO的评估结果很有前途,该系统使用的图像减少了92.5%,同时提供了90%的更高准确性。该软件在训练和预测方面也都快得多。尽管结果会因具体情况而异,但在错误数据很少见、且不足以使用其他技术建立模型的行业中,准确探测异常所需的图像数量相对较少的情况下,稀疏建模可能比较有吸引力。
在涉及建筑材料生产商的另一个案例中,该公司寻求一种解决方案,在不更改任何流程或机械的情况下,补充其现有的检查系统。具体来说,该公司原有的检查系统存在未能发现石膏天花板的一项特定缺陷的问题(见图3)。解决此问题将有助于提高产品质量,降低与缺陷相关的成本,从而使公司受益。HACARUS公司使用200张1600×1200像素的良好产品样本的训练图像,对10000个产品样本运用了SPECTRO 检测AI。训练时间大约花费了两分钟以生成模型,其预测时间约为每幅图像300ms,准确度为99%。无需在该公司的本地硬件(CPU)上使用GPU即可完成此操作。
图3:HACARUS公司对一家受困于石膏天花板检查的建筑材料公司的10000个产品样品运用SPECTRO检查AI,其准确率达到了99%。
结语
当有足够的数据可用,可以准备标注,以及其他可能约束的权重相对较低时,深度学习表现良好。但是,尽管基于稀疏建模的AI相对未知,但其即使从少量数据中也可以产生可解读的良好结果。
基于数据的可用性、时间和成本,该模型可以是深度学习的替代解决方案,或者是唯一的解决方案。另外,能够在边缘设备上进行推理和训练的能力,使得基于稀疏建模的AI可以更轻松地用于工业4.0和物联网技术。