基于自动编码器和聚类的异常检测制造技术

技术编号：36068319 阅读：12 留言：0更新日期：2022-12-24 10:36

本发明专利技术公开了数字图像中的对象的异常检测方法，其中，将该对象的图像通过自动编码器进行编码和解码，然后在对象的输入图像与该对象的重建图像之间计算逐像素差值。逐像素差值高于阈值的像素被认为是相异像素，并且测试相异像素簇的存在。相异像素簇被认为是表示异常。常。常。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】基于自动编码器和聚类的异常检测

[0001]本专利技术涉及图像中的异常检测。更具体地，本专利技术涉及数字图像中的异常(例如，对象的异常)的检测和定位。

技术介绍

[0002]正常数据与异常数据之间的区别是具有许多应用的不断增长的搜索领域。
[0003]其中之一是异常检测和定位。其目的是自动检测图像是“正常”还是“异常”，并且当检测到异常时，对该异常进行定位。其具体应用是在生产线中检测正常产品或异常产品。这可以通过拍摄各个产品的照片并自动检测该照片是对应于正常产品还是对应于异常产品来完成。例如，异常检测和定位可以被用于工业中的质量控制。这种质量控制包括在生产线的输出处拍摄产品的图像，然后根据数字图像自动验证产品中是否存在异常以及产品位于何处。这代表了对工业的非常显著的改进，因为人工检查是麻烦且昂贵的。然而，自动异常检测需要既精确又可靠，以满足工业标准并且高效地取代员工的视觉检查。
[0004]对什么是“正常”和什么是“异常”的自动检测是众所周知的难题，已经采用不同的方式来解决该难题，这通常依赖于学习和生成一个或更多个数据模型。
[0005]解决这个问题的第一种方法是执行监督学习。监督学习包括来自被标记的输入数据的学习模型：各个学习样本皆与指示该样本是正常还是异常的标签相关联。异常样本也可以与指示异常类型的标签相关联。一旦对该模型进行了训练，就可以使用它来将新样本分类为正常或异常。这种方法的问题是所述模型只能学习已经遇到的异常。因此，它们存在着有异常但其异常先前未被学习的样本将被分类为正常的很大风...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现方法(400a、400b、400c、400d)，所述计算机实现方法包括以下步骤：
‑
获得(410)由数字摄像机拍摄的对象的输入数字图像；
‑
使用自动编码器(320)将所述输入数字图像编码(420)成压缩图像，并且将所述压缩图像解码(421)成重建图像；
‑
计算(430)所述重建图像与所述输入数字图像之间的逐像素相异性；
‑
将具有高于相异性阈值的逐像素相异性的像素检测(440)作为相异像素；
‑
检测(450)至少一个相异像素簇的存在或不存在；
‑
如果检测到相异像素簇的存在，则计算(460)所述相异像素簇的凸包络，所述凸包络表示异常。2.根据权利要求1所述的计算机实现方法(400c)，所述计算机实现方法还包括以下步骤：使用(480c)有监督多类图像分类机器学习引擎，来将所述输入数字图像在所述凸包络(744)内的像素分类成异常类。3.根据权利要求1所述的计算机实现方法(400d)，所述计算机实现方法还包括以下步骤：使用所述输入图像在所述凸包络(744)内的所述像素来训练有监督多类图像分类机器学习引擎以检测异常。4.根据权利要求3所述的计算机实现方法(400d)，如果检测到相异像素簇，则所述计算机实现方法还包括以下步骤：
‑
向用户显示(490d)所述输入图像在所述凸包络(744)内的所述像素；
‑
从所述用户接收(491d)异常标签；
‑
使用(492d)所述输入图像在所述凸包络内的所述像素以及所述标签来训练所述有监督多类图像分类机器学习引擎以检测异常。5.根据权利要求4所述的计算机实现方法，所述计算机实现方法还包括以下步骤：在所述输入图像中并且在解压缩图像中，向所述用户同时显示所述凸包络内的所述像素。6.根据权利要求1至5中的一项所述的计算机实现方法，其中，像素簇是由以下来限定的：
‑
相异像素(610、611、612、613、614、以及615)的连通图，这些相异像素中的各个相异像素皆位于等于或小于最大阈值距离(ε)的距离处，所述最大阈值距离是等于或小于最小像素阈值的多个相异像素的最大阈值距离，所述连通图的边缘等于所述最大阈值距离；
‑
相异像素(626、627)，所述相异像素不属于所述连通图并且位于等于或小于属于所述连通图的相异像素的所述最大阈值距离(ε)的距离处。7.根据权利要求1至6中的一项所述的计算机实现方法(400b、400c、400d)，所述计算机实现方法包括以下步骤：计算所述输入数字图像中的对象的分割掩模(470b)，并且其中，计算(430)逐像素相异性的所述步骤是仅针对属于所述分割掩模的像素来执行的。8.根据权利要求7所述的计算机实现方法，其中，计算所述分割掩模的所述步骤包括：使用分割自动编码器来生成所述重建图像的阿尔法通道，所述阿尔法通道表示所述分割掩模，并且其中，所述分割自动编码器已经在包括以下的训练阶段期间进行了训练：
‑
对于训练集中的对象类的各个参考实例对象，获得所述实例对象的数字图像、以及限定所述实例对象的分割掩模的参考阿尔法通道；
‑
使用所述训练集对所述自动编码器进行训练，以最小化损失函数，所述损失函数对于
参考实例对象来说包括这样的差值，即，所述自动编码器的输出端处的解压缩向量的阿尔法通道的像素与限定所述参考实例对象的所述分割掩模的所述参考阿尔法通道的像素之间的差值。9.根据权利要求8所述的计算机实现方法，其中，所述损失函数是分别表示以下内容的三项的加权和：
‑
Kullbak
‑
Leibler(KL)散度；
‑
所述输入图像的像素与所述重建图像的像素之间的差值；
‑
所述自动编码器的输出端处的所述解压缩向量的所述阿尔法通道的像素与限定所述参考实例对象的所述分割掩模的所述参考阿尔法通道的像素之间...

【专利技术属性】
技术研发人员：G，
申请(专利权)人：阿诺特尔布莱恩公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人