在阿尔法通道中的基于自动编码器的分割掩模生成制造技术

技术编号：36582816 阅读：15 留言：0更新日期：2023-02-04 17:43

本发明专利技术公开了一种能够为数字图像中的对象生成分割掩模的设备。为此，该设备包括处理逻辑单元，该处理逻辑单元被配置为使用先前训练的自动编码器对图像进行编码，并对图像进行解码，从而生成附加阿尔法通道，所述附加阿尔法通道定义了分割掩模。法通道定义了分割掩模。法通道定义了分割掩模。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】在阿尔法通道中的基于自动编码器的分割掩模生成

[0001]本专利技术涉及在数字图像中生成对象的分割掩模(segmentation mask)的领域。更具体地说，涉及在图像中生成可以表示正常对象或包括缺陷的对象的分割掩模。

技术介绍

[0002]如今，数字图像是越来越多的应用的基础。数字图像可以从大量源中拍摄，并表示各种事物，诸如，风景、对象或人。当对象在图像上被表示为在背景后面时，将该对象从背景中分离出来对许多应用很有用，以便仅对该对象执行图像分析而不受背景的影响。例如，在工业中与质量控制有关的应用就是这种情况，其中对象中是否存在缺陷、以及对缺陷的表征与定位是基于对象的图像自动执行的。在这种情况下，如果首先将对象从背景中分离出来，使得检测仅对该对象执行，而不受背景内容的影响，那么对缺陷的检测效率会更高。对象与背景之间的分离通常是通过定义分割掩模来完成的。分割掩模是指示图像中属于目标对象的像素和不属于该对象的像素(例如，背景像素)的掩模。
[0003]通常，自动分割是通过以下步骤执行的：训练有监督机器学习引擎，以使用包括一种类型的对象的训练集和对应的掩模来生成这种类型的对象的分割掩模。在训练阶段结束时，该有监督机器学习引擎必须能够从新图像中自动生成这种对象的分割掩模，即，当提供了未知图像时，必须能够将目标类型的对象从图像的背景中分离。因此，自动生成分割掩模的一般挑战包括将来自给定类型的对象从图像的背景中正确分离。然而，出于多种原因，这可能是一项艰巨的任务。首先，同一类型的对象可能是在不同的条件下(光线、取向、变...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于训练至少一个自动编码器(420)的计算机实现的方法(500)，所述方法包括：
‑
对于训练集中的对象类的各个参考实例对象，获得(510)所述参考实例对象的数字图像和定义所述参考实例对象的分割掩模的参考阿尔法通道；以及
‑
使用所述训练集训练(520)所述自动编码器以使损失函数最小化，所述损失函数包括针对参考实例对象的在所述自动编码器的输出处的解压缩向量的像素的阿尔法通道与定义所述参考实例对象的分割掩模的所述参考阿尔法通道之间的差值；其中，所述损失函数是三个项的加权和，所述三个项分别表示：
‑
Kullbak
‑
Leibler(KL)散度；
‑
输入向量的像素与解压缩向量的像素之间的差值；
‑
在所述自动编码器的所述输出处的所述解压缩向量的所述阿尔法通道的像素与定义所述参考实例对象的所述分割掩模的所述参考阿尔法通道的像素之间的所述差值。2.根据权利要求1所述的计算机实现的方法，其中，所述输入向量的像素与所述解压缩向量的像素之间的所述差值与所述参考阿尔法通道相乘。3.根据权利要求1至2中的一项所述的计算机实现的方法，其中，所述训练包括在所述训练集上的多次训练迭代，并且表示所述解压缩向量的所述阿尔法通道的像素与所述参考阿尔法通道的像素之间的差值的所述项的权重在连续迭代中减小。4.根据权利要求1至3中的一项所述的计算机实现的方法，所述方法包括：
‑
按比例缩小所述训练集的每个数字图像和每个对应的参考阿尔法通道，以针对所述训练集的每个参考实例对象，获得为多个相应分辨率的多个重新缩放的数字图像和多个重新缩放的参考阿尔法通道；
‑
分别使用为所述多个相应分辨率的所述重新缩放的数字图像和所述重新缩放的参考阿尔法通道来训练多个自动编码器。5.根据权利要求1至4中的一项所述的计算机实现的方法，其中，所述自动编码器是变分自动编码器。6.一种用于训练至少一个自动编码器的设备，所述设备包括至少一个处理逻辑单元，所述至少一个处理逻辑单元被配置用于：
‑
对于训练集中的对象类的各个参考实例对象，获得(510)所述参考实例对象的数字图像和定义所述参考实例对象的分割掩模的参考阿尔法通道；
‑
使用所述训练集训练(520)所述自动编码器以使损失函数最小化，所述损失函数包括针对参考实例对象的在所述自动编码器的输出处的解压缩向量的像素的阿尔法通道与定义所述参考实例对象的所述分割掩模的所述参考阿尔法通道之间的差值，其中，所述损失函数是三个项的加权和，所述三个项分别表示：
‑
Kullbak
‑
Leibler(KL)散度；
‑
输入向量的像素与解压缩向量的像素之间的差值；
‑
在所述自动编码器的所述输出处的所述解压缩向量的所述阿尔法通道的像素与定义所述参考实例对象的所述分割掩模的所述参考阿尔法通道的像素之间的所述差值。7.一种用于训练至少一个自动编码器的计算机...

【专利技术属性】
技术研发人员：G，
申请(专利权)人：阿诺特尔布莱恩公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人