一种基于对抗互补制造技术

技术编号:39599185 阅读:7 留言:0更新日期:2023-12-03 19:59
本发明专利技术公开了一种基于对抗互补

【技术实现步骤摘要】
一种基于对抗互补UNet的工业图像特征提取方法


[0001]本专利技术属于图像特征提取领域,尤其涉及一种基于对抗互补
UNet
的工业图像特征提取方法


技术介绍

[0002]机器视觉逐渐渗入社会生活的方方面面,在人脸识别

图片识别

视频监控
、3C
应用等各领域几乎都能看到机器视觉的身影,对于工业领域而言,机器视觉的应用更是大大降低了高危作业的危险系数,保障了工业生产的安全性和高效性

[0003]机器视觉在工业产品缺陷检测中非常重要,因为它可以实现高效

准确和一致的自动检测和分类;机器视觉系统可以自动检测缺陷,免去了人工检测的繁琐和耗时的过程,这样可以提高生产效率,减少人力成本;机器视觉系统能够实现非常高的准确性,因为它可以进行比人类更细致和准确的检测,这样可以减少因检测误差而引起的产品返工及重复生产成本;同时,机器视觉系统可以在异常情况下保证同样的检测结果,无论是白班还是夜班,或是不同的操作员;最后,机器视觉系统可以学习和不断优化算法和模型,使缺陷检测和分类更加精准和智能化,进一步提高产品检测的质量和效率

[0004]最近几年,随着深度学习的流行,计算机视觉领域涌现出了许多优秀的语义分割算法用于图像特征的提取

目前主流的图像特征提取模型几乎都是基于
UNet
进行变体的:例如,将残差模块加入到原始的
UNet
网络中,得到了深度
ResUNet
;将注意力门
(Attention Gate)
加入到
UNet
的解码器中,提出了
Attention UNet
模型,该模型在没有引入大量模型参数的情况下,通过抑制不相关背景区域的特征响应来突出被分割目标;将空洞卷积加入到
UNet
中,提出了
DinkNet34
模型,该模型在保持分辨率的同时扩大感受野,获得了
DeepGlobe 2018
挑战赛的冠军等等

[0005]但是,目前的基于
UNet
变体的工业图像特征提取方法主要从凸出图像中显著区域角度提高分割结果,忽视了图像中其他区域的特征,进而导致图像特征提取不够充分,最终得到的分割精度不够高,分割结果存在缺陷错位情况


技术实现思路

[0006]本专利技术目的是为了克服现有技术的不足而提供一种基于对抗互补
UNet
的工业图像特征提取方法,具有分割精度高,分割结果精细,工业图像提取特征精准度高的优点

[0007]为达到上述目的,本专利技术采用的技术方案是:一种基于对抗互补
UNet
的工业图像特征提取方法,包括如下步骤:
[0008]S1
对图像预处理后获取数据集;
[0009]S2
将数据集放入原始
UNet
中进行训练得到第一阶段的分割结果;
[0010]S3
设置固定阈值,将第一阶段的分割结果中大于阈值的像素擦除;
[0011]S4
将像素擦除之后的第一阶段的分割结果输入到新的原始
UNet
中进行训练得到第二阶段的分割结果;
[0012]S5
将第一阶段的分割结果以及第二阶段的分割结果融合后得到融合后的结果

[0013]进一步的,所述原始
UNet
包括但不限于
UNet、ResUNet、Attention Unet
以及
UNet

AcoL
[0014]进一步的,基于融合后的结果,对原始
UNet
进行训练后得到优化后的
UNet
模型;
[0015]将数据集输入经过上述优化后的
UNet
模型中进行训练,训练结束后保存网络权值;
[0016]加载网络权值,使用数据集进行测试,计算平均交并比
mIOU
,从而得出最适配的优化后的
UNET
模型

[0017]进一步的,
[0018]其中,
p
ii
为预测正确元素的数量,
p
ij
表示真实值为
i
,被预测为
j
的数量,
p
ji
表示真实值为
j
,预测为
i
的数量,
k
表示要分类的类别数

[0019]进一步的,图像预处理的方法如下:
[0020]首先取一个
512
×
512
的边界框模板,将这个模板在
1500
×
1500
的图像上进行滑动,先将四个角上和最中间的图像裁剪下来,然后依次取四个角上的四个边界框中每相邻两个模板中间的图像;
[0021]去除部分标注错误的图像,最终得到
8960
幅大小为
512
×
512
的图像,按照原始数据集训练集

验证集和测试集的划分,分别得到
8361
幅训练图像
、126
幅验证图像和
433
幅测试图像

[0022]进一步的,第一阶段的分割结果为
P
unet
,假设
X
H
×
W
×
C
表示工业相机采集的图像,
F
unet
表示原始
UNet
的输出特征图,
P
unet
表示原始
UNet
的输出特征图
F
unet
经过
Sigmoid
函数得到的特征图,
σ
(
·
)
表示
Sigmoid
函数,则有
[0023]F
unet

UNet1(X
H
×
W
×
C
)
[0024]P
unet

σ
(F
unet
)。
[0025]进一步的,设置固定阈值为
δ
,将特征图
F
unet
中大于阈值
δ
得像素擦除,得到擦除后的特征图
F'
unet

F'
unet

E(F
unet
,
δ
)
,其中,
E(
·
)
表示固定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于对抗互补
UNet
的工业图像特征提取方法,其特征在于,包括如下步骤:
S1
对图像预处理后获取数据集;
S2
将数据集放入原始
Unet
中进行训练得到第一阶段的分割结果;
S3
设置固定阈值,将第一阶段的分割结果中大于阈值的像素擦除;
S4
将像素擦除之后的第一阶段的分割结果输入到新的原始
Unet
中进行训练得到第二阶段的分割结果;
S5
将第一阶段的分割结果以及第二阶段的分割结果融合后得到融合后的结果
。2.
如权利要求1所述的基于对抗互补
UNet
的工业图像特征提取方法,其特征在于:基于融合后的结果,对原始
UNet
进行训练后得到优化后的
UNet
模型;将数据集输入经过上述优化后的
UNet
模型中进行训练,训练结束后保存网络权值;加载网络权值,使用数据集进行测试,计算平均交并比
mIOU
,从而得出最适配的优化后的
UNet
模型
。3.
如权利要求2所述的基于对抗互补
UNet
的工业图像特征提取方法,其特征在于:其中,
p
ii
为预测正确元素的数量,
p
ij
表示真实值为
i
,被预测为
j
的数量,
p
ji
表示真实值为
j
,预测为
i
的数量,
k
表示要分类的类别数
。4.
如权利要求1所述的基于对抗互补
UNet
的工业图像特征提取方法,其特征在于,图像预处理的方法如下:首先取一个
512
×
512
的边界框模板,将这个模板在
1500
×
1500
的图像上进行滑动,先将四个角上和最中间的图像裁剪下来,然后依次取四个角上的四个边界框中每相邻两个模板中间的图像;去除部分标注错误的图像,最终得到
8960
幅大小为
512
×
512
的图像,按照原始数据集训练集

验证集和测试集的划分,分别得到
8361
幅训练图像
、126
幅验证图像和
433
幅测试图像
。5.
如权利要求1所述的基于对抗互补
UNet
的工业图像特征提取方法,其特征在于:第一阶段的分割结果为
P
unet
,假设
X
H
×
W
×
C
表示工业相机采集的图像,
F
unet
表示原始
UNet
的输出特征图,
P
unet
表示原始
UNet
的输出特征图
F
unet
经过
Sigmoid
函数得到的特...

【专利技术属性】
技术研发人员:周春荣丁际友
申请(专利权)人:苏州梅曼智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1