一种基于制造技术

技术编号:39734918 阅读:8 留言:0更新日期:2023-12-17 23:37
本发明专利技术涉及数字图像处理技术领域,具体公开了一种基于

【技术实现步骤摘要】
一种基于Deformable

DAB

DETR的高透光菲涅尔透镜实时检测方法


[0001]本专利技术涉及深度学习和数字图像处理
,具体涉及一种基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法


技术介绍

[0002]本专利技术
技术介绍
中公开的信息仅仅旨在增加对本专利技术的总体背景的理解,而不必然被视为承认或以任何形式暗示该信息构成已经成为本领域一般技术人员所公知的现有技术

[0003]高透光菲涅尔透镜在太阳能发电

投影仪

显示器和安防等领域广泛应用

目前在菲涅尔透镜自动化生产过程中,对菲涅尔透镜进行实时检测就显得尤为重要,即能够快速精准地在高透光菲涅尔透镜图像中框选出缺陷的具体位置(如黑点

毛絮

划痕等)并对其进行分类

然而目前对高透光菲涅尔透镜缺陷小目标的检测效率低,不够精准,影响了菲涅尔透镜的产能

[0004]由于菲涅尔透镜是由注塑机生产并通过激光切割机将其从亚克力板中切割形成的一面光滑一面粗糙的刻有同心螺纹的一种透镜,本身具有反光的特性,且形状不规则,因此不易拍摄出高质量的菲涅尔透镜图像,这对菲涅尔透镜数据集的制作造成了不小的麻烦;并且透镜表面的缺陷均为小目标,因此需要稳定且强大的目标检测算法,使用传统的图像处理算法并人工提取图像特征已无法满足对高透光菲涅尔透镜实时检测的要求

[0005]随着深度学习技术的发展以及大网络模型的应用,目标检测技术诞生了一系列的方法,代表性的包括基于单阶段的目标检测技术:
YOLO、SSD、RetinaNet
;基于双阶段的目标检测技术:
RCNN、Fast RCNN、Faster RCNN、Cascade RCNN


然而无论是单阶段还是双阶段,这些目标检测技术都需要人工制定
anchor
先验框和
NMS
(非极大值抑制技术)对预测框进行筛选,因此不能算作是端到端的目标检测算法

[0006]近期随着
DETR
算法的提出,将
Transformer
架构应用于视觉领域成为一种新的尝试,该方法不需要
NMS
等后处理技术,依靠
Transformer
中的编码器和解码器对特征提取后的图像进行特征增强与学习,训练出较好的网络模型用于实际检测中

然而目前的
DETR
算法还不够成熟,计算复杂度高,收敛速度缓慢,依旧无法部署在实时的目标检测应用中


技术实现思路

[0007]针对以上提出的问题,本专利技术结合
DAB

DETR

Dynamic Anchor Boxes
)与可变形的多头注意力机制提出了基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法,用于检测覆盖在高透光菲涅尔透镜表面的各种缺陷,实现实时的菲涅尔透镜的目标检测

[0008]为了达到以上目的,本专利技术采取以下技术方案:一种基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法,包括以下步骤:
S1
:制作高透光菲涅尔透镜数据集,选用适配的工业相机在背光环境下进行拍摄,并对拍摄的图像进行图像增强处理;
S2
:图像特征提取:采用
ResNet50

v2
作为主干网络对预处理后的图像进行多尺度特征提取,选取不同尺度特征序列输入至网络的编码器中;
S3
:图像特征增强:编码器在2‑
stage
模式下对特征序列做特征增强处理,通过正余弦位置编码并利用权重矩阵生成增强后的特征序列,将输出结果输入到解码器中;
S4
:图像特征学习:通过可变形的自注意力机制与交叉注意力机制,在每层输出包括将宽和高加入到位置先验中的四维预测框的偏移量,并矫正其位置与大小;
S5
:图像特征匹配:采用匈牙利匹配算法进行二分匹配得到高透光菲涅尔透镜训练模型,根据获得的训练模型对待检测的高透光菲涅尔透镜进行测试

[0009]进一步的,在步骤
S1
中,使用包括翻转

裁切

抖动的几何变换和包括高斯噪声

直方图均衡化的像素变换方式对拍摄的图像进行图像增强处理

[0010]进一步的,在步骤
S2
中,图像数据的所述预处理具体包括以下步骤:采用包括缩放

平移

旋转额几何变换方法以及加入包括高斯噪声

直方图均衡化的像素变换方法对小样本进行扩充操作;引用
YOLO v5
中的
Mosaic
数据增强对高透光菲涅尔透镜数据集做进一步增强,提高模型的泛化能力

[0011]进一步的,在步骤
S2
中,所述多尺度特征图提取包括以下步骤:由主干网络
ResNet50

v2
选取适用于高分辨率图像的第
C3、C4

C5
层的特征图;将
S23
中选取的特征图输入至
Transformer
模型的编码器中;其中,所述
Transformer
模型的编码器包括若干个层,每一层均由多头自注意力模块和前馈网络模块组成,每层均会进行残差连接和归一化

[0012]进一步的,在步骤
S3
中,所述特征增强处理的具体步骤包括:将输入的特征图使用的卷积将其压缩至
ꢀꢀ
,得到新的特征图,然后将压缩后的特征图展平得到特征序列;对位置信息进行正余弦位置编码,公式如下所示:;其中为温度参数,设定值为
20

NLP
中一般设为
1000

CV
中设定为
20
效果更好),下标 和表示编码向量中的指标;将与
PE
相加,获得特征序列,再通过三个权重矩阵

和分别转化为
Query
向量
、Key
向量和
Value
向量,点积
Query
向量和
Key
向量得到权重矩阵,权重矩阵乘以
Value
向量得到多头注意力本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法,其特征在于:包括以下步骤:
S1
:制作高透光菲涅尔透镜数据集,选用适配的工业相机在背光环境下进行拍摄,并对拍摄的图像进行图像增强处理;
S2
:图像特征提取:采用
ResNet50

v2
作为主干网络对预处理后的图像进行多尺度特征提取,选取不同尺度特征序列输入至网络的编码器中;
S3
:图像特征增强:编码器在2‑
stage
模式下对特征序列做特征增强处理,通过正余弦位置编码并利用权重矩阵生成增强后的特征序列,将输出结果输入到解码器中;
S4
:图像特征学习:通过可变形的自注意力机制与交叉注意力机制,在每层输出包括将宽和高加入到位置先验中的四维预测框的偏移量,并矫正其位置与大小;
S5
:图像特征匹配:采用匈牙利匹配算法进行二分匹配得到高透光菲涅尔透镜训练模型,根据获得的训练模型对待检测的高透光菲涅尔透镜进行测试
。2.
根据权利要求1所述基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法,其特征在于:在步骤
S1
中,使用几何变换与像素变换方式对拍摄的图像进行图像增强处理
。3.
根据权利要求1所述基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法,其特征在于:在步骤
S2
中,图像数据的所述预处理具体包括以下步骤:采用包括缩放

平移

旋转的几何变换方法以及加入包括高斯噪声

直方图均衡化的像素变换方法对小样本进行扩充操作;引用
YOLO v5
中的
Mosaic
数据增强对高透光菲涅尔透镜数据集做进一步增强,提高模型的泛化能力
。4.
根据权利要求1所述基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法,其特征在于:在步骤
S2
中,所述多尺度特征图提取包括以下步骤:由主干网络
ResNet50

v2
选取适用于高分辨率图像的第
C3、C4

C5
层的特征图;将
S23
中选取的特征图输入至
Transformer
模型的编码器中;其中,所述
Transformer
模型的编码器包括若干个层,每一层均由多头自注意力模块和前馈网络模块组成,每层均会进行残差连接和归一化
。5.
根据权利要求1所述基于
Deformable

DAB

DETR
的高透光菲涅尔透镜实时检测方法,其特征在于:在步骤
S3
中,所述特征增强处理的具体步骤包括:将输入的特征图使用的卷积将其压缩至
ꢀꢀ
,得到新的特征图,然后将压缩后的特征图展平得到特征序列;对位置信息进行正余弦位置编码,公式如下所示:;其中为温度参数,下标 和表示编码向量中的指标;
D
表示特征图的维度;将与
PE
相加,获得特征序列,再通过三个权重矩阵

和分别转化为
Query


、Key
向量和
Value
向量,点积
Query
向量和
Key
向量得到权重矩阵,权重矩阵乘以
Valu...

【专利技术属性】
技术研发人员:李广良庞少鹏钟成卫李正平
申请(专利权)人:山东宇影光学仪器有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1