一种基于视觉处理的振动图像目标检测方法技术

技术编号:37880493 阅读:14 留言:0更新日期:2023-06-15 21:08
本发明专利技术公开了一种基于视觉处理的振动图像目标检测方法,包括:获取振动图像数据集;依据获得的振动图像数据集划分为训练数据集和验证数据集;对训练数据集和验证数据集进行标注,获得标注训练集、标注验证集;依据顺次连接的骨干模块、颈部模块、多尺度特征融合模块、头部模块,建立目标检测网络模型;调用标注训练集对目标检测网络模型进行训练,训练结束获得候选权重;用标注验证集对候选权重性能进行评估,用于获得最优权重;依据载入最优权重的目标检测网络模型对待检测振动图像进行检测,获得振动图像目标检测信息。本发明专利技术提出的目标检测方法同时兼顾了速度和精度,很好的解决了因检测算法仅注重识别到目标而非精确定位目标进而导致的视觉测振任务的偏差较大的问题。进而导致的视觉测振任务的偏差较大的问题。进而导致的视觉测振任务的偏差较大的问题。

【技术实现步骤摘要】
一种基于视觉处理的振动图像目标检测方法


[0001]本专利技术涉及一种基于视觉处理的振动图像目标检测方法,属于机器视觉及故障诊断领域。

技术介绍

[0002]旋转机械是机械行业中的重要监测对象,其结构占所有机械结构的40%以上,且相较于非旋转机械更易出现故障。因此,对旋转体进行健康检测是很有必要的。当前对旋转体进行故障检测通常采用接触式传感器采集旋转体所在箱体的振动信号进行分析诊断。然而,这种方式采集到的信号往往受到噪声和其他连接件的振动信号影响,进而需要工作人员对采集到的信号进一步提取。但是,一旦提取信号的过程稍有差池会误判故障类型,造成损失。基于视觉对旋转体进行故障监测以其非接触、无损伤、多点同步测量等优点受到学者们的广泛关注。因此,可以通过视觉的方法获得旋转体的目标检测信息进而达到监测其运行状态,实现故障监测。
[0003]随着深度学习的不断发展,目标检测算法的执行效率越来越高,其精确度和实时性都发展到较高的水平。目前比较流行的目标检测算法是基于深度学习的方法,有CenterNet、Faster R

CNN、RetinaNet和SSD。基于无锚框的CenterNet算法结构简单,但检测精度欠佳;基于有锚框的双阶段的Faster R

CNN算法的检测精度较高,但速度欠佳;基于有锚框的单阶段的RetinaNet和SSD算法的检测速度快,但精度欠佳。这些目标检测算法基于深度学习对场景有依赖性,当更换场景时会产生效果不好的问题。对于旋转体的目标检测任务而言,无论是实时性不够还是精确度不高,都会导致预测框输出的目标位置信息存在较大的误差。另外,很多旋转机械处于在工厂或箱体等较暗的环境,深度学习目标检测算法难以同时兼顾速度和精度,最终导致安全故障检测信息有误。因此,针对旋转体的目标检测任务,提出一种同时兼顾速度和精度的目标检测算法的意义十分重大。

技术实现思路

[0004]本专利技术提供了一种基于视觉处理的振动图像目标检测方法,通过引入骨干模块、颈部模块、多尺度特征融合模块、头部模块构建的目标检测网络模型,实现了振动图像的目标检测。
[0005]本专利技术的技术方案是:一种基于视觉处理的振动图像目标检测方法,包括:获取振动图像数据集;依据获得的振动图像数据集划分为训练数据集和验证数据集;对训练数据集和验证数据集进行标注,获得标注训练集、标注验证集;依据顺次连接的骨干模块、颈部模块、多尺度特征融合模块、头部模块,建立目标检测网络模型;调用标注训练集对目标检测网络模型进行训练,训练结束获得候选权重;用标注验证集对候选权重性能进行评估,用于获得最优权重;依据载入最优权重的目标检测网络模型对待检测振动图像进行检测,获得振动图像目标检测信息;
[0006]所述骨干模块,包括:对输入进行C6BS操作得到第一骨干输出特征S1;对第一骨干
输出特征S1进行CSP
12
操作得到第二骨干输出特征S2;对第二骨干输出特征S2进行CSP
13
操作得到第三骨干输出特征S3;对第三骨干输出特征S3进行CSP
14
操作得到第四骨干输出特征S4;对第四骨干输出特征S4进行CSP
12
操作得到第五骨干输出特征S5;对第五骨干输出特征S5进行注意力机制操作得到第六骨干输出特征S6;对第六骨干输出特征S6进行改进空间池化金字塔操作得到第七骨干输出特征S7。
[0007]所述C6BS操作为依次经过卷积核大小为6
×
6的卷积、BatchNorm操作以及Sigmoid激活函数操作;所述CSP
1i
操作为对输入特征依次经过i个卷积块操作、再经过C3BS操作得到第一骨干拼接特征,同时对输入特征经过C3BS得到第二骨干拼接特征,将第一骨干拼接特征与第二骨干拼接特征进行拼接,将拼接后的特征进行C3BS操作得到骨干输出特征,i=1,2,3,4;卷积块为依次进行两次C3BS操作,C3BS操作为依次经过卷积核大小为3
×
3的卷积、BatchNorm操作以及Sigmoid激活函数操作。
[0008]所述注意力机制操作为对第五骨干输出特征S5依次经过卷积核大小为3
×
3的深度可分离卷积、卷积核大小为1
×
1的点卷积操作得到特征M
19
;对第五骨干输出特征S5与特征M
19
进行相乘,得到第六骨干输出特征S6。
[0009]所述改进空间池化金字塔操作为对第六骨干输出特征S6依次经过3个池化窗口为5的池化操作,分别得到特征M
110
、特征M
111
、特征M
112
;对特征S5与特征M
110
、特征M
111
、特征M
112
进行拼接,得到第七骨干输出特征S7。
[0010]所述颈部模块,包括:将骨干模块的第七骨干输出特征S7经过C1BS操作得到特征N
11
;将特征N
11
进行2倍上采样得到特征M
21
;将骨干模块的第四骨干输出特征S4与特征M
21
拼接得到特征M
22
;对特征M
22
经过CSP
21
操作得到特征M2;将特征M
25
经过C1BS操作得到特征N
12
;将特征N
12
进行2倍上采样得到特征M
26
;将骨干模块的第三骨干输出特征特征S3与特征M
26
拼接得到特征M
27
;对特征M
27
经过CSP
21
操作得到第一颈部输出特征A
21
;将第一颈部输出特征A
21
经过C3BS操作后得到特征N
22
,将特征N
22
与特征N
12
拼接得到特征M
28
;对特征M
28
经过CSP
21
操作得到第二颈部输出特征A
22
;对第一颈部输出特征A
22
经过C3BS得到特征M
29
,将特征M
29
和N
11
拼接后,经过CSP
21
操作得到第三颈部输出特征A
23

[0011]所述CSP
21
操作为对输入特征依次经过2个C1BS操作、1个C3BS操作、1个C1BS操作、1个C3BS操作、1个C1BS操作、1个C3BS操作得到第一颈部拼接特征;对CSP
21
输入特征经过C1BS操作得到第二颈部拼接特征;将第一颈部拼接特征和第二颈部拼接拼接后,经过C1BS操作得到输出特征;所述C1BS操作为依次经过卷积核大小为1
×
1的卷积操作、BatchNo本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于视觉处理的振动图像目标检测方法,其特征在于,包括:获取振动图像数据集;依据获得的振动图像数据集划分为训练数据集和验证数据集;对训练数据集和验证数据集进行标注,获得标注训练集、标注验证集;依据顺次连接的骨干模块、颈部模块、多尺度特征融合模块、头部模块,建立目标检测网络模型;调用标注训练集对目标检测网络模型进行训练,训练结束获得候选权重;用标注验证集对候选权重性能进行评估,用于获得最优权重;依据载入最优权重的目标检测网络模型对待检测振动图像进行检测,获得振动图像目标检测信息。2.根据权利要求1所述的基于视觉处理的振动图像目标检测方法,其特征在于,所述骨干模块,包括:对输入进行C6BS操作得到第一骨干输出特征S1;对第一骨干输出特征S1进行CSP
12
操作得到第二骨干输出特征S2;对第二骨干输出特征S2进行CSP
13
操作得到第三骨干输出特征S3;对第三骨干输出特征S3进行CSP
14
操作得到第四骨干输出特征S4;对第四骨干输出特征S4进行CSP
12
操作得到第五骨干输出特征S5;对第五骨干输出特征S5进行注意力机制操作得到第六骨干输出特征S6;对第六骨干输出特征S6进行改进空间池化金字塔操作得到第七骨干输出特征S7。3.根据权利要求2所述的基于视觉处理的振动图像目标检测方法,其特征在于,所述C6BS操作为依次经过卷积核大小为6
×
6的卷积、BatchNorm操作以及Sigmoid激活函数操作;所述CSP
1i
操作为对输入特征依次经过i个卷积块操作、再经过C3BS操作得到第一骨干拼接特征,同时对输入特征经过C3BS得到第二骨干拼接特征,将第一骨干拼接特征与第二骨干拼接特征进行拼接,将拼接后的特征进行C3BS操作得到骨干输出特征,i=1,2,3,4;卷积块为依次进行两次C3BS操作,C3BS操作为依次经过卷积核大小为3
×
3的卷积、BatchNorm操作以及Sigmoid激活函数操作。4...

【专利技术属性】
技术研发人员:毛剑琳霍琳王森伞红军
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1