基于可变形特征聚合的数字仪表读数方法技术

技术编号:39675981 阅读:8 留言:0更新日期:2023-12-11 18:42
本发明专利技术公开了一种基于可变形特征聚合的数字仪表读数方法,基于

【技术实现步骤摘要】
基于可变形特征聚合的数字仪表读数方法


[0001]本专利技术涉及一种数字仪表读数识别技术,尤其涉及一种基于可变形特征聚合的数字仪表读数方法


技术介绍

[0002]随着工业
4.0
的发展,其追求的智能制造需要对各种仪表进行大量读数,这对于监控生产过程

优化制造流程

提高产品质量等至关重要

虽然市场上出现了一些智能仪表,但机械仪表由于制造成本低

测量准确,仍然被广泛应用于工业生产

交通安全

智能家居等领域

[0003]目前,大多数机械仪表读数仍是通过现场手动抄表进行的,甚至有的仪表处在高风险场所,因此人工操作存在一定的安全隐患且效率低下

[0004]数字仪表识别算法基于机器视觉和人工智能技术,自动读取并识别仪表的显示值,进而方便地记录和处理各种类型的仪表读表,包括电表

水表和燃气表等

然而,现有的检测方法往往由于计算成本高而难以满足实时要求,或由于现实场景复杂而经常导致误读


技术实现思路

[0005]本专利技术提供了一种基于可变形特征聚合的数字仪表读数方法,以解决现有技术中存在的上述技术问题

[0006]本专利技术是基于可变形特征聚合的数字仪表读数方法,包括以下步骤:
[0007]步骤1:设计改进的
YOLOv8n
模型结构
[0008]步骤2:对专用仪表数据集进行
MDA
数据增强后,采用步骤1中设计的改进的
YOLOv8n
模型结构进行训练,获得仪表读数区域检测网络和仪表数字识别网络2个模型,再采用
NP
网络剪枝技术对训练好的两个网络模型进行剪枝;
[0009]步骤3:通过摄像机采集仪表图像
,
并对采集到的图像进行尺寸调整;
[0010]步骤4:基于步骤2构建的仪表读数区域检测网络,将步骤3处理后的图片进行仪表读数区域的检测与定位

若置信度大于
0.25
,则被判断为正确的仪表读数区域;否则判断为非仪表读数区域并重新获取图像;
[0011]步骤5:将步骤4检测到的仪表读数区域进行图像裁切,排除非读数区域噪声干扰,得到仪表数字区域图像;
[0012]步骤6:基于步骤2构建的仪表数字识别网络,将步骤5裁切好的仪表数字区域图像作为该网络的输入进行读数识别以获取仪表读数;若置信度大于
0.25
,则被判断为正确的仪表读数;否则判断为非仪表读数并重新进行读数区域检测;
[0013]步骤7:对步骤6识别到的仪表读数,各读数根据其在仪表读数区域的坐标位置进行排序;
[0014]步骤8:将步骤7排序好的仪表读数依次拼接得到最终的仪表读数,结果输出到文
件保存并实时显示图像识别结果

[0015]与现有技术相比,本专利技术所提供的基于可变形特征聚合的数字仪表读数方法,基于
YOLOv8n
网络实现对数字仪表的精确检测定位与读数,通过设计可变形
CSP
瓶颈
(DCB)
模块,聚合三重注意力
(ATA)
机制集成到
YOLOv8n
模型中,明显增强网络对数字仪表区域的关注度,更加精准地定位读数区域,大幅提高仪表数字读数精度,扩大了对不同类型仪表和复杂环境下的适应性和泛化能力

相比于基本的
YOLOv8n
网络,本模型在仪表读数识别数据集上模型参数量下降了
25
%,
mAP50:95

0.879
提升到
0.888。
进一步,将识别读数算法程序部署到
Jetson TX1
智能车上,实现对数字仪表的自动检测读数功能,实验表明在智能车上模型推理时间为
129.6ms
,具有准确性强

模型尺寸小的特点,达到实时性要求

附图说明
[0016]图1为本专利技术实施例中改进后的
YOLOv8n
模型结构示意图;
[0017]图2为本专利技术实施例中数字仪表读数识别流程图;
[0018]图3为本专利技术实施例中可变形
CSP
瓶颈
(DCB)
模块结构示意图;
[0019]图4为本专利技术实施例中聚合三重注意力
(ATA)
机制结构示意图

[0020]图中及文中代号:
[0021]DCB

Deformable CSP Bottleneck
,可变形
CSP
瓶颈

其中,
CSP
为跨阶段局部网络
(Cross Stage Patrial)
,是一种神经网络处理思想,旨在将梯度的变化集成到特征图中的特征融合结构,在降低计算量同时又可以保持甚至提升精度;
[0022]ATA

Aggregated Triplet Attention
,聚合三重注意力;
[0023]MDA

Meter Data Augmentation
,仪表数据增强;
[0024]NP

Network Pruning
,网络修剪;
[0025]AP
:每个类别的平均精度;
[0026]mAP

Mean Average Precision
,所有类别的平均精度,
mAP
越高表示精度越高;
[0027]Precision
:预测为正例中真正为正例的样本数占预测为正例的样本数的比例;
[0028]Recall
:真正为正例中被预测为正例的样本数占真正为正例的样本数的比例,
Recall
越高说明真实仪表图片中被检测出的仪表占真实仪表图片比例越高,效果越好;
[0029]Model Parameters
:表示模型的大小,越小越易于完成移动端的部署;
[0030]Jetson TX1
智能车:
Jetson TX1

NVIDIA
第二代嵌入式平台开发者套件,内建
256

CUDA
核心的
NVIDIA Maxwell GPU

64

ARM A57 CPU

4GB LPDDR4
内存
、16GB
闪存

蓝牙
、802.11ac Wi

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于可变形特征聚合的数字仪表读数方法,其特征在于,包括步骤:步骤1:设计改进的
YOLOv8n
模型结构;步骤2:对专用仪表数据集进
MDA
数据增强后,采用步骤1中设计的改进的
YOLOv8n
模型结构进行训练,获得仪表读数区域检测网络和仪表数字识别网络2个模型,再采用
NP
网络剪枝技术对训练好的两个网络模型进行剪枝;步骤3:通过摄像机采集仪表图像
,
并对采集到的图像进行尺寸调整;步骤4:基于步骤2构建的仪表读数区域检测网络,将步骤3处理后的图片进行仪表读数区域的检测与定位

若置信度大于
0.25
,则被判断为正确的仪表读数区域;否则判断为非仪表读数区域并重新获取图像;步骤5:将步骤4检测到的仪表读数区域进行图像裁切,排除非读数区域噪声干扰,得到仪表数字区域图像;步骤6:基于步骤2构建的仪表数字识别网络,将步骤5裁切好的仪表数字区域图像作为该网络的输入进行读数识别以获取仪表读数;若置信度大于
0.25
,则被判断为正确的仪表读数;否则判断为非仪表读数并重新进行读数区域检测;步骤7:对步骤6识别到的仪表读数,各读数根据其在仪表读数区域的坐标位置进行排序;步骤8:将步骤7排序好的仪表读数依次拼接得到最终的仪表读数,结果输出到文件保存并实时显示图像识别结果
。2.
根据权利要求1所述的基于可变形特征聚合的数字仪表读数方法,其特征在于,步骤2中,所述仪表读数区域检测网络和仪表读数识别网络为改进后的
YOLOv8n
模型,根据其任务分别用仪表读数区域检测数据集和仪表读数识别数据集进行训练,其中改进包括:将
DCB
模块
、ATA
机制集成到
YOLOv8n
网络;上述的代号表示:
DCB

Deformable CSP Bottleneck
,可变形
CSP
瓶颈,其中,
CSP
为跨阶段局部网络
Cross Stage Patrial
,是一种神经网络处理思想,旨在将梯度的变化集成到特征图中的特征融合结构,在降低计算量同时又可以保持甚至提升精度;
ATA

Aggregated Triplet Attention
,聚合三重注意力
。3.
根据权利要求2所述的基于可变形特征聚合的数字仪表读数方法,其特征在于,改进后的
YOLOv8n
模型结构描述为:输入图像

第一层特征提取
Conv

第二层特征提取
Conv

第三层特征提取
DCB

第四层特征提取
ATA

第五层特征提取
Conv

第六层特征提取
DCB

第七层特征提取
ATA

第八层特征提取
Conv

第九层特征提取
DCB

第十层特征提取
ATA

第十一层特征提取
Conv

第十二层特征提取
DCB

第十三层特征提取
ATA

第十四层空间金字塔池化
SPPF

第十五层上采样
Upsample

第十六层上采样
Upsample
;第十层特征提取
ATA
,第十六层上采样
Upsample

第十七层特征拼接
Concat

第十八层特征提取
DCB

第十九层上采样
Upsam...

【专利技术属性】
技术研发人员:张晓明卓思超黎泉龙管玙璠张世博陈子仪王芳魏薇
申请(专利权)人:北京石油化工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1