本发明专利技术公开了一种基于深度学习的字轮式水表读数方法,该方法包括以下步骤:S1、对水表图像进行排除无关干扰因素的预处理;S2、将预处理后的水表图像输入训练获得的数字滚轮区域识别网络,获得图像数字滚轮区域的位置信息;其中,所述数字滚轮区域识别网络以yolov7网络为主体;S3、将数字滚轮区域的图像调整分辨率后输入训练获得的滚轮区域数字序列识别网络X
【技术实现步骤摘要】
一种基于深度学习的字轮式水表读数方法
[0001]本专利技术属于计算机视觉
,尤其涉及一种基于深度学习的字轮式水表读数方法。
技术介绍
[0002]水表是生活中最普遍且常用的水的计量仪表,直观地反映了用水量的多少。为了更加方便地读取水表数据,近些年来,部分厂商推出了智能水表,可以自动传输水表读数。然而,由于成本和维护费用较高、安装需求高等问题,现实情况下智能水表并未得到广泛普及,绝大多数使用的水表仍然是传统的字轮式水表。
[0003]传统的字轮式水表需要水表记录员人工读取数据,这其中有很多不利因素:其一,对人力资源需求量大;其二,数据读取精度受水表记录员个人状态的影响较大,容易出现漏抄、误抄等情况;其三,部分情况下,水表所处的地理位置可能不适宜人工读取。
[0004]随着计算机视觉和图像识别技术的发展,使用计算机从水表盘图像中识别用水量数据成为了可能,这样只需获得水表图像就可以通过计算机输出用水量数据,而水表图像的获得可以采用在水表附近安装摄像头或人工携带相关仪器扫描水表等方式来获得,相比于人工抄表,不仅提升了便捷程度,也使效率有了很大的改善;同时,采用计算机来读表,减少了诸多例如水表记录员状态之类的不稳定因素。因此,如何从获得的水表图像中利用计算机正确地识别出数字序列,就成了亟待解决的问题。
技术实现思路
[0005]本专利技术的目的在于提供一种基于深度学习的字轮式水表读数方法,旨在解决利用计算机从水表图像中正确地识别出数字序列。
[0006]本专利技术是这样实现的,一种基于深度学习的字轮式水表读数方法,该方法包括以下步骤:S1、对水表图像进行排除无关干扰因素的预处理;S2、将预处理后的水表图像输入训练获得的数字滚轮区域识别网络,获得图像数字滚轮区域的位置信息;其中,所述数字滚轮区域识别网络以yolov7网络为主体;S3、将数字滚轮区域的图像调整分辨率后输入训练获得的滚轮区域数字序列识别网络X
‑
CRNN,得到最终的水表数字序列的读数结果;其中,X
‑
CRNN以卷积循环神经网络CRNN为主体,在卷积模块中采用深度可分离卷积和残差块相结合的结构替换原有的网络架构,在循环模块中采用循环门单元(GRU)替换CRNN中的长短期记忆单元(LSTM)。
[0007]优选地,在步骤S1中,所述预处理包括进行分辨率调整、灰度化、图像增强、倾斜校正。
[0008]优选地,所述预处理包括以下步骤:S11、调整原始水表图像的分辨率,使其较长边的长度为640,若图像需要进行放大操作,则采用双三次插值法,反之则采用区域插值法;
S12、用加权平均值法对已调整过分辨率的水表图像进行灰度化处理;S13、对所得的灰度图像进行直方图均衡化处理,提高图像对比度;S14、对经直方图均衡化处理后的图像进行双边滤波操作,达到平滑去噪的目的;S15、采用基于Canny算子的边缘检测方法检测图像的边缘,然后用Hough直线检测识别出数字滚轮区域的横向边缘,根据该条直线的倾斜程度,将水表图像围绕图像中心点旋转相同角度,完成倾斜校正。
[0009]优选地,步骤S2包括以下具体步骤:S21、使用labelimg软件制作处理后所得图像的标签数据,标签值为水表图像中的数字滚轮区域的位置信息,图像与标签数据共同构成滚轮区域识别网络的数据集;S22、将训练集数据输入数字滚轮区域识别网络,迭代更新网络参数;S23、挑选出在验证集上表现最好的网络作为训练最终结果,将预处理后的水表图像输入训练获得的数字滚轮区域识别网络,获得对数字滚轮区域位置信息的预测结果。
[0010]优选地,在数字滚轮区域识别网络中,在主干网络的3个MPA+ELAN结构后添加用于提升网络性能的改进的坐标注意力机制AM
‑
CA。
[0011]优选地,在所述改进的坐标注意力机制AM
‑
CA中,对于通道数为,高度为,宽度为的输入特征图X,AM
‑
CA分别沿x轴和y轴方向对特征图进行平均池化和最大池化,两种池化方式所得结果共同影响最终输出的权重系数。
[0012]优选地,在步骤S3中,X
‑
CRNN包括卷积模块、循环模块和转录模块;其中,卷积模块用于提取滚轮区域图像的特征序列;循环模块输出每一个特征序列所对应的原图像内容的概率分布,由深度双向递归神经网络构成,循环模块中采用循环门单元(GRU)以解决RNN的梯度消失问题;转录模块采用CTC模型,用于将循环模块获得的标签概率分布通过映射等方式转换为最终预测的数字序列。
[0013]本专利技术克服现有技术的不足,提供一种基于深度学习的字轮式水表读数方法。在数字滚轮区域识别方面,本专利技术以yolov7作为基础网络,并在其主干中添加改进后的坐标注意力模块AM
‑
CA,能够有效提升yolov7的识别精度。AM
‑
CA的主要改进方法在于:已有的坐标注意力机制(CA)使用平均池化来整合特征图水平和垂直方向的信息,本专利技术在平均池化的基础上,添加了最大池化的信息整合方式,最后将两种池化方式得到的结果相融合。在滚轮区域数字序列识别方面,不同于已有方法中对数字序列切割成单个字符再进行识别的方法,本专利技术采用改进的CRNN网络,对数字序列整体进行识别,适用于不同序列长度的水表图像,其中,CRNN网络的主要改进在于:(1)替换了原有的卷积模块,替换后的网络采用可分离卷积和残差结构,在提升特征提取性能的同时,降低网络运算量,提高网络收敛速度;(2)将循环模块中的长短期记忆单元(LSTM)替换为循环门单元(GRU),简化了网络结构,同时解决了网络的梯度消失问题。
[0014]相比于现有技术的缺点和不足,本专利技术具有以下有益效果:本专利技术能够以较高精准率识别出水表图像的数字滚轮区域,并以滚轮区域的数字序列整体为对象识别水表的读数,更加方便、快捷。
附图说明
[0015]图1为本专利技术的方法步骤流程图;图2为本专利技术的数字滚轮区域识别网络架构图;图3为本专利技术的改进后的坐标注意力机制架构图;图4为本专利技术的数字序列识别网络的数据处理流程图;图5为本专利技术的数字序列识别网络的卷积模块架构图;图6为本专利技术的数字序列识别网络的循环模块架构图;图7为本专利技术具体实施例的各流程处理结果图。
[0016]附图中各类符号释义如表1所示:表1Conv卷积层BN批次归一化层Maxpool最大池化层Avgpool平均池化层stride卷积步长SeparableConv可分离卷积层
实施方式
[0017]为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。
[0018]本专利技术公开了一种基于深度学习的字轮式水表读数方法,如图1所示,该方法包括以下步骤:S1、对水表图像进行排除无关干扰因素的预处理在步骤S1中,对水表图像进行预处理,以消除无关的干扰因素,包括进行分辨率调整、本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的字轮式水表读数方法,其特征在于,该方法包括以下步骤:S1、对水表图像进行排除无关干扰因素的预处理;S2、将预处理后的水表图像输入训练获得的数字滚轮区域识别网络,获得图像数字滚轮区域的位置信息;其中,所述数字滚轮区域识别网络以yolov7网络为主体;S3、将数字滚轮区域的图像调整分辨率后输入训练获得的滚轮区域数字序列识别网络X
‑
CRNN,得到最终的水表数字序列的读数结果;其中,X
‑
CRNN以卷积循环神经网络CRNN为主体,在卷积模块中采用深度可分离卷积和残差块相结合的结构替换原有的网络架构,在循环模块中采用循环门单元GRU替换CRNN中的长短期记忆单元LSTM。2.如权利要求1所述的方法,其特征在于,在步骤S1中,所述预处理包括进行分辨率调整、灰度化、图像增强、倾斜校正。3.如权利要求2所述的方法,其特征在于,所述预处理包括以下步骤:S11、调整原始水表图像的分辨率,使其较长边的长度为640,若图像需要进行放大操作,则采用双三次插值法,反之则采用区域插值法;S12、用加权平均值法对已调整过分辨率的水表图像进行灰度化处理;S13、对所得的灰度图像进行直方图均衡化处理,提高图像对比度;S14、对经直方图均衡化处理后的图像进行双边滤波操作,达到平滑去噪的目的;S15、采用基于Canny算子的边缘检测方法检测图像的边缘,然后用Hough直线检测识别出数字滚轮区域的横向边缘,根据该条直线的倾斜程度,将水表图像围绕图像中心点旋转相同角度,完成倾斜校正...
【专利技术属性】
技术研发人员:姬磊,陈立全,唐敏,王怡乐,
申请(专利权)人:南京畅洋科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。