一种用于水表读数的检测识别方法、系统及存储介质技术方案

技术编号:28943252 阅读:16 留言:0更新日期:2021-06-18 21:51
本发明专利技术公开了一种用于水表读数的检测识别方法、系统及存储介质,包括采集并标注含有水表表盘的图像;对图像进行数据处理与数据增强;构建教师网络与学生网络;对教师网络和学生网络分别进行训练;使用训练后的教师网络和数据标注信息共同指导训练学生网络,最后将待识别表盘图像输入学生网络进行识别。本发明专利技术能较好地应对水表图像检测需求,并能以较小的运算量达到较好的检测性能,从而提高实际生产应用时算法的运算速度,降低算力需求,提高并发处理能力,因此具有较好的实际应用价值。

【技术实现步骤摘要】
一种用于水表读数的检测识别方法、系统及存储介质
本专利技术涉及智能识别领域,具体涉及一种用于水表读数的检测识别方法、系统及存储介质。
技术介绍
水务数据采集是水能源运营单位一项繁琐而重要的工作。采取人工抄表的方式需要极大的人力、物力投入。使用摄像头自动定时采集水表图像,并上传云端服务器由计算机自动完成水表读数的检测和识别是近年来新兴的数据采集方式。水表读数对准确度要求较高,但云端服务器资源较为昂贵且算力有限,使用结构较深,运算量较大的检测模型成本较高,执行速度也较慢,不利于并发地处理大量的检测识别请求。如何在保持较好准确率的同时,提高检测算法的速度,降低检测模型的规模,是一个重要的技术问题。此领域常用的方法包括剪枝、量化、模型压缩、知识蒸馏等方法。知识蒸馏方法常用于分类任务,通过构建教师网络或学生网络并进行协同训练,能使得较为轻量的学生网络具备接近教师网络的泛化性能,在实践中具有良好效果,但需要工作在输出的logits上。对于检测问题,RPN网络、非极大值抑制等环节通常会产生检测框不能对齐的问题,使得这一技巧基本无法应用于靠近结果输出的logits上。若将其应用于网络中部的隐藏层上,通常也难以取得较好的效果。
技术实现思路
为了克服现有技术存在的缺点与不足,本专利技术提供一种用于水表读数的检测识别方法、系统及存储介质。本方法基于CenterNet框架,不需要只能顺序执行的非极大值抑制逻辑,而是采用MaxPooling来代替;并且作为全卷积网络,该算法没有二阶检测算法的繁琐步骤与anchor对齐问题,也扫除了将分类领域常用的知识蒸馏技巧应用于检测的障碍。本专利技术采用如下技术方案:一种用于水表读数的检测识别方法,包括:S1采集并标注含有水表表盘的图像;S2对图像进行数据处理与数据增强;S3构建教师网络与学生网络;S4对教师网络和学生网络分别进行训练;S5使用训练后的教师网络和数据标注信息共同指导训练学生网络;S6待识别表盘图像输入学生网络进行识别。进一步,所述S1中,图像标注以旋转矩形框标注。进一步,所述S2中,对图像进行数据处理与数据增强,具体为:将数据增强后的图片减去各通道均值,除以各通道方差,再进行归一化,并转化为教师网络及学生网络所需的N*3*512*512的张量。进一步,所述教师网络和学生网络均包括:特征提取网络,对输入张量维度N*3*512*512的图片进行特征提取,输出特征维度为N*2048*16*16;上采样层,对特征提取网络的输出进行上采样,输出特征维度N*64*128*128,并由此得到中心预测分支的输出特征维度为N*C*128*128,C表示分类类别数,中心偏移预测分支的输出特征维度为N*2*128*128,2分别代表预测的中心点在宽、高方向上的量化误差补偿,宽高预测分支输出维度为N*2*128*128,2分别代表检测框的宽,高;倾角预测分支输出维度为N*1*128*128,1代表检测框倾角。进一步,所述S4中,对教师网络和学生网络分别训练,具体为利用图像和标注信息,使用反向传播算法,分别训练教师网络和学生网络。进一步,在训练阶段,教师网络和学生网络仅有特征提取网络不同,对两个网络分别进行N个Epoch的训练,使得两个网络的损失一致,且考虑倾角引入的损失,其损失函数如下:L=LHeatmap+λoffLOffset+λwhLwh+λangleLangleλoff,λwh,λangle为调节系数,使得各残差大致保持同一数量级,LHeatmap表示中心预测分支产生的残差,LOffset表示中心偏移预测分支产生的残差,Lwh表示宽高预测分支产生的残差,Langle表示倾角预测分支产生的残差。进一步,所述S5使用训练后的教师网络和数据标注信息共同指导训练学生网络,具体为:固定教师网络参数,使用学生网络各预测分支的输出与教师网络预测分支的输出损失,以及学生网络预测和标签的损失相加,共同反向传播,训练学生网络。进一步,计算学生网络各预测分支与教师网络各预测分支的损失,具体为:对于二者的中心预测分支,将该分支经过一个Sigmoid层后,计算特征图间的均方损失:其中,L′heatmap表示教师和学生网络中心预测分支的残差,表示教师网络中心预测分支特征图,表示学生网络中心预测分支特征图;对于二者的中心偏移,宽高,倾角预测分支,取教师网络的中心预测分支过Sigmoid后3*3Maxpooling的结果取channel-wise的最大值作为系数,对每个中心点计算两网络各分支的L1损失之后,乘上这个系数,作为各分支的残差:其中,L′wh,L′offset,L′angle分别表示教师和学生网络中心预测分支,中心偏移分支,角度预测分支的残差,Max(A,1)表示取张量A维度1上的最大值,并保留此维度,MaxPool(A,3)表示对张量A进行3*3Maxpooling运算。一种用于水表读数的检测识别系统,包括:采集模块:用于获取水表表盘图像,并进行标注;处理模块:用于对标注后的图像进行处理与增强;构建及训练模块:用于构建教师网络与学生网络,并对教师网络和学生网络分别进行训练;二次训练模块:用于使用训练后的教师网络和数据标注信息共同指导训练学生网络;识别模块:用于将待识别表盘图像输入二次训练后的学生网络进行识别。一种存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时,实现所述的检测识别方法。本专利技术的有益效果:本方法图像标注以旋转矩形框标注,能检测旋转矩形框,更适合水表读数检测任务;本方法引入知识蒸馏技巧,并结合网络特点,根据任务特点进行修改定制,使用较低的运算量,获得较好的性能。附图说明图1是本专利技术的工作流程图;图2是教师网络与学生网络的结构示意图;图3是本专利技术实施例1中的水表检测识别结果示意图。具体实施方式下面结合实施例及附图,对本专利技术作进一步地详细说明,但本专利技术的实施方式不限于此。实施例1如图1-图3所示,一种用于水表读数的检测识别方法,包括如下步骤:S1采集并标注含有水表表盘的图像。具体为:采集的表盘图像需包含水表表盘内容,且宽与高中较短边应大于512像素。裁剪图像,并使用标注工具,采用旋转矩形框方式,标记水表读数字轮框和水表指针框的像素位置,以矩形的四个边角的像素坐标的形式记录在文件中。S2对图像进行数据处理与数据增强。具体为:所述数据增强操作,包括色彩抖动、加噪声、水平翻转、随机旋转、随机裁剪等增加运算。所述数据处理是将数据增强后的图片减去各通道均值,除以各通道方差,再进行归一化,并转化为教师网络及学生网络所需的N*3*512*512的张量输入到教师网络及学生网络中。S3构建教师网络与本文档来自技高网...

【技术保护点】
1.一种用于水表读数的检测识别方法,其特征在于,包括:/n采集并标注含有水表表盘的图像;/n对图像进行数据处理与数据增强;/n构建教师网络与学生网络;/n对教师网络和学生网络分别进行训练;/n使用训练后的教师网络和数据标注信息共同指导训练学生网络;/n待识别表盘图像输入学生网络进行识别。/n

【技术特征摘要】
1.一种用于水表读数的检测识别方法,其特征在于,包括:
采集并标注含有水表表盘的图像;
对图像进行数据处理与数据增强;
构建教师网络与学生网络;
对教师网络和学生网络分别进行训练;
使用训练后的教师网络和数据标注信息共同指导训练学生网络;
待识别表盘图像输入学生网络进行识别。


2.根据权利要求1所述的检测识别方法,其特征在于,图像标注以旋转矩形框标注。


3.根据权利要求1所述的检测识别方法,其特征在于,对图像进行数据处理与数据增强,具体为:将数据增强后的图片减去各通道均值,除以各通道方差,再进行归一化,并转化为教师网络及学生网络所需的N*3*512*512的张量。


4.根据权利要求1所述的检测识别方法,其特征在于,所述教师网络和学生网络均包括:
特征提取网络,对输入张量维度N*3*512*512的图片进行特征提取,输出特征维度为N*2048*16*16;
上采样层,对特征提取网络的输出进行上采样,输出特征维度N*64*128*128,并由此得到中心预测分支的输出特征维度为N*C*128*128,C表示分类类别数,中心偏移预测分支的输出特征维度为N*2*128*128,2分别代表预测的中心点在宽、高方向上的量化误差补偿,宽高预测分支输出维度为N*2*128*128,2分别代表检测框的宽,高;倾角预测分支输出维度为N*1*128*128,1代表检测框倾角。


5.根据权利要求1所述的检测识别方法,其特征在于,所述对教师网络和学生网络分别训练,具体为利用图像和标注信息,使用反向传播算法,分别训练教师网络和学生网络。


6.根据权利要求5所述的检测识别方法,其特征在于,在训练阶段,教师网络和学生网络仅有特征提取网络不同,对两个网络分别进行N个Epoch的训练,使得两个网络的损失一致,且考虑倾角引入的损失,其损失函数如下:
L=LHeatmap+λoffLoffset+λwhLwh+λangleLangle
λoff,λwh,λangle为调节系数,使得各残差大致保持同一数量级,LHeatmap表示中心预测分支产生的残差,Loffse...

【专利技术属性】
技术研发人员:高学陈子威
申请(专利权)人:华南理工大学华南理工大学珠海现代产业创新研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1