【技术实现步骤摘要】
一种基于深度学习的字轮式水表读数的识别方法及装置
[0001]本专利技术涉及计算机视觉
,尤其是指一种基于深度学习的字轮式水表读数的识别方法及装置。
技术介绍
[0002]在智能城市基础设施的建设中,与其他基础设施相比,城市供水系统智能化的进程是相对较慢的。世界各地城市供水系统的基础设施运营和维护成本每年已经在1000亿美元左右。城市供水系统的智能化能够提升供水系统的效率并且降低成本,同时能够在很大程度上减少水资源的浪费,例如,智能水表可以与噪音记录器相结合,根据远传数据来检测和粗略定位供水管网中的泄露,与自动化设备一起可以调节压力以减少水损失。然而,虽然现在智能水表技术已经十分成熟,可以实时提供十分精确的数据,但是由于智能水表价格高昂等原因,大部分用户的水表仍然是传统的字轮式水表,并且在可预见的未来难以实现更新换代。由于大部分字轮式水表的存在,水表的抄表工作变得十分繁琐复杂。一个城市大约还有上百万个传统水表在使用,需要大量的抄表工人去现场抄表记录,因此人工抄表会耗费大量的人力和物力。同时,每个抄表工人每天可能要记录成百上千个水表的读数,这很难保证数据的准确性,并且这种抄表方式存在着数据难复核,数据时效性差,数据难以利用等问题。传统水表的存在在很大程度上阻碍了城市供水基础设施的智能化进度,因此,迫切需要一种可靠的水表自动读数方法来解决上述问题。
[0003]对于传统水表读数的自动识别问题也有很多传统算法提出,例如模板匹配法,但是大多数传统算法的鲁棒性较差,很难在各种环境下的水表图像中取得较高的精度。在深 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的字轮式水表读数识别方法,其特征在于,包括如下步骤:获取字轮式水表图像,对所述字轮式水表图像进行预处理,并通过数字区域检测模型得到所述字轮式水表图像中的数字区域位置图像;将所述数字区域位置图像输入基于矫正分割算法的网络模型,对所述数字区域位置图像进行矫正和分割,得到目标区域的裁剪图像;将所述目标区域的裁剪图像通过仿射变换后输入数字识别模型,通过卷积层提取图像特征,全连接层利用提取出的图像特征进行数据分类,通过softmax激活函数产生一个列
×
行为10
×
Q的矩阵作为数字识别模型的输出,每一行概率最高的数字被认为是识别值,得到Q个读数作为字轮式水表读数识别的结果。2.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法,其特征在于,所述数字区域检测模型是基于UNet深度学习网络提出的,用于提取图像显示的数字区域,其训练过程使用均方差损失函数,数学表达式为:其中,n是输出元素的个数,y
i
是第i个输出元素的真实值,是第i个输出元素的预测值。3.根据权利要求1所述的基于深度学习的字轮式水表读数识别方法,其特征在于,将所述数字区域位置图像输入基于矫正分割算法的网络模型,对所述数字区域位置图像进行矫正和分割,具体步骤如下:对所述数字区域位置图像进行边缘检测,得到数字区域位置的边缘点,同时获得所述边缘点的最小外接矩形及其四个顶点坐标;利用矫正算法对所述最小外接矩形进行矫正,获得一个新的四边形区域;按照所述新的四边形区域对所述数字区域位置图像进行裁剪分割,得到目标区域的裁剪图像。4.根据权利要求3所述的基于深度学习的字轮式水表读数识别方法,其特征在于,所述矫正算法的数学表达式为:矫正算法的数学表达式为:其中,(x
i
,y
i
)((i=1,2,
…
()是所述数字区域位置图像的边缘点坐标,()是所述数字区域位置图像的边缘点坐标,为所述最小外接矩形四个顶点的坐标,S
ij
(i=1,2,
…
;j=1,2,3,4)是第i个边缘点到第j个最小外接矩形框顶点的距离,d
upi
和d
downi
(i=1,2,
…
)是第i个边缘点到最小外接矩形上下边的距离,ω1和ω2是加权系数,ω1=0.975,ω2=1
‑
ω1,C
ij
是第i个边缘点到最小外接矩形的第j个顶点的加权距离。5.根据权利要求3所述的基于深...
【专利技术属性】
技术研发人员:赵顺毅,卢庆鑫,栾小丽,刘飞,倪雨青,
申请(专利权)人:江南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。