一种数字表读数的识别方法、装置及设备制造方法及图纸

技术编号:18351152 阅读:76 留言:0更新日期:2018-07-02 00:51
本说明书实施例公开了一种数字表读数的识别方法、装置及设备。通过对数字表的图像中的表盘进行检测,并且作为图像识别模型的输入,得到数字表的读数,实现对图像进行整体识别。整个识别过程不需要再行分割字符,直接进行端对端的整体识别数字,减少了中间环节和累积误差,读数更加准确,减少了中间环节,识别效率更高。

【技术实现步骤摘要】
一种数字表读数的识别方法、装置及设备
本说明书涉及计算机
,尤其涉及一种数字表读数的识别方法、装置及设备。
技术介绍
随着数字化、智能化、信息化时代的到来,企业和社会的智能信息处理已经成为一种趋势,燃气表、水表、电表等各种数字表读数的自动识别成为其中重要组成部分。在当前技术中,在对数字进行识别时,主要通过将表盘上的数字进行分割然后分别进行识别,识别过程中的环节多,前面分割错误会对后续识别模块造成误差累积效应,单个识别也容易引起误差的累积。基于此,需要一种更便利的数字表读数的识别方案。
技术实现思路
本说明书实施例提供一种数字表读数的识别方法、装置及设备,用于解决如下问题:以提供一种更便利的数字表读数的识别方案。基于此,本说明书实施例提供一种数字表读数的识别方法,包括:获取包含数字表的图像,在所述图像中,所述数字表通过数字表盘显示数字读数;检测所述图像,获得包含所述数字表盘的子图像;以包含所述数字表盘的子图像作为输入,通过预先训练得到的图像识别模型对其整体识别,生成所述数字表盘的数字读数的识别结果。同时,本说明书的实施例还提供一种数字表读数的识别装置,包括:获取模块,获取包含数字表的图像,在所述图像中,所述数字表通过数字表盘显示数字读数;检测模块,检测所述图像,获得包含所述数字表盘的子图像;识别模块,以包含所述数字表盘的子图像作为输入,通过预先训练得到的图像识别模型对其整体识别,生成所述数字表盘的数字读数的识别结果。对应的,本说明书实施例还提供一种数字表读数的识别设备,包括:存储器:存储数字表读数的识别程序;处理器:调用存储器中的数字表读数的识别程序,并执行:获取包含数字表的图像,在所述图像中,所述数字表通过数字表盘显示数字读数;检测所述图像,获得包含所述数字表盘的子图像;以包含所述数字表盘的子图像作为输入,通过预先训练得到的图像识别模型对其整体识别,生成所述数字表盘的数字读数的识别结果。对应的,本说明书的实施例还提供一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:获取包含数字表的图像,在所述图像中,所述数字表通过数字表盘显示数字读数;检测所述图像,获得包含所述数字表盘的子图像;以包含所述数字表盘的子图像作为输入,通过预先训练得到的图像识别模型对其整体识别,生成所述数字表盘的数字读数的识别结果。本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:通过对数字表的图像中的表盘进行检测,并且作为图像识别模型的输入,得到数字表的读数,实现对图像进行整体识别。整个识别过程不需要再行分割字符,直接进行端对端的整体识别数字,减少了中间环节和累积误差,读数更加准确,减少了中间环节,识别效率更高。此外,对图像的来源可以图像或者是对视频进行截图获得,适应访问更广;还可以预先对图像进行诸如降噪、增强等预处理,进一步提高了识别的准确率。附图说明图1为本说明书实施例提供的架构示意图;图2本说明书实施例提供的数字表读数的识别方法过程示意图;图3为本说明书实施例提供的CNN模型训练方法流程示意图;图4为本说明书实施例所提供的示例执行流程的逻辑示意图;图5为本说明书实施例所提供的数字表读数的识别装置的结构示意图。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。数字表即为在表盘上通过数字(一般为采用十进制,具体采用多少位数字来计数,可根据实际需要而定)来显示读数的表。例如,水表、电表、燃气表等等。传统方法识别数字表读数需要对表盘检测后精确定位再对各数字进行分割然后识别,在光线差、分辨率低、污损、倾斜大等情况的稳定性不好。基于此,本说明书实施例提供一种数字表读数的识别方法,通过图像识别模型,对数字表盘进行整体识别,以得到对应的读数。在本说明书的实施例中,所述的数字表读数的识别方法可采用如图1所示的架构,在该架构中,以一般的8位数计数(其中,后三位为小数点以后的计数)的燃气表作为示例,但显然,本说明书实施例所提供的方案并不局限于该示意图中所提供的8位数计数的燃气表识别。该架构中的图像采集设备可以是诸如摄像头、照相机,也可以是具有拍照或者摄影功能的手机等用户终端,所述处理设备可以是各种集中式或者分布式的处理器、服务器等。下面将基于如图1所示的架构,详细说明本说明书实施例提供的数字表读数的识别方法过程,该过程具体包括以下步骤,如图2所示,包括:S201,获取包含数字表的图像,在所述图像中,所述数字表通过数字表盘显示数字读数。对于接受到的图像,可以是由图像采集设备(例如,手机或专用采集工具)获得,可以是之前已经收集好的历史图片,或者是实时采集上传,也可以是从视频序列中获取。在获取包含数字表图片的过程中,可由预先设定的程序自动检测完成(例如,对于视频自动截帧获取图片)。此外,对于获取得到的图片,可以是彩色的,也可以是黑白的。在获取得到的图片中,数字表通过数字表盘显示数字读数。上述对图像的来源的获取可以从各种来源得到,可以适应多种实际应用场景,适应范围更广。S203,检测所述图像,获得包含所述数字表盘的子图像。作为展示数字的核心区域,数字表盘的边缘特征丰富,梯度能量变化较大,同时也是最需要被检测的地方。对于数字表盘的检测,可以采用诸如ACF等非深度学习方法或者SSD(Single-ShotDetector)等深度学习方法,对数字表盘所处的区域进行识别,或者对数字表盘的边框进行检测,换言之,在检测过程中,以数字表盘作为目标区域进行模型检测,得到基本包含数字表盘的子图像。容易理解,在这个过程中,由于检测误差的存在,检测得到的子图像可能各自略有差异,但均应在数字表盘所处的区域的一定范围内,其包含数字表盘中的数字。在实际应用中,可以通过事先在对检测模型的训练过程中对误差的大小进行限制得以实现。S205,以包含所述数字表盘的子图像作为输入,通过预先训练得到的图像识别模型对其整体识别,生成所述数字表盘的数字读数的识别结果。在使用图像识别模型识别时,可以采用诸如GoogleNet、VGGNet等图像识别模型进行识别,也可才采用自定的卷积神经网络(ConvolutionalNeuralNetwork,CNN)进行识别。在上述图像识别模型中,均采用了深度学习的方式进行识别。换言之,识别的过程中不需要对表盘中的数字进行分割,而是对子图像的整体进行识别,得到识别结果。通过对数字表的图像中的表盘进行检测,并且作为图像识别模型的输入,得到数字表的读数,实现对图像进行整体识别。不需要再行分割字符,直接整体性地识别数字,减少了中间环节和累积误差,进行读数更加准确,进行整体识别时,减少了中间环节,识别效率更高。在实际应用中,所述的电子表包括数字燃气表、数字电表或者数字水表中的至少一种。作为一种具体的实施方案,在所述步骤S203在检测所述包含数字表的图像之前,还可以对获取得到的图像进行预处理,包括:对获取得到的包含数字表的图像进行增强和/或去噪预处理,生成预处理之后的包本文档来自技高网...
一种数字表读数的识别方法、装置及设备

【技术保护点】
1.一种数字表读数的识别方法,包括:获取包含数字表的图像,在所述图像中,所述数字表通过数字表盘显示数字读数;检测所述图像,获得包含所述数字表盘的子图像;以包含所述数字表盘的子图像作为输入,通过预先训练得到的图像识别模型对其整体识别,生成所述数字表盘的数字读数的识别结果。

【技术特征摘要】
1.一种数字表读数的识别方法,包括:获取包含数字表的图像,在所述图像中,所述数字表通过数字表盘显示数字读数;检测所述图像,获得包含所述数字表盘的子图像;以包含所述数字表盘的子图像作为输入,通过预先训练得到的图像识别模型对其整体识别,生成所述数字表盘的数字读数的识别结果。2.如权利要求1所述方法,所述数字表包括数字燃气表、数字电表或者数字水表。3.如权利要求1所述的方法,获取包含数字表的图像,包括:接收图像采集设备所发送的包含数字表的图像;或者,接收包含数字表的视频,截取所述包含数字表的图像。4.如权利要求1所述的方法,在检测所述包含数字表的图像之前,还包括:对获取得到的包含数字表的图像进行增强和/或去噪预处理,生成预处理之后的包含数字表的图像。5.如权利要求1所述的方法,检测所述包含数字表的图像,获得包含所述数字表盘的子图像,包括:检测所述包含数字表的图像中数字表盘的边框,获得以所述表盘边框为边界的子图像。6.如权利要求1所述的方法,当所述图像识别模型为卷积神经网络模型时,通过如下方式训练得到:获取已标注的数字表盘图像,其中,所述标注与数字表盘中的读数相同,所述读数具有指定的位数;以所述已标注的数字表盘图像作为训练样本,进行卷积神经网络模型训练,得到训练好的卷积神经网络模型,所述训练好的卷积神经网络模型用于识别数字表盘图像中的数字读数;其中,所述卷积神经网络的最后一层为全连接层,用于输出多个分支,所述多个分支的数量与指定位数相同,每个分支中均有对应于数字0至9的10个概率值输出项。7.如权利要求6所述的方法,以包含所述数字表盘的子图像作为输入,通过预先训练得到的卷积神经网络模型对其整体识别,生成所述数字表盘的数字读数的识别结果,包括:确定所述全连接层的各分支所对应的数值;按照预先指定的顺序排列所述数值得到识别结果。8.如权利要求7所述的方法,所述确定各分支所对应的数值,包括:针对任一分支,获取该分支下各概率值输出项的输出值;确定最大的输出值所对应的数字为该分支所对应的数值。9.一种数字表读数的识别装置,包括:获取模块,获取包含数字表的图像,在所述图像...

【专利技术属性】
技术研发人员:王运节李俊
申请(专利权)人:新智数字科技有限公司
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1