一种图像识别方法、装置及设备制造方法及图纸

技术编号:35241763 阅读:22 留言:0更新日期:2022-10-19 09:47
本发明专利技术公开了一种图像识别方法、装置及设备,涉及图像处理技术领域,以解决相关技术对于钢板图像中位置不固定的喷码和钢印区域无法有效定位,识别率较低的问题。该方法包括:获取目标对象图像,目标对象图像是通过至少一个相机对目标对象进行拍摄得到的拼接图像;将目标对象图像切分成N个图像分块;对N个图像分块的目标区域按对应于目标对象图像中的坐标位置进行聚类处理;根据聚类处理结果确定目标对象图像中的目标图像区域,目标图像区域为包含完整字符图像特征的区域;对目标图像区域进行字符识别,得到字符序列。本发明专利技术实施例能够对于高分辨率的目标对象图像中位置不固定的字符图像区域进行有效定位,提高识别率。提高识别率。提高识别率。

【技术实现步骤摘要】
一种图像识别方法、装置及设备


[0001]本专利技术涉及图像处理
,尤其涉及一种图像识别方法、装置及设备。

技术介绍

[0002]相关技术中,对于工业场景下如钢板表面字符的识别,通常采用如图1a所示的技术方案,首先使用固定位置的工业面阵相机对来料钢板进行拍摄,通过传统算法确定钢板上面积较大的喷码位置,而后根据喷码的位置将线扫相机及光源移动到相应位置进行线扫拍摄,获得字符图像;获取后的图像会通过固定模式,即喷码和钢印的相对位置及角度固定,对喷码和钢印区域进行位置划分和固定的角度旋转,从而获得喷码和钢印这两种字符的待识别图像,最后采用传统的光学字符识别(Optical Character Recognition,OCR)或基于目标检测的深度学习方法识别图像中的字符信息。
[0003]然而,上述技术方案中,对于高分辨率的钢板扫描图像中位置不固定的喷码和钢印区域则无法有效定位,进而识别率较低。

技术实现思路

[0004]本专利技术实施例提供一种图像识别方法、装置及设备,以解决相关技术对于高分辨率的钢板扫描图像中位置不固定的喷码和钢印区域无法有效定位,进而识别率较低的问题。
[0005]第一方面,本专利技术实施例提供了一种图像识别方法,包括:
[0006]获取目标对象图像,其中,所述目标对象图像是通过至少一个相机对目标对象进行拍摄得到的拼接图像;
[0007]将所述目标对象图像切分成N个图像分块,其中,N为大于1的整数;
[0008]对所述N个图像分块的目标区域按对应于所述目标对象图像中的坐标位置进行聚类处理,其中,所述目标区域为包含字符图像特征的区域;
[0009]根据聚类处理结果确定所述目标对象图像中的目标图像区域,其中,所述目标图像区域为包含完整字符图像特征的区域;
[0010]对所述目标图像区域进行字符识别,得到字符序列。
[0011]可选的,所述对所述N个图像分块的目标区域按对应于所述目标对象图像中的坐标位置进行聚类处理,包括:
[0012]使用目标聚类算法对所述N个图像分块的目标区域按照对应于所述目标对象图像中的坐标位置进行聚类处理,其中,所述目标聚类算法为聚类中心数量不固定的聚类算法。
[0013]可选的,所述根据聚类处理结果确定所述目标对象图像中的目标图像区域,包括:
[0014]对于属于同一聚类的目标区域中的目标像素点,在所述目标对象图像中生成所述目标像素点的包围矩形框;
[0015]确定所述包围矩形框中的区域为目标图像区域。
[0016]可选的,所述对所述目标图像区域进行字符识别,包括:
[0017]对所述目标图像区域进行字符行定位;
[0018]对字符行定位结果中定位失败的字符行进行修正,并输出修正后的字符行定位结果;
[0019]依据所述修正后的字符行定位结果,对定位出的字符行进行字符识别。
[0020]可选的,所述对字符行定位结果中定位失败的字符行进行修正,包括以下至少一项:
[0021]在所述字符行定位结果中指示第一字符行的头部像素或尾部像素定位失败的情况下,补齐所述第一字符行中缺失的头部像素或尾部像素信息;
[0022]在所述字符行定位结果中指示第二字符行的中间部分存在头部像素或尾部像素的情况下,将所述第二字符行的中间部分的头部像素或尾部像素修正为中间像素。
[0023]可选的,所述补齐所述第一字符行中缺失的头部像素或尾部像素信息,包括:
[0024]在所述第一字符行中缺失头部像素的情况下,将所述第一字符行中位于头部的m个像素修正为头部像素,m为大于1的整数;获取所述第一字符行的尾部像素的第一偏移量,并将所述第一偏移量的反向偏移量确定为所述第一字符行的头部像素的偏移量,其中,所述第一字符行的头部像素的偏移量用于确定所述第一字符行的起始位置;
[0025]在所述第一字符行中缺失尾部像素的情况下,将所述第一字符行中位于尾部的n个像素修正为尾部像素,n为大于1的整数;获取所述第一字符行的头部像素的第二偏移量,并将所述第二偏移量的反向偏移量确定为所述第一字符行的尾部像素的偏移量,其中,所述第一字符行的尾部像素的偏移量用于确定所述第一字符行的结束位置。
[0026]可选的,所述对定位出的字符行进行字符识别,包括:
[0027]对定位出的字符行进行方向判断和修正,以使字符行方向为正向显示方向;
[0028]对方向修正后的字符行进行字符识别。
[0029]可选的,所述对方向修正后的字符行进行字符识别,包括:
[0030]利用卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)对方向修正后的字符进行字符识别,其中,所述CRNN的训练数据为等宽字符。
[0031]可选的,所述将所述目标对象图像切分成N个图像分块之后,所述对所述N个图像分块的目标区域按对应于所述目标对象图像中的坐标位置进行聚类处理之前,所述方法还包括:
[0032]采用图像分割算法对所述N个图像分块进行目标区域的分割处理,得到所述N个图像分块中每个图像分块的目标区域。
[0033]第二方面,本专利技术实施例还提供一种图像识别装置,包括:
[0034]获取模块,用于获取目标对象图像,其中,所述目标对象图像是通过至少一个相机对目标对象进行拍摄得到的拼接图像;
[0035]第一处理模块,用于将所述目标对象图像切分成N个图像分块,其中,N为大于1的整数;
[0036]第二处理模块,用于对所述N个图像分块的目标区域按对应于所述目标对象图像中的坐标位置进行聚类处理,其中,所述目标区域为包含字符图像特征的区域;
[0037]确定模块,用于根据聚类处理结果确定所述目标对象图像中的目标图像区域,其中,所述目标图像区域为包含完整字符图像特征的区域;
[0038]识别模块,用于对所述目标图像区域进行字符识别,得到字符序列。
[0039]可选的,所述第二处理模块用于使用目标聚类算法对所述N个图像分块的目标区域按照对应于所述目标对象图像中的坐标位置进行聚类处理,其中,所述目标聚类算法为聚类中心数量不固定的聚类算法。
[0040]可选的,所述确定模块包括:
[0041]生成单元,用于对于属于同一聚类的目标区域中的目标像素点,在所述目标对象图像中生成所述目标像素点的包围矩形框;
[0042]确定单元,用于确定所述包围矩形框中的区域为目标图像区域。
[0043]可选的,所述识别模块包括:
[0044]定位单元,用于对所述目标图像区域进行字符行定位;
[0045]修正单元,用于对字符行定位结果中定位失败的字符行进行修正,并输出修正后的字符行定位结果;
[0046]识别单元,用于依据所述修正后的字符行定位结果,对定位出的字符行进行字符识别。
[0047]可选的,所述修正单元包括以下至少一项:
[0048]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,包括:获取目标对象图像,其中,所述目标对象图像是通过至少一个相机对目标对象进行拍摄得到的拼接图像;将所述目标对象图像切分成N个图像分块,其中,N为大于1的整数;对所述N个图像分块的目标区域按对应于所述目标对象图像中的坐标位置进行聚类处理,其中,所述目标区域为包含字符图像特征的区域;根据聚类处理结果确定所述目标对象图像中的目标图像区域,其中,所述目标图像区域为包含完整字符图像特征的区域;对所述目标图像区域进行字符识别,得到字符序列。2.根据权利要求1所述的方法,其特征在于,所述对所述N个图像分块的目标区域按对应于所述目标对象图像中的坐标位置进行聚类处理,包括:使用目标聚类算法对所述N个图像分块的目标区域按照对应于所述目标对象图像中的坐标位置进行聚类处理,其中,所述目标聚类算法为聚类中心数量不固定的聚类算法。3.根据权利要求1所述的方法,其特征在于,所述根据聚类处理结果确定所述目标对象图像中的目标图像区域,包括:对于属于同一聚类的目标区域中的目标像素点,在所述目标对象图像中生成所述目标像素点的包围矩形框;确定所述包围矩形框中的区域为目标图像区域。4.根据权利要求1所述的方法,其特征在于,所述对所述目标图像区域进行字符识别,包括:对所述目标图像区域进行字符行定位;对字符行定位结果中定位失败的字符行进行修正,并输出修正后的字符行定位结果;依据所述修正后的字符行定位结果,对定位出的字符行进行字符识别。5.根据权利要求4所述的方法,其特征在于,所述对字符行定位结果中定位失败的字符行进行修正,包括以下至少一项:在所述字符行定位结果中指示第一字符行的头部像素或尾部像素定位失败的情况下,补齐所述第一字符行中缺失的头部像素或尾部像素信息;在所述字符行定位结果中指示第二字符行的中间部分存在头部像素或尾部像素的情况下,将所述第二字符行的中间部分的头部像素或尾部像素修正为中间像素。6.根据权利要求5所述的方法,其特征在于,所述补齐所述第一字符行中缺失的头部像素或尾部像素信息,包括:在所述第一字符行中缺失头部像素的情况下,将所述第一字符行中位于头部的m个像素修正为头部像素,m为大于1的整数;获取所述第一字符行的尾部像素的第一偏移量,并将所述第一偏移量的反向偏移量确定为所述第一字符行的头部像素的偏移量,其中,...

【专利技术属性】
技术研发人员:褚凯彭昱舟梅勋
申请(专利权)人:中移智行网络科技有限公司中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1