一种字符识别方法、系统、计算机设备及存储介质技术方案

技术编号:35473078 阅读:17 留言:0更新日期:2022-11-05 16:19
本发明专利技术属于里程标图像识别技术领域,公开了一种字符识别方法、系统、计算机设备及存储介质,所述方法包括:提取二值化图像中的各连通区域;根据高度占比、相对位置和预先获取的标注图像的第一属性值,从各连通区域中选取包含字符的目标连通区域;根据目标连通区域的个数、目标连通区域的宽度占比和标注图像的第二属性值,从目标连通区域中分割出单个字符所对应的字符图像;将字符识别结果按照所述相对位置进行组合,得到里程标图像中的里程标值。上述方法利用高度占比来识别目标连通区域,可以消除图像中字符大小不一对于连通区域的大小造成的影响,利用高度占比和相对位置可以识别出图像中的噪音,从而实现了准确地批量识别里程标图像中的字符。程标图像中的字符。程标图像中的字符。

【技术实现步骤摘要】
一种字符识别方法、系统、计算机设备及存储介质


[0001]本专利技术属于里程标图像识别
,尤其涉及一种字符识别方法、系统、计算机设备及存储介质。

技术介绍

[0002]目前,在隧道病害检测中,一般采用车辆装载检测设备在隧道中穿行,检测设备向隧道内壁、地面等位置发射检测信号来获取检测数据。为了确定检测数据对应的定位,需要计算车辆行驶的里程。
[0003]可以在车轮上安装编码器来获取车辆行驶的里程,或者在车辆上安装定位相机,通过拍摄的图像来计算车辆行驶的里程。但是,车轮可能会发生打滑,定位相机拍摄的图像可能会模糊,使得上述两种方法计算的里程均可能存在误差。消除误差的解决方法可以是,隧道中一般有里程标,采用相机拍摄隧道中的里程标,然后对里程标图像中的字符进行识别,用识别到的里程读数来对通过上述两种方法得到的里程误差进行校正。
[0004]然而,因为隧道中光线较暗,使拍摄的里程标图像质量较差,部分字符存在粘连情况、图像中包含噪音较多;并且,安装在车辆上的相机处于运动状态,每次拍摄时距离里程标的相对距离也不一样,使得字符在不同的图像中大小不一。这些情况对于批量识别里程标图像中的字符带来了困难。
[0005]因此,如何批量识别包含粘连字符、噪音较多、字符大小不一的里程标图像中的字符,是本领域一个亟待解决的问题。

技术实现思路

[0006]针对现有技术存在的问题,本专利技术提供了一种字符识别方法、系统、计算机设备及存储介质。
[0007]本专利技术是这样实现的,一种字符识别方法,所述字符识别方法包括:提取二值化图像中的各连通区域;根据高度占比、相对位置和预先获取的标注图像的第一属性值,从各连通区域中选取包含字符的目标连通区域;根据目标连通区域的个数、目标连通区域的宽度占比和标注图像的第二属性值,从目标连通区域中分割出单个字符所对应的字符图像;将字符识别结果按照所述相对位置进行组合,得到里程标图像中的里程标值。
[0008]进一步,所述字符识别方法包括:
[0009]对包含待识别字符的里程标图像进行二值化处理,得到二值化图像;
[0010]提取所述二值化图像中的各连通区域,并分别获取所述各连通区域的属性值;所述属性值包括所述连通区域在所述二值化图像中的高度占比、宽度占比,以及所述连通区域在所述二值化图像中的相对位置;
[0011]根据所述高度占比、所述相对位置和预先获取的标注图像的对应属性值范围,从所述各连通区域中选取包含字符的目标连通区域;所述标注图像为预先获取的已标注出字符的里程标图像,所述标注图像与所述里程标图像采集自同一路段;
[0012]根据所述目标连通区域的个数、所述目标连通区域的宽度占比和所述标注图像的对应属性值范围,从所述目标连通区域中分割出单个字符所对应的字符图像;
[0013]对所述字符图像中的字符进行识别,得到对应的字符识别结果;
[0014]将所述字符识别结果按照所述相对位置进行组合,得到所述里程标图像中的里程标值。
[0015]进一步,所述分别获取所述各连通区域的属性值包括:
[0016]获取所述连通区域的高度、宽度和所述二值化图像的高度、宽度;
[0017]计算所述连通区域的高度与所述二值化图像的高度的比值,得到所述连通区域在所述二值化图像中的高度占比;
[0018]计算所述连通区域的宽度与所述二值化图像的宽度的比值,得到所述连通区域在所述二值化图像中的宽度占比;
[0019]确定所述连通区域的最小外接矩形;
[0020]计算所述最小外接矩形的各个边分别与所述二值化图像的最近的边的距离;
[0021]如所述距离得到所述连通区域在所述二值化图像中的相对位置。
[0022]进一步,在如所述高度占比和所述相对位置,从所述连通区域中选取包含字符的目标连通区域之前还包括:
[0023]获取标注图像样本集;所述标注图像样本集包括多个标注图像;
[0024]获取所述标注图像中所包含的每个字符的属性值;所述属性值包括所述字符在所述标注图像中的高度占比、宽度占比、所述字符的边缘像素点在所述标注图像中的相对位置;所述高度占比为所述字符的高度与所述标注图像的高度的比值,所述宽度占比为所述字符的宽度与所述标注图像的宽度的比值,所述相对位置为所述字符在所述标注图像中的相对位置;
[0025]如所述标注图像样本集中的每个字符的高度占比、宽度占比、相对位置,得到高度占比范围、宽度占比范围、相对位置范围;
[0026]所述如所述高度占比、所述相对位置和预先获取的标注图像的对应属性值,从所述各连通区域中选取包含字符的目标连通区域,包括:
[0027]确定所述连通区域是否同时满足第一条件和第二条件;所述第一条件为:所述连通区域的高度占比属于所述高度占比范围;所述第二条件为:所述连通区域在所述里程标图像中的相对位置属于所述相对位置范围;
[0028]若是,则将所述连通区域确定为包含字符的目标连通区域。
[0029]进一步,在确定所述连通区域是否同时满足第一条件和第二条件之后还包括:
[0030]若所述连通区域不能同时满足所述第一条件、所述第二条件,则将所述连通区域确定为不包含字符的连通区域。
[0031]进一步,所述如所述目标连通区域的宽度占比和所述标注图像的对应属性值,从所述目标连通区域中分割出单个字符所对应的字符图像包括:
[0032]从所述标注图像样本集中获取单个所述标注图像中所包含字符的最高数量,得到第一数量;
[0033]确定所述里程标图像中的目标连通区域的数量,得到第二数量;
[0034]若所述第二数量等于所述第一数量,则如所述连通区域在所述二值化图像中的宽
度占比,从所述目标连通区域中分割出单个字符所对应的字符图像;
[0035]若所述第二数量小于所述第一数量,则确定所述目标连通区域的宽度占比与所述宽度占比范围的比值;
[0036]如所述比值确定所述目标连通区域包括的字符数;
[0037]如所述字符数从所述目标连通区域中平均分割出单个字符所对应的字符图像。
[0038]进一步,所述对所述字符图像中的字符进行识别包括:
[0039]利用神经网络对所述字符图像进行图像识别,得到所述字符对应的预识别结果及所述预识别结果对应的置信度值;
[0040]在所述置信度值大于第一阈值的情况下,将所述预识别结果作为字符识别结果。
[0041]本专利技术的另一目的在于提供一种字符识别系统,所述字符识别系统包括:
[0042]二值化模块,用于对包含待识别字符的里程标图像进行二值化处理,得到二值化图像;
[0043]提取模块,用于提取所述二值化图像中的各连通区域,并分别获取所述各连通区域的属性值;所述属性值包括所述连通区域在所述二值化图像中的高度占比、宽度占比,以及所述连通区域在所述二值化图像中的相对位置;
[0044]选取模块,用于如所述高度占比本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种字符识别方法,其特征在于,所述字符识别方法包括:提取二值化图像中的各连通区域;根据高度占比、相对位置和预先获取的标注图像的第一属性值,从各连通区域中选取包含字符的目标连通区域;根据目标连通区域的个数、目标连通区域的宽度占比和标注图像的第二属性值,从目标连通区域中分割出单个字符所对应的字符图像;将字符识别结果按照所述相对位置进行组合,得到里程标图像中的里程标值。2.如权利要求1所述的字符识别方法,其特征在于,所述字符识别方法包括:对包含待识别字符的里程标图像进行二值化处理,得到二值化图像;提取所述二值化图像中的各连通区域,并分别获取所述各连通区域的属性值;所述属性值包括所述连通区域在所述二值化图像中的高度占比、宽度占比,以及所述连通区域在所述二值化图像中的相对位置;根据所述高度占比、所述相对位置和预先获取的标注图像的对应属性值范围,从所述各连通区域中选取包含字符的目标连通区域;所述标注图像为预先获取的已标注出字符的里程标图像,所述标注图像与所述里程标图像采集自同一路段;根据所述目标连通区域的个数、所述目标连通区域的宽度占比和所述标注图像的对应属性值范围,从所述目标连通区域中分割出单个字符所对应的字符图像;对所述字符图像中的字符进行识别,得到对应的字符识别结果;将所述字符识别结果按照所述相对位置进行组合,得到所述里程标图像中的里程标值。3.如权利要求2所述的字符识别方法,其特征在于,所述分别获取所述各连通区域的属性值包括:获取所述连通区域的高度、宽度和所述二值化图像的高度、宽度;计算所述连通区域的高度与所述二值化图像的高度的比值,得到所述连通区域在所述二值化图像中的高度占比;计算所述连通区域的宽度与所述二值化图像的宽度的比值,得到所述连通区域在所述二值化图像中的宽度占比;确定所述连通区域的最小外接矩形;计算所述最小外接矩形的各个边分别与所述二值化图像的最近的边的距离;如所述距离得到所述连通区域在所述二值化图像中的相对位置。4.如权利要求2所述的字符识别方法,其特征在于,在如所述高度占比和所述相对位置,从所述连通区域中选取包含字符的目标连通区域之前,还包括:获取标注图像样本集;所述标注图像样本集包括多个标注图像;获取所述标注图像中所包含的每个字符的属性值;所述属性值包括所述字符在所述标注图像中的高度占比、宽度占比、所述字符的边缘像素点在所述标注图像中的相对位置;所述高度占比为所述字符的高度与所述标注图像的高度的比值,所述宽度占比为所述字符的宽度与所述标注图像的宽度的比值,所述相对位置为所述字符在所述标注图像中的相对位置;如所述标注图像样本集中的每个字符的高度占比、宽度占比、相对位置,得到高度占比
范围、宽度占比范围、相对位置范围。5.如权利要求2所述的字符识别方法,其特征在于,所述如所述高度占比、所述相对位置和预先获取的标注图像的对应属性值,从所述各连通区域中选取包含字符的目标连通区域,包括:确定所述连通区域是否同时满足第一条件和第二条件;所述第一条件为:所述连通区域的高度占比...

【专利技术属性】
技术研发人员:樊晓东孟俊华樊晓莉张宜霞杨维
申请(专利权)人:宽衍河北智能装备有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1