光学字符识别区域的定位方法、系统及其存储介质技术方案

技术编号:29209727 阅读:18 留言:0更新日期:2021-07-10 00:46
本发明专利技术涉及字符识别技术领域,具体涉及一种光学字符识别区域的定位方法、系统及其存储介质,其方法包括:获取原始图像并转换为灰度图像,再进行二值化处理得到原始二值图像;在图像中标记出连通域;获取连通域的高、宽参数;将灰度图像中的当前像素点进行自适应阈值计算,得到第一二值图像;再去除其图像中的噪声区域,得到第二二值图像;将第一二值图像分别进行积分和哈尔特征图计算得到梯度图;根据梯度图的梯度频率得到y轴定位区间;根据y轴定位区间确定目标区域,并对第二二值图像进行截取,对图像中的连通域的间距进行统计,根据连通域之间的间距确定x轴定位区间;本发明专利技术其能实现对定位区域的快速定位,提高字符识别的稳定性和准确率。定性和准确率。定性和准确率。

【技术实现步骤摘要】
光学字符识别区域的定位方法、系统及其存储介质


[0001]本专利技术涉及字符识别
,具体涉及一种光学字符识别区域的定位方法、一种光学字符识别区域的定位系统以及一种存储有上述方法的可读存储介质。

技术介绍

[0002]随着信息技术的发展,人们在社会生活中常常会通过光学字符识别(Optical Character Recognition,OCR),其是指利用电子设备采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术;因此,OCR技术是实现无纸化的计算机自动处理的关键技术之一,而衡量一个OCR系统性能好坏的主要指标包括:拒识率、误识率、识别速度等。
[0003]在OCR技术中,其中一个关键步骤是进行字符区域进行定位;而在现有的技术中,当纸质材料中存在复杂的背景干扰,现有的OCR识别方法不能满足快速定位分割OCR字符区域,导致OCR识别稳定性较差,字符识别的准确率较低。

技术实现思路

[0004]为克服上述缺陷,本专利技术的目的即在于提供一种能快速定位分割OCR字符区域的定位方法、定位系统以及存储有该定位方法的可读存储介质。
[0005]本专利技术的目的是通过以下技术方案来实现的:
[0006]本专利技术是一种光学字符识别区域的定位方法,其包括:
[0007]获取待识别的原始图像及其宽度参数,并对所述原始图像进行灰度转换得到灰度图像,然后对所述灰度图像进行二值化处理,得到原始二值图像;
[0008]在所述原始二值图像中,通过连通域标记算法标记出若干个连通域;并获取每个所述连通域的高、宽的属性参数;并通过对所有连通域的高、宽的属性参数进行统计,将出现频率最高的宽、高的属性参数定义为实际的宽、高和面积的属性参数;
[0009]利用自适应阈值二值化算法,将所述灰度图像中的当前像素点与邻域像素块的灰度值进行阈值计算,得到第一二值图像;
[0010]根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像;
[0011]将所述第一二值图像进行积分得到积分图,并根据实际的宽、高的属性参数确定哈尔特征值,再根据所述哈尔特征值对该积分图进行哈尔特征图计算得到梯度图;将所述梯度图进行二值化处理后,沿y轴坐标从小到大方向对其梯度频率进行遍历并通过判断其是否大于字符数量阈值,确定y轴起点和y轴终点,得到y轴定位区间;
[0012]根据y轴定位区间和所述原始图像的宽度参数确定目标区域,根据目标区域对所述第二二值图像进行截取,得到第三二值图像;在所述第三二值图像中对相邻的连通域之间的间距进行统计,并计算出其平均间距范围;根据连通域之间的间距和连通域的实际的宽属性参数,确定x轴起点和x轴终点,得到x轴定位区间。
[0013]在本专利技术中,所述沿y轴坐标从小到大方向对其梯度频率进行遍历并通过判断其是否大于字符数量阈值,确定y轴起点和y轴终点,得到y轴定位区间包括:
[0014]沿y轴坐标从小到大方向对其梯度频率进行遍历并判断其是否大于字符数量阈值,若大于阈值则将当前的y方向位置确定为y轴起点;并继续沿y轴方向判断其梯度频率是否大于字符数量阈值,若小于阈值,则将当前的y方向位置确定为y轴终点,得到y轴定位区间。
[0015]在本专利技术中,所述根据连通域之间的间距和连通域的实际的宽属性参数,确定x轴起点和x轴终点,得到x轴定位区间包括:
[0016]沿x轴坐标从小到大方向对连通域之间的间距进行遍历,确定第一个满足平均间距范围的两相邻连通域,并将x轴坐标小的连通域的x轴坐标作为x轴起点,并继续沿x轴方向判断后续连通域的间距和实际的宽属性参数是否在预定范围内,若不在,则将当前的连通域的x轴坐标作为x轴终点,得到x轴定位区间。
[0017]在本专利技术中,所述根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像包括:
[0018]在所述第一二值图像中,通过八邻接点的连通域标记算法标记出若干个第二连通区域,并将所述第二连通区域定义为连通域,获取每个所述连通域的高、宽的属性参数;
[0019]根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像。
[0020]在本专利技术中,所述根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像包括:
[0021]获取到所有连通域中的最大面积参数和最小面积参数,并通过所述最大面积参数确定最大面积阈值,通过所述最小面积参数确定最小面积阈值,然后计算出面积阈值范围;
[0022]分别判断每个连通域的面积是否在面积阈值范围内,若不在,则将该连通域定义为噪声区域,并对其从第一二值图像中进行去除。
[0023]在本专利技术中,所述在所述原始二值图像中,通过连通域标记算法标记出若干个连通区域包括:
[0024]在所述原始二值图像中,通过四邻接点的连通域标记算法标记出若干个第一连通区域,并将所述第一连通区域定义为连通域。
[0025]在本专利技术中,所述利用自适应阈值二值化算法,将所述灰度图像中的当前像素点与邻域像素块的灰度值进行阈值计算之前还包括:
[0026]计算实际的宽、高的属性参数与预设的标准宽、高的属性参数之间的大小比例值,根据所述大小比例值对所述灰度图像进行缩放。
[0027]在本专利技术中,所述利用自适应阈值二值化算法,将所述灰度图像中的当前像素点与邻域像素块的灰度值进行阈值计算,得到第一二值图像包括:
[0028]获取灰度图像中与当前像素点相邻的像素点的灰度值,并根据相邻的像素点的灰度值对灰度阈值进行设定;再根据设定后的灰度阈值进行自适应阈值二值化计算,得到第一二值图像。
[0029]基于同样的构思,本专利技术还提供一种光学字符识别区域的定位系统,其包括:
[0030]原始图像获取模块,所述原始图像获取模块用于获取待识别的原始图像及其宽度
参数;
[0031]灰度图像转换模块,所述灰度图像转换模块与所述原始图像获取模块相连接,用于对所述原始图像进行灰度转换得到灰度图像;
[0032]原始二值图像生成模块,所述原始二值图像生成模块与所述灰度图像转换模块相连接,用于对所述灰度图像进行二值化处理,得到原始二值图像;
[0033]连通域生成模块,所述连通域生成模块与所述原始二值图像生成模块相连接,用于在所述原始二值图像中,通过连通域标记算法标记出若干个连通域,并获取每个所述连通域的高、宽的属性参数;
[0034]实际参数获取模块,所述实际参数获取模块与所述连通域生成模块相连接,用于通过对所有连通域的高、宽的属性参数进行统计,将出现频率最高的宽、高的属性参数定义为实际的宽、高和面积的属性参数;
[0035]第一二值图像生成模块,所述第一二值图像生成模块与所述灰度图像转换模块相连接,用于利用自适应阈值二值化算法,将所述灰度图像中的当前像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种光学字符识别区域的定位方法,其特征在于,包括:获取待识别的原始图像及其宽度参数,并对所述原始图像进行灰度转换得到灰度图像,然后对所述灰度图像进行二值化处理,得到原始二值图像;在所述原始二值图像中,通过连通域标记算法标记出若干个连通域;并获取每个所述连通域的高、宽的属性参数;并通过对所有连通域的高、宽的属性参数进行统计,将出现频率最高的宽、高的属性参数定义为实际的宽、高和面积的属性参数;利用自适应阈值二值化算法,将所述灰度图像中的当前像素点与邻域像素块的灰度值进行阈值计算,得到第一二值图像;根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像;将所述第一二值图像进行积分得到积分图,并根据实际的宽、高的属性参数确定哈尔特征值,再根据所述哈尔特征值对该积分图进行哈尔特征图计算得到梯度图;将所述梯度图进行二值化处理后,沿y轴坐标从小到大方向对其梯度频率进行遍历并通过判断其是否大于字符数量阈值,确定y轴起点和y轴终点,得到y轴定位区间;根据y轴定位区间和所述原始图像的宽度参数确定目标区域,根据目标区域对所述第二二值图像进行截取,得到第三二值图像;在所述第三二值图像中对相邻的连通域之间的间距进行统计,并计算出其平均间距范围;根据连通域之间的间距和连通域的实际的宽属性参数,确定x轴起点和x轴终点,得到x轴定位区间。2.根据权利要求1所述的光学字符识别区域的定位方法,其特征在于,所述沿y轴坐标从小到大方向对其梯度频率进行遍历并通过判断其是否大于字符数量阈值,确定y轴起点和y轴终点,得到y轴定位区间包括:沿y轴坐标从小到大方向对其梯度频率进行遍历并判断其是否大于字符数量阈值,若大于阈值则将当前的y方向位置确定为y轴起点;并继续沿y轴方向判断其梯度频率是否大于字符数量阈值,若小于阈值,则将当前的y方向位置确定为y轴终点,得到y轴定位区间。3.根据权利要求2所述的光学字符识别区域的定位方法,其特征在于,所述根据连通域之间的间距和连通域的实际的宽属性参数,确定x轴起点和x轴终点,得到x轴定位区间包括:沿x轴坐标从小到大方向对连通域之间的间距进行遍历,确定第一个满足平均间距范围的两相邻连通域,并将x轴坐标小的连通域的x轴坐标作为x轴起点,并继续沿x轴方向判断后续连通域的间距和实际的宽属性参数是否在预定范围内,若不在,则将当前的连通域的x轴坐标作为x轴终点,得到x轴定位区间。4.根据权利要求3所述的光学字符识别区域的定位方法,其特征在于,所述根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像包括:在所述第一二值图像中,通过八邻接点的连通域标记算法标记出若干个第二连通区域,并将所述第二连通区域定义为连通域,获取每个所述连通域的高、宽的属性参数;根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像。5.根据权利要求4所述的光学字符识别区域的定位方法,其特征在于,所述根据所述连通域的高、宽的属性参数去除所述第一二值图像中的噪声区域,得到第二二值图像包括:
获取到所有连通域中的最大面积参数和最小面积参数,并通过所述最大面积参数确定最大面积阈值,通过所述最小面积参数确定最小面积阈值,然后计算出面积阈值范围;分别判断每个连通域的面积是否在面积阈值范围内,若不在,则将该连通域定义为噪声区域,并对其从第一二值图像中进行去除。6.根据权利要求5所述的光学字符识别区...

【专利技术属性】
技术研发人员:丁凡
申请(专利权)人:深圳市雄帝科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1