光学字符识别方法及装置制造方法及图纸

技术编号:10567068 阅读:186 留言:0更新日期:2014-10-22 17:44
本公开提供了一种光学字符识别方法及装置。其中,光学字符识别方法包括:从原始图像中提取字符块;基于笔画宽度变换,确定所述字符块中断裂的笔画;对所述断裂的笔画补齐得到准识别图像;对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。本公开能够利用笔画宽度变换对字符中笔画出现的断裂进行补齐,提高了光学字符识别的识别准确率。

【技术实现步骤摘要】
光学字符识别方法及装置
本公开涉及图像处理领域,具体而言,涉及光学字符识别方法及装置。
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)技术在图像处理领域占有重要地位,在信息自动化和办公自动化中具有广泛的应用。OCR是指对文本资料、卡片等的图像文件进行分析识别处理,获取文字及版面信息的过程。提高识别准确率是OCR技术中很重要的课题。在实际应用中,需要进行光学字符识别的原始图像中经常会存在字符中笔画出现断裂的情况,例如,在充值卡中,用户在挂掉涂层的时候,经常会有残留,导致充值卡的密码被遮挡,从而导致比划断裂。相关技术的OCR容易将断裂的笔画识别为两个笔画,导致识别准确率降低。
技术实现思路
本公开的目的在于提供光学字符识别方法及装置,以解决上述的问题。根据本公开实施例的第一方面,本公开提供了一种光学字符识别方法,包括:从原始图像中提取字符块;基于笔画宽度变换,确定所述字符块中断裂的笔画;对所述断裂的笔画补齐得到准识别图像;对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。本公开的实施例提供的技术方案,能够利用笔画宽度变换对字符中笔画出现的断裂进行补齐,提高了光学字符识别的识别准确率。上述光学字符识别方法还可以包括如下特点,所述基于笔画宽度变换,确定所述字符块中断裂的笔画包括:设置断裂长度阈值;确定所述字符块的笔画区域像素点所在笔画的方向;判断在所述笔画区域像素点所在笔画的方向上,所述笔画区域像素点与其下一个笔画区域像素点之间是否存在笔画宽度突变区域,且所述笔画宽度突变区域的长度小于所述断裂长度阈值,所述笔画宽度突变区域为空白区域、笔画宽度增大值大于设定第一宽度变化阈值或笔画宽度减小值大于设定第二宽度变化阈值的区域;当存在所述笔画宽度突变区域时,确定所述笔画区域像素点所在笔画为断裂的笔画,确定所述笔画宽度突变区域为所述断裂的笔画中的断裂区域。本公开的实施例提供的技术方案,利用笔画宽度变换确定断裂的笔画,可以准确地找到断裂区域,为补齐断裂的笔画提供基础,有助于提高字符识别的识别准确率。上述光学字符识别方法还可以包括如下特点,所述对所述断裂的笔画补齐包括:设所述断裂的笔画中的断裂区域沿其所在笔画的方向与其所在笔画的交界像素点分别为第一交界点和第二交界点,将所述第一交界点和所述第二交界点之间沿所述第一交界点的笔画方向、宽度等于所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度值的平均值的区域设置为准笔画区域,其中,所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度值通过笔画宽度变换算法获得;将所述准笔画区域的灰度值设置为与所述字符块中笔画区域的灰度值一致的值。本公开的实施例提供的技术方案,通过将准笔画区域的灰度值设置为与字符块中笔画区域的灰度值一致的值这种方式对断裂的笔画进行补齐,能够有效消除断裂笔画,有助于提高字符识别的识别准确率。上述光学字符识别方法还可以包括如下特点,所述对所述断裂的笔画补齐还包括:当所述断裂区域为所述断裂的笔画中的笔画宽度显著增大区域时,将所述断裂区域中处于所述准笔画区域之外的笔画区域的灰度值设置为与所述字符块中背景区域的灰度值一致的值。本公开的实施例提供的技术方案,在进行笔画补齐的同时还可以进一步去除噪声,有助于提高字符识别的识别准确率。上述光学字符识别方法还可以包括如下特点,在所述对所述准识别图像进行字符识别之前,还包括:基于笔画宽度变换,检测所述字符块中的噪声;消除所述噪声。本公开的实施例提供的技术方案,不仅能够对字符中笔画出现的断裂进行补齐,还能够利用笔画宽度变换进一步去除噪声,进一步提高了字符识别的识别准确率。上述光学字符识别方法还可以包括如下特点,所述基于笔画宽度变换,检测所述字符块中的噪声包括:确定所述字符块的笔画宽度W,字符块i的笔画宽度等于第一宽度平均值与第二宽度平均值之和的二分之一,所述第一宽度平均值为字符块i的平均笔画宽度值,字符块i的平均笔画宽度值等于字符块i中所有笔画区域像素点的笔画宽度值的平均值,所述第二宽度平均值为从所述原始图像中提取出的所有字符块的平均笔画宽度值的平均值,i为自然数,笔画区域像素点的笔画宽度值通过笔画宽度变换算法获得;设置字符笔画宽度误差d;判断所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域是否满足如下成噪条件之一:所述笔画区域的设定范围内没有与所述笔画方向相符合的笔画、沿所述笔画区域的笔画宽度变化波动值大于设定波动阈值或者所述笔画区域的笔画长度小于设定长度阈值;当所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域满足所述成噪条件之一时,判定所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域为噪声。本公开的实施例提供的技术方案,利用笔画宽度变换检测出字符块中的噪声,为消除噪声提供基础,有助于提高字符识别的识别准确率。上述光学字符识别方法还可以包括如下特点,所述消除所述噪声包括:将所述噪声的灰度值设置为与所述字符块中背景区域的灰度值一致的值。本公开的实施例提供的技术方案,能够有效地消除字符块中的噪声,有助于提高字符识别的识别准确率。上述光学字符识别方法还可以包括如下特点,所述笔画宽度变换算法包括:对所述字符块进行边缘检测,找到边缘像素点,所述边缘像素点具有一个方向梯度值;按照任一边缘像素点p的梯度方向dp沿路线r查找与边缘像素点p相匹配的边缘像素点q,边缘像素点q的梯度方向dq与边缘像素点p的梯度方向dp相反,其中,r=p+n*dp,n大于或等于0;当查找到所述边缘像素点q时,指定所述边缘像素点p与所述边缘像素点q的连线上每个像素点的笔画宽度值为所述边缘像素点p与所述边缘像素点q之间的欧式距离。本公开的实施例提供的技术方案,能够有效确定笔画宽度值,为补齐断裂的笔画提供基础。根据本公开实施例的第二方面,本公开提供了一种光学字符识别装置,包括:提取模块,用于从原始图像中提取字符块;确定模块,用于基于笔画宽度变换,确定所述字符块中断裂的笔画;补齐模块,用于对所述断裂的笔画补齐得到准识别图像;识别模块,用于对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。本公开的实施例提供的技术方案,能够利用笔画宽度变换对字符中笔画出现的断裂进行补齐,提高了光学字符识别的识别准确率。上述光学字符识别装置还可以包括如下特点,所述确定模块包括:阈值设置单元,用于设置断裂长度阈值;笔画方向确定单元,用于确定所述字符块的笔画区域像素点所在笔画的方向;突变判断单元,用于判断在所述笔画区域像素点所在笔画的方向上,所述笔画区域像素点与其下一个笔画区域像素点之间是否存在笔画宽度突变区域,且所述笔画宽度突变区域的长度小于所述断裂长度阈值,所述笔画宽度突变区域为空白区域、笔画宽度增大值大于设定第一宽度变化阈值或笔画宽度减小值大于设定第二宽度变化阈值的区域;断裂笔画确定单元,用于当存在所述笔画宽度突变区域时,确定所述笔画区域像素点所在笔画为断裂的笔画,确定所述笔画宽度突变区域为所述断裂的笔画中的断裂区域。本公开的实施例提供的技术方案,利用笔画宽度变换确定断裂的笔画,可以准确地找到断裂区域,为补齐断裂的笔画提供基础,有助于提高字符识别的识别准确率。上述光学字符识别装置还可以包括如本文档来自技高网...
光学字符识别方法及装置

【技术保护点】
一种光学字符识别方法,其特征在于,包括:从原始图像中提取字符块;基于笔画宽度变换,确定所述字符块中断裂的笔画;对所述断裂的笔画补齐得到准识别图像;对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。

【技术特征摘要】
1.一种光学字符识别方法,其特征在于,包括:从原始图像中提取字符块;基于笔画宽度变换,确定所述字符块中断裂的笔画;设所述断裂的笔画中的断裂区域沿其所在笔画的方向与其所在笔画的交界像素点分别为第一交界点和第二交界点,将所述第一交界点和所述第二交界点之间沿所述第一交界点的笔画方向、宽度等于所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度值的平均值的区域设置为准笔画区域,其中,所述第一交界点的笔画宽度值和所述第二交界点的笔画宽度值通过笔画宽度变换算法获得;将所述准笔画区域的灰度值设置为与所述字符块中笔画区域的灰度值一致的值以得到准识别图像;对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息。2.根据权利要求1所述的光学字符识别方法,其特征在于,所述基于笔画宽度变换,确定所述字符块中断裂的笔画包括:设置断裂长度阈值;确定所述字符块的笔画区域像素点所在笔画的方向;判断在所述笔画区域像素点所在笔画的方向上,所述笔画区域像素点与其下一个笔画区域像素点之间是否存在笔画宽度突变区域,且所述笔画宽度突变区域的长度小于所述断裂长度阈值,所述笔画宽度突变区域为空白区域、笔画宽度增大值大于设定第一宽度变化阈值或笔画宽度减小值大于设定第二宽度变化阈值的区域;当存在所述笔画宽度突变区域时,确定所述笔画区域像素点所在笔画为断裂的笔画,确定所述笔画宽度突变区域为所述断裂的笔画中的断裂区域。3.根据权利要求1所述的光学字符识别方法,其特征在于,所述对所述断裂的笔画补齐还包括:当所述断裂区域为所述断裂的笔画中的笔画宽度显著增大区域时,将所述断裂区域中处于所述准笔画区域之外的笔画区域的灰度值设置为与所述字符块中背景区域的灰度值一致的值。4.根据权利要求1所述的光学字符识别方法,其特征在于,在所述对所述准识别图像进行字符识别之前,还包括:基于笔画宽度变换,检测所述字符块中的噪声;消除所述噪声。5.根据权利要求4所述的光学字符识别方法,其特征在于,所述基于笔画宽度变换,检测所述字符块中的噪声包括:确定所述字符块的笔画宽度W,字符块i的笔画宽度等于第一宽度平均值与第二宽度平均值之和的二分之一,所述第一宽度平均值为字符块i的平均笔画宽度值,字符块i的平均笔画宽度值等于字符块i中所有笔画区域像素点的笔画宽度值的平均值,所述第二宽度平均值为从所述原始图像中提取出的所有字符块的平均笔画宽度值的平均值,i为自然数,笔画区域像素点的笔画宽度值通过笔画宽度变换算法获得;设置字符笔画宽度误差d;判断所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域是否满足如下成噪条件之一:所述笔画区域的设定范围内没有与所述笔画方向相符合的笔画、沿所述笔画区域的笔画宽度变化波动值大于设定波动阈值或者所述笔画区域的笔画长度小于设定长度阈值;当所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域满足所述成噪条件之一时,判定所述字符块中笔画宽度处于区间[W-d,W+d]之外的笔画区域为噪声。6.根据权利要求4所述的光学字符识别方法,其特征在于,所述消除所述噪声包括:将所述噪声的灰度值设置为与所述字符块中背景区域的灰度值一致的值。7.根据权利要求1或5所述的光学字符识别方法,其特征在于,所述笔画宽度变换算法包括:对所述字符块进行边缘检测,找到边缘像素点,所述边缘像素点具有一个方向梯度值;按照任一边缘像素点p的梯度方向dp沿路线r查找与边缘像素点p相匹配的边缘像素点q,边缘像素点q的梯度方向dq与边缘像素点p的梯度方向dp相反,其中,r=p+n*dp,n大于或等于0;当查找到所述边缘像素点q时,指定所述边缘像素点p与所述边缘像素点q的连线上每个像素点的笔画宽度值为所述边缘像素点p与所述边缘像素点q之间的欧式距离。8.一种光学字符识别装置,其特征在于,包括:提取模块,用于从原始图像中提取字符块;确定模块,用于基于笔画宽度变换,确定所述字符块中断裂的笔画;补齐模块,用于对所述断裂的笔画补齐得到准识别图像;识别模块,用于对所述准识别图像进行字符识别,得到所述准识别图像中的文本信息;其中,所述补齐模块包括:准笔画区域设置单元,设所述断裂的笔画中的断裂区域沿其所在笔画的方向与其所在笔画的交界像素点分别为第一交界点和第二交界点,所述准笔画区域设置单元用于将所述第一交界点和所述第二交界点之间沿所述第一交界点的笔画方向、宽度等于所述第一交界点的笔画宽度值和所述第...

【专利技术属性】
技术研发人员:陈志军张祺深臧虎
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1