遮挡字符恢复装置及其方法、遮挡字符识别装置及其方法制造方法及图纸

技术编号:6865500 阅读:217 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法。根据本发明专利技术的遮挡字符恢复方法包括:根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。

【技术实现步骤摘要】

本专利技术一般地涉及字符识别。具体而言,本专利技术涉及一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法。
技术介绍
对于光学字符识别(OCR,Optical Character Recognition)引擎来说,遮挡字符的识别是其中最难解决的问题之一。典型的例子是文档图像中可见的水印字符,经常被前景内容遮挡,因此OCR引擎很难对其进行识别。例如,如附图说明图1所示,由于前景的遮挡,很难直接由OCR引擎提取并准确识别水印中的文字“关系者外秘”。另外,随着数字照相机的普及并且功能越来越多,更多的遮挡情形对OCR提出了更严峻的挑战。例如,现在更加频繁地将照相机用作便携式“扫描仪”,以便从硬拷贝文档、 书本、报纸、以及标语、海报和其他媒介等中捕获文本。此时,经常会由于光线不均勻、不期望的或存在的遮挡物体、甚至照相机内部处理的影响,导致出现文本被遮挡,由此对OCR引擎提出了挑战。为此,需要一种能够对遮挡的字符进行识别的技术
技术实现思路
有鉴于此,本专利技术提出了一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法,能够对遮挡的字符进行恢复,从而能够提高遮挡字符的识别准确率。为了实现上述目的,根据本专利技术的一个方面,提供了一种遮挡字符恢复方法包括 根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块; 以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。优选地,按照下式计算填充优先权P (ρ)权利要求1.一种遮挡字符恢复方法,包括根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸; 在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。2.根据权利要求1所述的遮挡字符恢复方法,其中按照下式计算填充优先权P(P)3.根据权利要求1所述的遮挡字符恢复方法,其中图像块尺寸按照公式=SW *仏计算,Sff表示目标字符的笔划宽度。4.根据权利要求1所述的遮挡字符恢复方法,其中在包括目标字符的输入图像的目标区域中标记源区域包括生成包括目标字符的像素及其图像块中的所有相邻像素的第一掩模; 生成包括除前景像素及其图像块中的所有相邻像素之外的整个目标区域的第二掩模;以及提取第一掩模和第二掩模的重叠区域作为源区域。5.根据权利要求1所述的遮挡字符恢复方法,还包括压缩输入图像和/或筛减参考图像块。6.根据权利要求1至5中任一权利要求所述的遮挡字符恢复方法,还包括 提取目标字符的轮廓像素;根据提取的轮廓像素捕获目标字符的线段;根据捕获的线段选择假想为一个笔划的成对线的平行线段;根据选择的平行线段连接共线线段为平行线对;以及使用目标字符的灰度值填充每对平行线对限定的区域。7.根据权利要求6所述的遮挡字符恢复方法,还包括 根据捕获的线段估计目标字符的笔划宽度;以及估计目标字符在投影轴上的字符宽度和字符高度,其中,所述选择的平行线段在Hough变换域中应当满足下列条件1)对于线1 ( θ 1, P 1)、线 2( θ 2,P 2)和笔划宽度 SW,满足 θ 1 = θ 2 以及 a * SW< I P I-P 2| < b * SW, θ表示线的旋转角度,P表示线到零点的距离,a SW和b SW为阈值;2)对于水平线段,沿着水平方向θ的投影线之间的距离小于字符宽度,并且对于垂直线段,沿着垂直方向(90- θ )的投影线之间的距离小于字符高度;以及3)两个线段之间的像素位于笔划内部而不是背景;以及其中,所述共线线段应当满足下列条件1)对于线1(Θ1,pi)、线2(Θ2,P 2)和笔划宽度SWdiMei= θ 2以及I P I-P 2|小于阈值⑵对于水平线段,沿着水平方向θ的投影线之间的距离小于字符宽度,并且对于垂直线段,沿着垂直方向(90-θ )的投影线之间的距离小于字符高度;以及3)两个线段之间的像素位于笔划内部而不是背景。8.一种遮挡字符识别方法,包括分割输入图像中的文本区域为要被识别的目标字符、背景和前景; 根据权利要求1至7中任一权利要求所述的方法恢复文本区域中要被识别的遮挡字符;以及识别恢复的字符。9.一种遮挡字符恢复装置,包括图像块尺寸计算单元,配置为根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;源区域标记单元,配置为在包括目标字符的输入图像的目标区域中标记源区域; 参考图像块生成单元,配置为针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;边界提取单元,配置为提取要被填充的输入图像的前景的边界; 填充优先权计算单元,配置为针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;前景填充单元,配置为使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及判断单元,配置为如果前景没有全部填充完毕,则重复执行边界提取单元、填充优先权计算单元、以及前景填充单元的处理。全文摘要本专利技术公开了一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法。根据本专利技术的遮挡字符恢复方法包括根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。文档编号G06K9/20GK102208022SQ201010137689公开日2011年10月5日 申请日期2010年3月31日 优先权日2010年3月31日专利技术者于浩, 何源, 堀田悦伸, 孙俊, 常兰兰, 武部浩明, 直井聪, 诹访美佐子 申请人:富士通株式会社本文档来自技高网...

【技术保护点】
1.一种遮挡字符恢复方法,包括:根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。

【技术特征摘要】

【专利技术属性】
技术研发人员:常兰兰孙俊诹访美佐子武部浩明于浩直井聪堀田悦伸何源
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1