【技术实现步骤摘要】
本专利技术一般地涉及字符识别。具体而言,本专利技术涉及一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法。
技术介绍
对于光学字符识别(OCR,Optical Character Recognition)引擎来说,遮挡字符的识别是其中最难解决的问题之一。典型的例子是文档图像中可见的水印字符,经常被前景内容遮挡,因此OCR引擎很难对其进行识别。例如,如附图说明图1所示,由于前景的遮挡,很难直接由OCR引擎提取并准确识别水印中的文字“关系者外秘”。另外,随着数字照相机的普及并且功能越来越多,更多的遮挡情形对OCR提出了更严峻的挑战。例如,现在更加频繁地将照相机用作便携式“扫描仪”,以便从硬拷贝文档、 书本、报纸、以及标语、海报和其他媒介等中捕获文本。此时,经常会由于光线不均勻、不期望的或存在的遮挡物体、甚至照相机内部处理的影响,导致出现文本被遮挡,由此对OCR引擎提出了挑战。为此,需要一种能够对遮挡的字符进行识别的技术
技术实现思路
有鉴于此,本专利技术提出了一种遮挡字符恢复装置及其方法、以及一种遮挡字符识别装置及其方法,能够对遮挡的字符进行恢复,从而能够提 ...
【技术保护点】
1.一种遮挡字符恢复方法,包括:根据包括要被恢复的遮挡字符在内的目标字符的笔划宽度计算图像块尺寸;在包括目标字符的输入图像的目标区域中标记源区域;针对源区域中的像素生成参考图像块,其中将源区域中的每一个像素作为一个参考图像块的中心;提取要被填充的输入图像的前景的边界;针对前景边界上的每一个像素,根据以该像素为中心的图像块的复杂度,计算填充优先权;使用参考图像块中最相似的图像块,填充以具有最高优先权的像素为中心的图像块;以及如果前景没有全部填充完毕,则重复执行提取要被填充的输入图像的前景的边界及随后的处理。
【技术特征摘要】
【专利技术属性】
技术研发人员:常兰兰,孙俊,诹访美佐子,武部浩明,于浩,直井聪,堀田悦伸,何源,
申请(专利权)人:富士通株式会社,
类型:发明
国别省市:JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。