字符识别方法技术

技术编号:2924857 阅读:186 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及字符识别方法。根据一个方面的实施方式,提供了一种从一区域中具有框架和多个字符的图像中识别出字符的方法,该方法包括以下步骤:区域划分步骤,该区域划分步骤将所述区域分成分别具有多个局部图像的多个局部区域;模板图像提供步骤,该模板图像提供步骤提供具有基准框架图像的模板图像;图像差别计算步骤,该图像差别计算步骤分别计算所述多个局部图像与所述模板图像的所述基准框架图像之间的差别;不重合度计算步骤,该不重合度计算步骤基于所述多个局部图像与所述基准框架图像的该差别的平均来计算所述图像与所述模板图像的不重合度;以及字符识别步骤,该字符识别步骤修正所述不重合度,从而从所述图像中识别出该多个字符。

【技术实现步骤摘要】

本专利技术涉及用于读取图像信息的方法。
技术介绍
将图像信息读取至计算机的处理可以使用光学字符识别(在下文中被称为OCR)技术。OCR技术是一种根据图像上呈现的形状来检测字符 并且输出可以由计算机处理的文本代码信息的技术。例如,OCR技术可 以被用于读取报告。报告具有其上要写入字符的预定区域。该区域由绘 制在报告上的框线来限定。OCR技术必须准确地检测出要写入字符的所 述区域。为了准确检测要写入字符的区域,有效的是,标识框线的位置、 角、尺寸等。框线的位置例如可以基于作为预先保持的模板的报告图像 数据的框线信息与从输入的报告的图像数据中获取的框线信息之间的偏 移量来精确标识。报告的框线信息例如可以包括多个彩色信息片段或者包括多个密度 级(其将被称为彩色报告)。在将OCR技术应用于彩色报告时,删除读 取的彩色报告图像信息的预定彩色信息片段。从删除了该彩色信息片段 之后的报告图像数据中检测文本信息。当从彩色报告中删除彩色信息片 段时,报告图像信息的部分框线信息也可能被删除,或者可能残留报告 图像信息的部分不需要的噪声信息。通用霍夫变换(Generalized Hough Transform)可用作用于计算模板 图像信息与输入的图像信息之间的偏移量的方法。通用霍夫变换保持作 为基准图像的具有复杂且不同的结构的报告模板。通用霍夫变换针对诸 如平行、旋转以及扩展/收縮各变形参数限定投票空间(voting space)并 且通过针对各参数在投票空间进行投票来估计输入图像的偏移量。通用 霍夫变换可以在输入报告图像是具有复杂结构的报告图像并且在框线中具有噪声和/或中断的情况下,估计该输入报告图像与模板的报告图像之间的偏移量。在日本特开专利公报10-27208和日本专利3756309中公开 了涉及上述技术的技术。然而,通用霍夫变换需要用于实现投票空间的巨大存储器空间和用 于投票的大量处理时间。
技术实现思路
根据一实施方式的一个方面,提供了一种从一区域中具有框架和多 个字符的图像中识别出字符的方法,所述方法包括以下步骤区域划分 步骤,该区域划分步骤将所述区域分成分别具有多个局部图像的多个局 部区域;模板图像提供步骤,该模板图像提供步骤提供具有基准框架图 像的模板图像;图像差别计算步骤,该图像差别计算步骤分别计算所述 多个局部图像与所述模板图像的所述基准框架图像之间的差别;不重合 度计算步骤,该不重合度计算步骤基于所述多个局部图像与所述基准框 架图像的所述差别的平均来计算所述图像与所述模板图像的不重合度; 以及字符识别步骤,该字符识别步骤修正所述不重合度,从而从所述图 像中识别出所述多个字符。附图说明图1是图像处理装置1的硬件构造图2是从接收输入图像信息17到输出修正图像的处理的流程图3是输入图像信息17的实施例;图4是二进制化的模板图像信息18的图像;图5是Sobel的水平边缘过滤器的设置值21-1;图6是Sobel的垂直边缘过滤器的设置值21-2;图7是将输入图像信息17分成多个局部图像区所得的图8是用于应用Bucket方法的说明图9是模板图像信息18的局部图像区;图10是比较矢量190的实施例;图11是投票处理的流程图12是投票空间的构造实施例;图13是投票处理的原理图14是用于计算与各像素相对应的偏移参数的说明图15是示出了输入图像信息17的局部区域55的图。具体实施例方式图1是图像处理装置1的硬件构造图。图像处理装置1包括连接至 总线107的控制模块101、存储器102、输入模块103、存储模块104以 及输出模块105。控制模块101控制整个图像处理装置1。例如,控制模块101可以 是中央处理单元(CPU)。控制模块101执行在存储器102中展开的图像 处理程序108。图像处理程序108使控制模块101充任轮廓点集创建模块、 局部图像投票模块、参数窄化模块、局部图像粘贴模块等。控制模块101 具有这样的功能在输入图像信息17为报告的情况下,将呈现在报告上 的字符串图像(stringimage)转换成计算机可以处理的文本代码信息。存储器102是要展开存储在存储模块104中的图像处理程序108的 存储区。存储器102是存储控制模块101执行图像处理程序108时产生 的各种操作结果的存储区。存储器102可以是随机存储存储器(RAM)。输入模块103接收与用户要指定给控制模块101的各种命令或图像 有关的信息。输入模块103可以是键盘、鼠标器或触摸板。输入模块103 例如可以是图像扫描器。存储模块104例如可以是硬盘驱动器。存储模 块104可以存储图像处理程序108、作为基准报告图像的基准图像信息(其 在下文中将被称为模板图像信息)18、输入图像信息17等。输出模块105 输出图像处理的结果信息。输出模块105例如可以是显示器(显示装置)。轮廓点集创建模块提取来自输入图像信息17的图像内呈现的形状 的轮廓。轮廓点集创建模块创建构成输入图像信息17中包含的框线信息 的轮廓(笔划)的点集(输入图像轮廓点集)。框线用于限定报告内的文 本的输入区域,或者更清楚地示出报告的特征。轮廓点集创建模块可以预先标识模板图像信息18中包含的轮廓的点集(模板轮廓点集)。例如, 轮廓点集创建模块在登记模板图像信息18时限定模板轮廓点集。轮廓点 集创建模块将限定的模板轮廓点集存储到存储模块104中。轮廓点集创 建模块获取与将输入图像信息17分成格子图案所得的各局部图像相对应 的输入图像轮廓点集和模板轮廓点集。局部图像投票模块使用与将输入图像信息17分成格子图案所得的 各局部图像相对应的模板轮廓点集和输入图像轮廓点集,基于通用霍夫 变换的原理,在示出偏移参数的投票空间投票。作为通过局部图像投票 模块投票的结果,投票空间内具有较高的投票频率的区域可以是偏移参 数的估计值。参数窄化模块按步进方式将通用霍夫变换的操作参数(分辨率)从 低分辨率切换成高分辨率。如果目标精度是第二小数位,则该操作参数 是第一小数位的值。在获取了第一小数位的候选之后,将该操作参数假 定为第一小数位的值。通过重复这个处理,计算出具有目标精度的偏移 参数。参数窄化模块允许逐步窄化偏移参数的候选,同时抑制轮廓点数 量和/或表示偏移参数的投票空间的尺寸的大量增加。局部图像粘贴模块在根据将图像分成格子图案所得的区域计算出的 偏移参数中提取具有较高可靠性的偏移参数。局部图像粘贴模块通过内 插局部图像区的偏移参数来计算针对输入图像信息17内各像素的偏移参 数。结果,即使在局部图像区之间偏移参数不同的情况下,局部图像粘 贴模块也可以平滑地粘贴局部图像区。局部图像粘贴模块输出利用与输 入图像信息17内的像素相对应的偏移参数进行位置修正所得的修正图 像。接下来,对根据这种实施方式的从接收输入图像信息17到输出修正 图像的处理进行说明。图2是从接收输入图像信息17到输出修正图像的 处理的流程图。控制模块101根据输入图像信息17创建轮廓点集(S01)。 控制模块101将输入图像信息17分成多个局部图像区(S02)。控制模块 101采用预定尺寸的矩形将输入图像信息17划分成格子图案。划分出的 矩形被称为局部图像区。控制模块101对各局部图像区执行通用霍夫变 换而执行投票处理(S03)。当在本文档来自技高网
...

【技术保护点】
一种计算机可读介质,该计算机可读介质存储有执行用于从一区域中具有框架和多个字符的图像中识别出字符的处理的程序,所述处理包括以下步骤: 区域划分步骤,该区域划分步骤将所述区域分成分别具有多个局部图像的多个局部区域; 模板图像提供步骤,该模板图像提供步骤提供具有基准框架图像的模板图像; 图像差别计算步骤,该图像差别计算步骤分别计算所述多个局部图像与所述模板图像的所述基准框架图像之间的差别; 不重合度计算步骤,该不重合度计算步骤基于所述多个局部图像与所述基准框架图像的所述差别的平均来计算所述图像与所述模板图像的不重合度;以及 字符识别步骤,该字符识别步骤修正所述不重合度,从所述图像识别出所述多个字符。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:藤本克仁诹访美佐子直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1