文字行几何畸变校正方法和装置制造方法及图纸

技术编号:5342015 阅读:282 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种文字行几何畸变校正方法和装置,属于光学字符识别领域。方法部分包括如下步骤:对二值图像中的各文字行进行提取;根据提取到的各文字行进行选取,选取基准文字行;判断基准文字行中的字块类型,根据字块类型分段抹黑基准文字行;将抹黑后的基准文字行进行采样后拟合出校正曲线,并根据校正曲线校正二值图像。本发明专利技术针对文字行的字块类型区别处理,对多种语种的文字行几何畸变图像均具有好的校正效果;采用分段游程抹黑技术进行游程抹黑,能够获取准确的校正曲线,校正效果好;适用于各行文字具有不同畸变的文字段的校正,适应性好;由于沿校正曲线各点的法线方向采样作为校正后图像的像素列,能够有效校正字符的畸变。

【技术实现步骤摘要】

本专利技术属于光学字符识别领域,特别涉及一种文字行几何畸变校正方法和装置
技术介绍
电子扫描笔(简称扫描笔)是OCR的重要应用之一。扫描笔的技术原理为光学摄 像头按照一定频率对被扫描资料进行连续拍照,获取被扫资料的图像序列后将图像序列拼 接成一幅全景图像并进行OCR处理。在扫描过程中,由于扫描笔的轴向旋转会导致得到的 全景图像中的文字行出现倾斜甚至弯曲,这会影响后续的OCR识别。因此,在得到全景图像 后,需要先对其进行几何畸变校正,将其中的文字行校正成水平行后才能进行后续的处理。对于文字行几何畸变图像的校正,一般是先要获取文字行的几何畸变曲线,这条 曲线也称为校正曲线,然后根据校正曲线对文字行几何畸变图像进行校正。基于这种思想 的一种典型方法是,先对文字行图像进行游程抹黑处理,然后通过穿越线对游程进行区段 划分,接下来分析游程区段以获取曲线拟合的采样点集并进行曲线拟合,最后根据校正曲 线利用图像错切技术,即根据校正位置对图像中的像素列进行竖直方向移动以完成校正。 该方法存在以下三点不足一是没有针对文字行的字块类型区别处理,其对由方块字构成 的文字行处理效果尚可,但对由非方块字构成的文字行的校正效果差;二是该方法采用全 局阈值进行游程抹黑,但一般不存在合理的全局阈值,从而抹黑效果差,导致校正效果差; 三是该方法在得到校正曲线后采取的图像错切校正方法,存在校正后字符变形的情况。
技术实现思路
本专利技术所要解决的技术问题为提供一种文字行几何畸变校正方法和装置,对文字 行的字块类型分类并分别处理,采用分段游程抹黑技术获取校正曲线,并沿校正曲线各点 的法线方向采样校正图像,对多种语种的文字行几何畸变图像均具有好的校正效果,适用 于具有不同畸变的文字段的校正。本专利技术公开了一种文字行几何畸变校正方法,包括如下步骤 步骤一对二值图像中的各文字行进行提取;步骤二 根据提取到的各文字行进行选取,选取基准文字行; 步骤三判断基准文字行中的字块类型,根据字块类型分段抹黑基准文字行; 步骤四将抹黑后的基准文字行进行采样后拟合出校正曲线,并根据校正曲线校正二 值图像。本专利技术还公开了一种文字行几何畸变校正装置,包括如下模块 提取模块对二值图像中的各文字行进行提取;选取模块根据提取到的各文字行进行选取,选取基准文字行; 抹黑模块判断基准文字行中的字块类型,根据字块类型分段抹黑基准文字行; 校正模块将抹黑后的基准文字行进行采样后拟合出校正曲线,并根据校正曲线校正二值图像。本专利技术文字行几何畸变校正方法和装置,具有以下优点1、针对文字行的字块类型区别处理,对多种语种的文字行几何畸变图像均具有好的校 正效果;2、采用分段游程抹黑技术,能够获取准确的校正曲线,校正效果好;适用于各行文字具 有不同畸变的文字段的校正,适应性好;3、由于沿校正曲线各点的法线方向采样作为校正后图像的像素列,本方法能够有效校 正字符的畸变。附图说明图1为本专利技术实施例之一的二值图像。图2为本专利技术文字行几何畸变校正方法的一个实施例的流程图。图3为本专利技术实施例流程图中步骤10的一个具体执行流程图。图4为本专利技术实施例之一的步骤101的连通域标记结果示意图。图5为本专利技术实施例之一的步骤103的第一尺度块示意图。图6为本专利技术实施例之一的步骤104的去掉较小第一尺度块后剩余第一尺度块的 示意图。图7为本专利技术实施例之一的步骤105的第二尺度块示意图。图8为本专利技术实施例之一的步骤106的第三尺度块示意图。图9为本专利技术实施例之一的步骤107的文字行示意图。图10为本专利技术实施例之一的步骤20的基准文字行示意图。图11为本专利技术实施例流程图中步骤30的一个具体执行流程图。图12为本专利技术实施例之一的步骤30中的子步骤的结果。图13为本专利技术实施例流程图中步骤40的一个具体执行流程图。图14为本专利技术实施例之一的步骤401的基准文字行的连通域合并结果示意图。图15为本专利技术实施例之一的步骤40中的子步骤的结果。图16为本专利技术实施例之一的步骤406的基准文字行的初始抹黑图像的示意图。图17为本专利技术实施例之一的步骤406的去掉不平滑凹陷或凸起后的基准文字行 的抹黑图像的示意图。图18为本专利技术实施例流程图中步骤50的一个具体执行流程图。图19为本专利技术实施例之一的步骤501的基准文字行抹黑图像的采样结果示意图。图20本专利技术实施例之一的步骤502的基准文字行抹黑图像的二次采样结果示意 图。图21本专利技术实施例之一的步骤503的校正曲线示意图。图22本专利技术实施例之一的步骤60的图像校正过程的示意图。6图23本专利技术实施例之一的校正结果图像。图M为本专利技术实施例之二的二值图像。图25为本专利技术实施例之二的步骤101的连通域标记结果示意图。图沈为本专利技术实施例之二的步骤103的第一尺度块示意图。图27为本专利技术实施例之二的步骤104的去掉较小第一尺度块后剩余第一尺度块 的示意图。图观为本专利技术实施例之二的步骤105的第二尺度块示意图。图四为本专利技术实施例之二的步骤106的第三尺度块示意图。图30为本专利技术实施例之二的步骤107的文字行示意图。图31为本专利技术实施例之二的步骤20的基准文字行示意图。图32为本专利技术实施例之二的步骤30中的子步骤的结果。图33为本专利技术实施例之二的步骤401的基准文字行的连通域合并结果示意图。图34为本专利技术实施例之二的步骤402的从基准文字行中挑选的用于抹黑的连通 域的示意图。图35为本专利技术实施例之二的步骤40中的子步骤的结果。图36为本专利技术实施例之二的步骤406的基准文字行的初始抹黑图像的示意图。图37为本专利技术实施例之二的步骤406的去掉不平滑凹陷或凸起后的基准文字行 的抹黑图像的示意图。图38为本专利技术实施例之二的步骤501的基准文字行抹黑图像的采样结果示意图。图39本专利技术实施例之二的步骤502的基准文字行抹黑图像的二次采样结果示意 图。图40本专利技术实施例之二的步骤503的校正曲线示意图。图41本专利技术实施例之二的校正结果图像。具体实施例方式为了能更清楚地理解本专利技术的
技术实现思路
,特举以下两个实施例详细说明。实施例之一本专利技术公开了一种文字行几何畸变校正方法和装置。首先获取二值图像中的文字行并 从中选出作为校正基准的文字行,然后判断基准文字行的字块类型,再根据字块类型利用 分段游程抹黑算法抹黑基准文字行图像,接下来对抹黑图像采样并根据采样点集计算校正 曲线,最后在畸变图像中沿校正曲线的法线方向采样作为校正后图像的像素列,从而完成 对文字行几何畸变图像的校正。如图1所示,提供扫描笔获取的字块类型为方块字的二值图像为第一实施例,图2 所示为实施例的流程图,具体处理步骤如下步骤10,对二值图像中的各文字行进行提取。本实施例中采用了一种自底向上的文字 行提取方法,如图3所示,具体步骤如下步骤101,对二值图像中的各连通域进行统计,根据得到的字符宽度和字符高度对各连 通域进行合并,得到第一尺度块。在本实施例中,采用8-连通域标记,标记结果如图4所示。计算各连通域的宽度并从小到大排序,从最大宽度值开始依次累加各个宽度值对应的连通 域的个数,当累加个数大于等于连通域总个数的十分之一时停止累加,取此时对应的连通 域的宽度值为字符宽度;计算各连通域的高度并从小到大排序,从最大高度值开始依次累 加各个高度值对应的连通域的个数,当累本文档来自技高网
...

【技术保护点】
一种文字行几何畸变校正方法,其特征在于,包括如下步骤:步骤一:对二值图像中的各文字行进行提取;步骤二:根据提取到的各文字行进行选取,选取基准文字行;步骤三:判断基准文字行中的字块类型,根据字块类型分段抹黑基准文字行;步骤四:将抹黑后的基准文字行进行采样后拟合出校正曲线,并根据校正曲线校正二值图像。

【技术特征摘要】

【专利技术属性】
技术研发人员:李永彬
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1