基于OCR识别反馈的文档图像倾斜校正方法技术

技术编号：6603105 阅读：764 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了图像识别技术领域中的一种基于OCR识别反馈的文档图像倾斜校正方法。包括：输入文档图像；选择文档图像中的一个矩形区域；分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别，并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib；判断Ia和Ib的大小，当Ia≥Ib时，则使用倾斜角度ka对整个文档图像进行校正处理；当Ia＜Ib时，则使用倾斜角度kb对整个文档图像进行校正处理。本发明专利技术使得校正结果更加准确有效，解决了现有图像处理方法的倾斜校正算法不具有良好通用性的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像识别
，尤其涉及一种基于OCR识别反馈的文档图像倾斜校正方法。
技术介绍
目前，大多数图像识别技术中使用的倾斜校正算法的计算精度在很大程度上受图像纹理(如文本的字体、字型、脚本以及是否含有图片)的影响，不具有良好的通用性，有些算法只对某种或某几种语言的处理取得较好的结果，有些算法对文本中的大幅图片敏感。另外，目前还没有一种算法能够在处理多语言文本时，产生有效的结果。针对上述图像识别技术中使用的倾斜校正算法存在的缺陷，本专利技术提供了一种基于OCR识别反馈的文档图像倾斜校正方法，利用既有的图像识别技术，具体是利用文本线跟踪算法和非边界行的文本线跟踪算法，对文档的一个小矩形区域进行倾角检测并校正得到结果，再利用OCR识别技术，根据该小矩形区域识别后得到的参数确定对该文档识别效果最好的算法，最后用这种反馈得到算法对整个文档进行校正。
技术实现思路
本专利技术的目的在于，提供一种基于OCR识别反馈的文档图像倾斜校正方法，用于解决现有图像处理方法的倾斜校正算法不具有良好通用性的问题。技术方案是，一种基于OCR识别反馈的文档图像倾斜校正方法，其特征是所述方法包括步骤1:输入文档图像；步骤2 选择文档图像中的一个矩形区域；步骤3 分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别，并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib ；步骤4 判断Ia和Ib的大小，当Ia彡Ib时，则使用倾斜角度ka对整个文档图像进行校正处理；当Ia < Ib时，则使用倾斜角度kb对整个文档图像进行校正处理。所述利...

【技术保护点】
１．一种基于ＯＣＲ识别反馈的文档图像倾斜校正方法，其特征是所述方法包括：步骤１：输入文档图像；步骤２：选择文档图像中的一个矩形区域；步骤３：分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行ＯＣＲ识别，并分别得到文档图像的倾斜角度ｋａ和ｋｂ以及识别效果参数Ｉａ和Ｉｂ；步骤４：判断Ｉａ和Ｉｂ的大小，当Ｉａ≥Ｉｂ时，则使用倾斜角度ｋａ对整个文档图像进行校正处理；当Ｉａ＜Ｉｂ时，则使用倾斜角度ｋｂ对整个文档图像进行校正处理。

【技术特征摘要】
1.一种基于OCR识别反馈的文档图像倾斜校正方法，其特征是所述方法包括步骤1:输入文档图像；步骤2 选择文档图像中的一个矩形区域；步骤3 分别利用文本线跟踪算法和非边界行的文本线跟踪算法对文档图像的选定区域进行OCR识别，并分别得到文档图像的倾斜角度ka和kb以及识别效果参数Ia和Ib ；步骤4 判断Ia和Ib的大小，当Ia > Ib时，则使用倾斜角度kji整个文档图像进行校正处理；当Ia < Ib时，则使用倾斜角度kb对整个文档图像进行校正处理。2.根据权利要求1所述的一种基于OCR识别反馈的文档图像倾斜校正方法，其特征是所述利用文本线跟踪算法对文档图像的选定区域进行OCR识别具体包括步骤101 利用文本线跟踪算法对文档图像的选定区域进行处理，得到文档图像的倾斜角度ka ；步骤102 利用倾斜角度1^对文档图像的选定区域进行校正处...

【专利技术属性】
技术研发人员：童立靖，宋丽华，曾凡锋，付晓玲，王景中，
申请(专利权)人：北方工业大学，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人