文本图像的校正方法技术

技术编号：3843402 阅读：177 留言：0更新日期：2012-04-11 18:40

本发明专利技术文本图像的校正方法，属于光学字符识别领域，包括以下步骤：定位文本图像中的字符区域并提取疑似字符；对疑似字符进行识别，若识别可信度大于单个字符可信度参考值，则字符有效方向为正向，否则将疑似字符分别逆时针旋转来判断有效方向；提取具有有效方向的字符至有效字符集，直到某方向识别可信度累加值高于既定的识别可信度，则提取对应的文本方向；校正图像的方向，进行文本图像的识别并输出。本方法有效滤除了不可靠的字符的影响，避免文字区域中的不可靠的区域对文字方向判断的影响。对于复杂文本图像、含有噪声的文本图像、质量较差的文本图像具有较好的自适应，能较快、正确的判断出文本图像方向，进而有效地进行文本图像的识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于光学字符识别(OCR)领域，涉及一种。
技术介绍
当待识别的文档通过图像录入装置(如扫描仪、照相机等)转换成文本图像时，其文字方向不一定是正向的，可能旋转了 90°、180°、270°。若是直接将非正向的文本图像送入识别弓I擎进行识别，无法得到正确的识别结果。为保证文本图像中的信息能够正确被识别、并保存成电子文档，目前通常采取两种方案。方案一手工校正图像方向。该方法耗时耗力，尤其对大量图像进行操作时，效率及其低下。方案二利用指定区域内的识别信息，对文本图像方向进行校正。方案二实现了文本图像识别的自动化，大大提高了效率。申请号为98105597. 4的专利提出了一种文本图像方向判断校正的方法，该方法检测文本图像内部一个字符区域的预定部分，并识别该区域，最后根据该区域中的字符平均识别可信度，判断文本图像方向。该方法对于包含纯文字的文本图像具有良好效果。但是，由于没有对待识别区域内的字符进行有效性的筛选，若是选取的区域中包含本身包含非文字区域(例如图标、噪声等)或是识别可靠度低的区域(例如成像质量差的字符)，则可能造成该区域平均识别可靠性低于参考值。此时可能对四个方向均进行识别，大大增加了判断时间和系统资源。此外，区域中包含的字符数过少，判断准确度比较低，而区域中包含的字符数过多，速度会比较慢。因此，需要提供一种对图像适应性更强的方法，不受区域选择限制及区域中的不良因素的干扰，有效判断各类复杂的文本图像。
技术实现思路
本专利技术目的在于提供一种，适用于各类复杂的文本图像。在定位文本图像中的字符区域后，根据若干字符方向性判...

【技术保护点】
一种文本图像的校正方法，其特征在于，包括以下步骤：步骤一：定位文本图像中的字符区域；步骤二：对字符区域中的字符块进行基于结构特征的分类，并从中提取疑似字符；步骤三：用字符识别引擎对提取的疑似字符进行识别；若得到的识别可信度大于单个字符可信度参考值，则字符有效方向为正向，转到步骤四；否则将疑似字符分别逆时针旋转９０°、１８０°、２７０°进行识别，若各方向的识别可信度仅有一个大于单个字符可信度参考值，则对应的方向为该字符的有效方向，转到步骤四；否则转到步骤二；步骤四：逐个提取具有有效方向的字符至有效字符集，计算其中各字符的四个方向上的识别可信度累加值，直到某方向识别可信度累加值高于既定的识别可信度；将该累加值对应的方向作为文本方向；步骤五：根据文本方向判断结果，校正图像的方向，进行文本图像的识别并输出。

【技术特征摘要】

【专利技术属性】
技术研发人员：万鑫，刘正珍，
申请(专利权)人：汉王科技股份有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人