一种光学字符识别结果的校验方法及装置制造方法及图纸

技术编号:14412426 阅读:69 留言:0更新日期:2017-01-12 00:24
本发明专利技术提供了光学字符识别结果的校验方法及装置,涉及字符识别领域。该方法,采用为模板图上的参考点设置不同权值的方式,其通过先获取了识别结果图和模板图,其中,所述模板图上阵列的设置有多个参考点;之后,再根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;最后,再判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。由于为每个参考点设置了相应的权值,因此,不再只是判断识别结果图中的图形是否在图版图中出现,而是采用更为精确的方式计算识别结果图的匹配值,再依据该匹配值进行判断,提高了判断的准确程度。

【技术实现步骤摘要】

本专利技术涉及字符识别领域,具体而言,涉及光学字符识别结果的校验方法及装置
技术介绍
OCR(OpticalCharacterRecognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(IntelligentCharacterRecognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。实际应用中没有任何字符识别算法(或方法)能保证100%的识别正确率。尤其在某些应用场合,字符受印刷质量、噪声污染和成像效果不佳等因素影响,识别率会大打折扣。因此,需要一种方法来提升识别过程的可靠性,字符校验技术(OCV)应运而生。OCV是一种用于检查光学字符识别(OCR)字符串的打印或标记质量并确认其易辨识性的机器视觉软件工具。该技术除了可以检查所呈现的字符串内容是否正确,还可以检查字符串的质量、对比度和清晰度,并对品质不合格的样品进行标记或剔除。具体地,OCV就是利用比识别算法可靠性更高的字符校验方法来检测识别结果,给出对识别结果的一个评价,即信任该识别结果或是否定该结果。通过字符校验,可以纠正很大部分字符误识,进而提升系统可靠性。字符校验作为增强系统识别可靠性的一种手段,就要求其方法是简单并有效的。常用的字符校验方法主要是基于模板匹配。模板匹配的简单性、直接性和有效性是显而易见的,但是由于字符校验的精度要求比单纯的字符识别要高,而一般的模板匹配方法由于模板过于单一,对字符变化的适应能力差,匹配精度较低,在做字符校验时其可靠性也大打折扣。但传统技术中的字符校验过程中所使用的模板较为简单,难以保证使用需求。
技术实现思路
本专利技术的目的在于提供光学字符识别结果的校验方法,以提高对字符识别结果进行校验的成功率。第一方面,本专利技术实施例提供了光学字符识别结果的校验方法,包括:获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,所述根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值包括:按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,所述参考点包括骨架点和外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,还包括按照如下方式确定骨架点:获取多个清晰度较高的候选图;分别对每个候选图进行二值化处理,得到每个候选图的二值化图形;将所述总次数超过预设阈值的参考点作为骨架点,所述总次数每个参考点在全部候选图中出现的次数之和。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,还包括按照如下方式确定每个外围点的权值:按照不同的二值化阈值,对目标候选图分别进行多次二值化处理,以得到不同二值化阈值所对应的第二识别图;按照如下方式对每个外围点赋予权值,第一外围点的权值高于第二外围点的权值,其中,第一外围点是使用较低二值化阈值进行二值化处理得到的第二识别图中的基准外围点;第二外围点是使用较高二值化阈值进行二值化处理得到的第二识别图中的外围点中,非基准外围点的外围点。结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,还包括按照如下方式确定每个外围点的权值:分别获取每个外围点和骨架点的坐标;分别计算每个外围点与最接近的骨架点之间的参考距离;依据所述参考距离的数值大小为每个外围点赋予权值,所述外围点的权值与参考距离的数值呈负相关性。结合第一方面,本专利技术实施例提供了第一方面的第六种可能的实施方式,其中,步骤所述根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值,包括:计算每个全部第一识别图的匹配参考值的匹配平均值,并将所述匹配平均值作为所述识别结果图的匹配值。第二方面,本专利技术实施例还提供了光学字符识别结果的校验装置,包括:获取模块,用于获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;计算模块,用于根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;判断模块,用于判断所述匹配值是否超过预设阈值;若是,则判定所述识别结果图为正确结果。结合第二方面,本专利技术实施例提供了第二方面的第一种可能的实施方式,其中,所述计算模块包括:二值化处理模块,用于按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;计算单元,用于根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;生成模块,用于根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。结合第二方面,本专利技术实施例提供了第二方面的第二种可能的实施方式,其中,所述参考点包括骨架点和外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。本专利技术实施例提供的光学字符识别结果的校验方法,采用为模板图上的参考点设置不同权值的方式,与现有技术中无法对字符识别结果进行有效的检验相比,其通过先获取了识别结果图和模板图,其中,所述模板图上阵列的设置有多个参考点;之后,再根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;最后,再判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。由于为每个参考点设置了相应的权值,因此,不再只是判断识别结果图中的图形是否在图版图中出现,而是采用更为精确的方式计算识别结果图的匹配值,再依据该匹配值进行判断,提高了判断的准确程度。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图本文档来自技高网
...
一种光学字符识别结果的校验方法及装置

【技术保护点】
光学字符识别结果的校验方法,其特征在于,包括:获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。

【技术特征摘要】
1.光学字符识别结果的校验方法,其特征在于,包括:获取识别结果图和模板图,所述模板图上阵列的设置有多个参考点;根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值;所述目标参考点是模板图上与识别结果图中的图形的位置相对应的参考点;判断所述匹配值是否超过预设阈值;若超过,则判定所述识别结果图为正确结果。2.根据权利要求1所述的光学字符识别结果的校验方法,其特征在于,所述根据目标参考点和所述目标参考点的权值计算所述识别结果图的匹配值包括:按照不同的二值化阈值,对所述识别结果图分别进行多次二值化处理,以得到不同二值化阈值所对应的第一识别图;根据目标参考点和所述目标参考点的权值,分别计算每个第一识别图所对应的匹配参考值;所述目标参考点是指定的一个第一识别图中的图形覆盖在模板图上相应位置后得到的;根据每个第一识别图的匹配参考值,生成所述识别结果图的匹配值。3.根据权利要求1所述的光学字符识别结果的校验方法,其特征在于,所述参考点包括骨架点外围点,所述骨架点的权值为全部参考点中最高的,全部的所述骨架点形成了所述识别结果图中的图形的基本形状;所述外围点的权值与目标距离呈负相关性,所述目标距离是外围点与最接近的一个骨架点之间的距离。4.根据权利要求3所述的光学字符识别结果的校验方法,其特征在于,还包括按照如下方式确定骨架点:获取多个清晰度较高的候选图;分别对每个候选图进行二值化处理,得到每个候选图的二值化图形;将总次数超过预设阈值的参考点作为骨架点,所述总次数每个参考点在全部候选图中出现的次数之和。5.根据权利要求4所述的光学字符识别结果的校验方法,其特征在于,还包括按照如下方式确定每个外围点的权值:按照不同的二值化阈值,对目标候选图分别进行多次二值化处理,以得到不同二值化阈值所对应的第二识别图;按照如下方式对每个外围点赋予权值,第一外围点的权值高于第二外围点的权值,其中,第一外围点是使用较低二值化阈值进行二值化处理得到的第二识别图中的基准外围点;第二外围...

【专利技术属性】
技术研发人员:陈家辉李衡峰
申请(专利权)人:东方网力科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1