光学字符识别支持系统技术方案

技术编号:26172764 阅读:26 留言:0更新日期:2020-10-31 13:52
本发明专利技术涉及一种光学字符识别支持系统。提供了一种用于提高光学字符识别OCR系统的识别率的计算机实现的方法。该方法包括以下预处理:接收图像;从所述图像中提取所有垂直线。该方法包括:在所述图像的字符区域处添加垂直线;从所述图像中提取所有水平线;以及创建从所述图像中去除所有所述垂直/水平线的无线条图像。该方法还包括:基于每一列中的行像素总数来确定所述无线条图像的垂直方向的边界;以及在所述无线条图像的字符之间添加垂直/水平辅助线。该方法还包括以下后处理:接收OCR输出的乱码单词;在词法上分析之后去除噪声;基于频繁编辑操作,用正确字母替换乱码字母;输出正确单词;以及基于机器学习,对图像距离计算的结果加权。

【技术实现步骤摘要】
光学字符识别支持系统
本专利技术一般地涉及光学字符识别(OCR)系统,更具体地说,涉及提高OCR系统的识别率。
技术介绍
电子OCR是将文本(例如,打字、手写或印刷的文本等)的图像电子转换成机器编码的文本。可以从扫描文档、文档照片、场景照片(例如,风景照片中的招牌和广告牌上的文本)、叠加在图像上的字幕文本等提供图像。OCR系统首先识别布局(例如,识别单词和数字的区域),然后提取单词和数字。可以基于OCR系统在布局、单词和/或数字识别方面的性能对OCR系统进行评估。
技术实现思路
根据本专利技术的实施例,提供了一种用于提高光学字符识别OCR系统的识别率的方法。所述方法包括接收图像;以及从所述图像中提取所有垂直线。所述方法包括在所述图像的字符区域处添加垂直线;以及从所述图像中提取所有水平线。所述方法包括创建从所述图像中去除所有所述垂直线和水平线的无线条图像。所述方法还包括由处理器设备基于每一列中的行像素总数来确定所述无线条图像的垂直方向的边界;以及在所述无线条图像的字符之间的空白空间中添加垂直辅助线。根据本专利技术的实施例,一种用于提高光学字符识别OCR系统的识别率的方法包括接收OCR输出的乱码单词;在词法上分析所述乱码单词之后去除噪声;以及基于频繁编辑操作,用正确字母替换所述乱码字母。所述方法还包括确定所述至少一个乱码单词与多个候选正确单词中的每一者之间的距离;以及使用基于所述距离的评分来选择所述多个候选正确单词中的一者作为正确单词。根据本专利技术的实施例,提供了一种用于提高光学字符识别OCR系统的识别率的系统。所述系统包括存储设备,用于存储程序代码;以及至少一个处理器设备,可操作地耦合到所述存储设备,并且被配置为执行存储在所述存储设备上的程序代码,以接收至少一个图像以及从所述至少一个图像中提取所有垂直线。所述程序代码在所述至少一个图像的字符区域处添加垂直线;以及从所述至少一个图像中提取所有水平线。所述至少一个处理器设备执行所述程序代码以创建从所述至少一个图像中去除所有所述垂直线和水平线的无线条图像,以及基于每一列中的行像素总数来确定所述无线条图像的垂直方向的边界。所述程序代码还在所述无线条图像的字符之间的空白空间中添加垂直辅助线。通过结合附图阅读的本专利技术的示例性实施例的以下详细描述,上述以及其它特征和优点将变得显而易见。附图说明以下描述将参考下面的附图提供优选实施例的细节,这些附图是:图1是示出根据本专利技术的实施例的光学字符识别(OCR)支持系统的框图/流程图;图2是示出根据本专利技术的实施例的基于辅助线添加的表的预处理的框图;图3是示出根据本专利技术的实施例的基于辅助线添加的非表的预处理的框图;图4是示出根据本专利技术的实施例的基于水平辅助线添加的表单的预处理的流程图;图5是示出根据本专利技术的实施例的在添加垂直辅助线之后添加水平辅助线的预处理的流程图;图6是示出根据本专利技术的实施例的将表单划分成块的流程图;图7是示出根据本专利技术的实施例的基于机器学习结果来添加水平/垂直线的流程图;图8是示出根据本专利技术的实施例的基于频繁编辑操作的后处理的流程图;图9是示出根据本专利技术的实施例的排除不包括在候选单词的任何词素中的所有词素的降噪的流程图;图10是示出根据本专利技术的实施例的基于图像距离的后处理的图;图11是示出根据本专利技术的实施例的基于通过对每个处理的结果加权来校正乱码单词的后处理的流程图;图12是示出根据本专利技术的实施例的用于确定权重的机器学习的流程图;图13是根据本专利技术的实施例的处理系统的框图;图14是示出根据本专利技术的实施例的为OCR提供支持的方法的流程图;图15是示出根据本专利技术的实施例的为OCR提供支持的方法的流程图;以及图16示出了包括单词区域的预处理表。具体实施方式本专利技术的实施例一般地涉及用于在光学字符识别(OCR)支持系统中学习的系统和方法。根据本专利技术的实施例的系统和方法通过在由OCR系统输出的工作表图像的单词或数字之间的空白空间中添加辅助线,提高了OCR系统的关于(乱码单词和校正单词的)单词与数字对的识别率。该系统应用适于每个OCR引擎(例如,适于每个OCR引擎的优势和劣势)的处理,从而基于例如特定OCR引擎的预处理和后处理的组合来充分利用每个OCR引擎。该系统提高了正确单词/数字的识别率。系统能够接收OCR系统识别的输出并测量输出的单词与候选正确单词之间的编辑(例如,Levenshtein)距离。系统叠加每个单词的字母,并检查输出的单词与候选正确单词之间的图像距离。系统能够使用过去积累的单词对来定义编辑(例如,Levenshtein)距离处理和图像距离处理的权重。能够应用本专利技术的示例性应用/用途包括但不限于将预处理应用于OCR的输入图像,以及基于布局(和/或单词、数字等)提高OCR的识别率。本专利技术还能够用于对来自OCR的输出图像进行后处理,以及将乱码单词替换为正确单词。现在参考附图,其中相同的参考标号表示相同或相似的元件,首先参考图1,其是示出根据本专利技术的实施例的光学字符识别(OCR)支持系统100的框图/流程图。OCR支持系统100能够用于支持(例如,现有的、分离的、独立的,等等)OCR引擎以利用适合每个OCR引擎的处理,从而充分利用每个OCR引擎,并最终提高正确单词/数字的识别率。与分别开发布局、单词和/或数字识别引擎的系统(与开发新OCR引擎几乎一样昂贵)相比,OCR支持系统100节省了成本。OCR支持系统100能够在学习阶段102和操作阶段142实施。在学习阶段102,OCR支持系统100定义处理和参数,并实施反馈和学习以使OCR支持系统100为操作阶段142做好准备。在操作阶段142,OCR支持系统100接收输入的(扫描)图像104,并输出校正后的单词148。OCR支持系统100对到OCR支持系统100的输入图像104(将被输入到OCR引擎112)应用预处理,并提高了OCR引擎112的布局/单词/数字识别率。正确的布局识别提高了单词/数字的正确率。OCR支持系统100对来自OCR引擎112的输出图像应用后处理,并将乱码单词116(包括在输出图像中,未单独显示)替换为校正后的单词148。在学习阶段102期间,在对到OCR引擎112的输入图像104进行预处理和对来自OCR引擎112的输出图像进行后处理两者中,OCR支持系统100首先识别预期有效的处理,找到具有相应权重的的处理的最佳组合/顺序,并确定机器学习(ML)集(例如,(乱码单词、正确单词)列表)。在运行时,在操作阶段142期间,OCR支持系统100使用(例如,所确定的)ML集(例如,来自学习阶段102的结果)来执行预处理和后处理。根据示例实施例,预处理能够包括扩大线之间的空间以及在线之间添加辅助线。根据示例实施例,后处理可以包括首先去除噪声。具体地,如以下关于图8所描述的,OCR支持系统100基于频繁编辑操作而逆向转换乱码单本文档来自技高网...

【技术保护点】
1.一种用于提高光学字符识别OCR系统的识别率的计算机实现的方法,包括:/n接收至少一个图像;/n从所述至少一个图像中提取所有垂直线;/n在字符区域处添加垂直线;/n由处理器设备从所述至少一个图像中提取所有水平线;/n创建从所述至少一个图像中去除所有所述垂直线和所述水平线的无线条图像;/n由所述处理器设备基于每一列中的行像素总数来确定所述无线条图像的垂直方向的边界;以及/n在所述无线条图像的字符之间的空白空间中添加垂直辅助线。/n

【技术特征摘要】
20190425 US 16/3942161.一种用于提高光学字符识别OCR系统的识别率的计算机实现的方法,包括:
接收至少一个图像;
从所述至少一个图像中提取所有垂直线;
在字符区域处添加垂直线;
由处理器设备从所述至少一个图像中提取所有水平线;
创建从所述至少一个图像中去除所有所述垂直线和所述水平线的无线条图像;
由所述处理器设备基于每一列中的行像素总数来确定所述无线条图像的垂直方向的边界;以及
在所述无线条图像的字符之间的空白空间中添加垂直辅助线。


2.根据权利要求1所述的方法,还包括:
添加水平辅助线。


3.根据权利要求1所述的方法,还包括:
将所述至少一个图像分成块;
确定所述垂直辅助线或所述水平辅助线是否覆写所述块;
如果所述垂直辅助线或所述水平辅助线覆写所述块,则跳过添加所述垂直辅助线或所述水平辅助线,以及
移位所述垂直辅助线和所述水平辅助线中的至少一者的位置,以使得所述垂直辅助线和所述水平辅助线中的所述至少一者不被覆写。


4.根据权利要求1所述的方法,还包括:
接收至少一个图像;
基于添加垂直辅助线,确定所述至少一个图像的至少一个变型;
对所述至少一个图像和所述至少一个图像的所述至少一个变型执行OCR;以及
确定所述至少一个图像和所述至少一个图像的所述至少一个变型的最高OCR率。


5.根据权利要求1所述的方法,还包括:
通过应用词法分析,从所述至少一个图像中去除噪声。


6.根据权利要求1所述的方法,还包括:
通过将两个单词转换成图像来测量所述两个单词之间的相似度;以及
叠加所述图像。


7.根据权利要求6所述的方法,还包括:
在叠加时考虑所述图像的深度。


8.一种用于提高光学字符识别OCR系统的识别率的计算机实现的方法,包括:
接收OCR输出的至少一个乱码单词;
在词法上分析所述至少一个乱码单词之后去除噪声;以及
基...

【专利技术属性】
技术研发人员:上条浩一清水晶酒井大石井裕太
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1