光学字符识别技术的输出结果的处理制造技术

技术编号:21400207 阅读:24 留言:0更新日期:2019-06-19 07:19
本公开提供一种用于处理光学字符识别技术的输出结果的方法、芯片电路、阅读辅助设备、存储介质。用于处理光学字符识别技术的输出结果的方法包括根据所识别出的每个文字的字置信度,计算输出结果的平均置信度,将平均置信度与第一阈值进行比较,如果平均置信度小于或等于该第一阈值,则放弃输出结果,其中输出结果包括所识别出的至少一行的多个文字,并且每个所识别出的文字具有字置信度用于表示相应识别结果的可信程度。

【技术实现步骤摘要】
光学字符识别技术的输出结果的处理
本公开涉及图像处理,特别涉及对光学字符识别技术的输出结果的处理。
技术介绍
目前,市场上光学字符识别技术(OpticalCharacterRecognition,OCR)已经愈发成熟,在识别速度、精准度上都有了很大的提升。在此基础上,也产生了许多关于文字识别的应用,如针对弱视人群的文字阅读器、文案扫描工具等智能移动设备。文字识别的精确度在很大程度上取决于图像的清晰度,只有达到了一定的清晰度,才能真正保证识别结果的准确性。但在智能移动设备上,通常基于智能设备的摄像头进行图像采集,拍照的角度、位置都会对图像的清晰度产生影响,这样会导致文字识别的准确度降低。另外,有些智能硬件设备,由于功耗等问题,通常会去掉如显示屏等功耗大的部分硬件。在没有显示屏的情况下,用户无法察看当前的拍照效果,所以无法确定拍摄的图像是否清晰,但这会影响图像文字识别的正确率。直接将这样的识别结果返还给用户,就可能会提供给用户错误的文字信息,对用户很不友好。
技术实现思路
本公开的一个目的是提供一种处理光学字符识别技术的输出结果的方法、芯片电路、阅读辅助设备、存储介质。根据本公开的一个方面,提供了一种用于处理光学字符识别技术的输出结果的方法,包括:根据所识别出的每个文字的字置信度,计算输出结果的平均置信度;以及将平均置信度与第一阈值进行比较,如果平均置信度小于或等于该第一阈值,则放弃输出结果。其中,输出结果包括所识别出的至少一行的多个文字,并且每个所识别出的文字具有字置信度用于表示相应识别结果的可信程度。根据本公开的又一方面,提供一种芯片电路,用于处理光学字符识别技术的输出结果,包括被配置为执行上述方法的步骤的电路单元。根据本公开的又一方面,提供一种阅读辅助设备,包括:被配置为获取包含文字内容的图像的传感器;前述的芯片电路,所述芯片电路还包括被配置为对所述图像进行文字识别以获得包含文字的输出结果的电路单元以及被配置为将处理后的输出结果转换成音频信息的电路单元;以及音频输出设备,被配置为输出所述音频信息。根据本公开的又一方面,还提供一种阅读辅助设备,包括:用于存储包含文字内容的图像的存储器;前述的芯片电路,所述芯片电路还包括被配置为对所述图像进行文字识别以获得包含文字的输出结果的电路单元以及被配置为将处理后的输出结果转换成音频信息的电路单元;以及音频输出设备,被配置为输出所述音频信息。根据本公开的又一个方面,提供了一种计算机可读存储介质,其中,存储介质上存储有包括指令的程序,该指令在由电子设备的处理器执行时致使电子设备执行上述方法的步骤。从下面结合附图描述的示例性实施例中,本公开的更多特征和优点将变得清晰。附图说明附图示例性地示出了实施例并且构成说明书的一部分,与说明书的文字描述一起用于讲解实施例的示例性实施方式。所示出的实施例仅出于例示的目的,并不限制权利要求的范围。在所有附图中,相同的附图标记指代类似但不一定相同的要素。图1示出了根据第一实施方式对OCR输出结果进行处理的流程图;图2示出了根据第二实施方式对OCR输出结果进行处理的流程图;图3示出了图2中对OCR输出结果进行逐行处理的步骤的更详细的流程图;图4示出了根据第三实施方式对OCR输出结果进行处理的流程图;图5示出了图4中对OCR输出结果进行逐行处理的步骤的更详细的流程图;图6示出了根据本公开的示例性实施例的阅读辅助设备的结构框图;图7示出了能够应用于示例性实施方式的示例性计算设备的结构框图。具体实施方式在本公开中,除非另有说明,否则使用术语“第一”、“第二”等来描述各种要素不意图限定这些要素的位置关系、时序关系或重要性关系,这种术语只是用于将一个要素与另一要素区分开。在一些示例中,第一要素和第二要素可以指向该要素的同一实例,而在某些情况下,基于上下文的描述,它们也可以指代不同实例。图1示出了根据第一实施方式对OCR输出结果进行处理的流程图。步骤S101中,获取一张包含文字内容的图像。图像例如可以通过相机或者具有拍照功能的设备(例如手机、平板电脑、可穿戴设备等)拍摄得到,也可以是之前存储的图像。被拍摄的文字内容可以存在于不同的表面,例如书籍、报纸、屏幕、菜单、标志和产品标签等。步骤S102中,依靠现有OCR技术识别图像中的文字并产生一个包括所识别的文字的输出结果。输出结果通常是可编辑的,其格式包括但不限于Word、Excel、TXT文档。本领域技术人员将能够理解,现有的OCR技术可以从PDF或图像(图像格式例如包括JPG、BMP、TIFF、GIF)中识别提取出文字。部分OCR技术(例如合合OCR、Adobe)在提供识别结果之外还提供所识别结果中各文字的文字置信度。这里,文字置信度可以理解为OCR识别后,对其识别结果给出的一个可信度的值。置信度的范围一般在1.0~0之间,值越接近0则表示相应的识别结果的可信度越低,反之,值越接近1则表示相应的识别结果的可信度越高。根据第一实施方式,在步骤S102中,对所识别出的每个文字赋予一个可信度的值,即字置信度。字置信度的范围一般在1.0~0之间,值越接近0则表示相应的识别结果的可信度越低,反之,值越接近1则表示相应的识别结果的可信度越高。应该指出,根据本公开的处理方法不仅适用于OCR识别出的中文汉字也适用于例如字母组成的单词或者任何语言下的单词,前提是OCR技术提供商可以识别相应的单词并为每个识别的单词赋予一个字置信度。此外,在对置信度与阈值进行比较时,比较运算符并不限于上述实施例中提到的情形。例如,相较于“大于或等于”、“小于或等于”,分别使用“大于”、“小于”并搭配适当的阈值也是可行的且并不超出本公开的范围。步骤S103中,根据所识别出的各个文字的置信度,计算整个输出结果的平均置信度。通常情况下,输出结果可以包括排列成至少一行的多个文字。将输出结果中的每个文字的字置信度求和再除以所识别文字的总个数,从而得到整个输出结果的平均置信度。作为替代,也可以先通过对输出结果每一行中的各文字的字置信度求平均值,得到该行的行置信度,然后通过对各个行置信度求平均值得到整个输出结果的平均置信度。类似于字置信度,行置信度和平均置信度的范围也在1.0~0之间,值越接近0则表示相应识别结果的可信度越低,反之,值越接近1则表示相应识别结果的可信度越高。步骤S104中,将计算得到的平均置信度与第一阈值进行对比,根据比较结果确定是否放弃输出结果。第一阈值可以示例性地设置为0.5。如果平均置信度小于或等于0.5,则判断输出结果为模糊,前进到步骤S105,放弃该输出结果,该阈值因此也可以称为模糊度。相反,如果平均置信度大于0.5,则前进到步骤S106保留该输出结果。第一阈值(模糊度)也可以被配置为其他的值,例如0.65。输出结果被判断为模糊的原因通常是因为用户在拍摄文本的过程中因为抖动、光线、位置等原因而造成拍摄的图像不清晰。对于放弃输出结果的情况,用户可以选择针对同样的文本重新拍摄一张清晰度更高的图像并进行OCR识别。本第一实施方式利用各个文字的字置信度计算整个输出结果的平均置信度,并将平均置信度与预设的模糊度相比,可以简单快速地将输出结果作为一个整体进行清晰度判断,从而为是否保留输出结果提供判断依据。例如,在输出结果应用于语本文档来自技高网...

【技术保护点】
1.一种用于处理光学字符识别技术的输出结果的方法,其中所述输出结果包括所识别出的至少一行的多个文字,每个所识别出的文字具有字置信度用于表示相应识别结果的可信程度,所述方法包括:根据所识别出的每个文字的字置信度,计算所述输出结果的平均置信度;以及将所述平均置信度与第一阈值进行比较,如果所述平均置信度小于或等于该第一阈值,则放弃所述输出结果。

【技术特征摘要】
1.一种用于处理光学字符识别技术的输出结果的方法,其中所述输出结果包括所识别出的至少一行的多个文字,每个所识别出的文字具有字置信度用于表示相应识别结果的可信程度,所述方法包括:根据所识别出的每个文字的字置信度,计算所述输出结果的平均置信度;以及将所述平均置信度与第一阈值进行比较,如果所述平均置信度小于或等于该第一阈值,则放弃所述输出结果。2.根据权利要求1的方法,其中,如果所述平均置信度大于所述第一阈值,分别将所述输出结果中的各行的行置信度与至少另一个阈值进行比较,并根据比较结果对相应的行进行处理。3.根据权利要求2的方法,其中,分别将所述输出结果中的各行的行置信度与至少另一个阈值进行比较,并根据比较结果对相应的行进行处理的步骤包括:分别将所述输出结果中的各行的行置信度与第二阈值进行比较;删除行置信度小于或等于所述第二阈值的行的输出结果;以及保留行置信度大于所述第二阈值的行的输出结果。4.根据权利要求2的方法,其中,所述至少另一个阈值包括第三阈值和第四阈值,其中所述第四阈值大于所述第三阈值,所述对相应的行进行处理的步骤包括:删除行置信度小于或等于所述第三阈值的行的输出结果;保留行置信度大于或等于所述第四阈值的行的输出结果;以及如果相应的行的行置信度大于该第三阈值且小于该第四阈值,分别将该行中各文字的字置信度与第五阈值...

【专利技术属性】
技术研发人员:胡东鑫蔡海蛟冯歆鹏周骥
申请(专利权)人:上海肇观电子科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1