对字符图像进行处理的装置、方法和介质制造方法及图纸

技术编号:26598979 阅读:56 留言:0更新日期:2020-12-04 21:21
公开了一种对字符图像进行处理的装置、方法和介质。所述装置包括:第一识别单元,其利用第一字符识别模型对所述字符图像进行第一粗识别处理,以获得第一字符识别结果;第二识别单元,其利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果;对齐单元,其使所述第一字符识别结果与所述第二字符识别结果对齐;以及调整单元,其基于所述第二字符识别结果对所述第一粗识别处理过程中的每个粗识别结果进行调整,以获得调整后的字符识别结果,其中,所述第一识别单元还通过路径估计及搜索算法的方式,对所述调整后的字符识别结果进行处理,以获得最终的字符识别结果。

【技术实现步骤摘要】
对字符图像进行处理的装置、方法和介质
本公开涉及字符图像处理的
,具体地涉及对字符图像进行处理的装置和方法。
技术介绍
这个部分提供了与本公开有关的背景信息,这不一定是现有技术。手写字符的识别非常重要。由于书写风格的多样性、无约束语言域、大字符集、字符形状变化以及由可变字符大小等引起的字符分割问题,识别是一项具有挑战性的任务。输入图像供人识别非常清晰,但机器可能无法识别正确的结果。因此,可能需要对输入图像进行修正。这将有助于自动获得更准确的识别结果。
技术实现思路
这个部分提供了本公开的一般概要,而不是其全部范围或其全部特征的全面披露。本公开的目的在于提供一种字符图像处理方法,其有效地提高了字符识别的精度。本公开的字符图像处理方法利用了两种不同的字符识别方法,其中,基于一种字符识别的结果对另一种字符识别的结果进行训练过程中的参数调整,从而获得更加准确的字符识别结果。根据本公开的一方面,提供了一种对字符图像进行处理的装置,包括:第一识别单元,其利用第一字符识别模型对所述字符图像进行第一粗识别处理,以获得第一字符识别结果;第二识别单元,其利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果;对齐单元,其使所述第一字符识别结果与所述第二字符识别结果对齐;以及调整单元,其基于所述第二字符识别结果对所述第一粗识别处理过程中的每个粗识别结果进行调整,以获得调整后的字符识别结果,其中,所述第一识别单元还通过路径估计及搜索算法的方式,对所述调整后的字符识别结果进行处理,以获得最终的字符识别结果。根据本公开的另一方面,提供了一种对字符图像进行处理的方法,包括:利用第一字符识别模型对所述字符图像进行第一粗识别处理,以获得第一字符识别结果;利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果;使所述第一字符识别结果与所述第二字符识别结果对齐;基于所述第二字符识别结果对所述第一粗识别处理过程中的每个粗识别结果进行调整,以获得调整后的字符识别结果;以及通过路径估计及搜索算法的方式,对所述调整后的字符识别结果进行处理,以获得最终的字符识别结果。根据本公开的另一方面,提供了一种程序产品,该程序产品包括存储在其中的机器可读指令代码,其中,所述指令代码当由计算机读取和执行时,能够使所述计算机执行根据本公开的对字符图像进行处理的方法。根据本公开的另一方面,提供了一种机器可读存储介质,其上携带有根据本公开的程序产品。从在此提供的描述中,进一步的适用性区域将会变得明显。这个概要中的描述和特定例子只是为了示意的目的,而不旨在限制本公开的范围。附图说明在此描述的附图只是为了所选实施例的示意的目的而非全部可能的实施,并且不旨在限制本公开的范围。在附图中:图1为根据本公开的一个实施例的对字符图像进行处理的装置100的框图;图2为根据本公开的另一个实施例的对字符图像进行处理的装置200的框图;图3为根据本公开的一个实施例的手写地址图像经分割处理后的多个粗略块;图4为根据本公开的一个实施例的通过卷积神经网路CNN粗识别后的多个候选地址字符串;图5为根据本公开的一个实施例的手写地址图像的最终识别结果;图6为根据本公开的一个实施例的对字符图像进行处理的方法的流程图;以及图7为其中可以实现根据本公开的实施例的对字符图像进行处理的装置和方法的通用个人计算机的示例性结构的框图。虽然本公开容易经受各种修改和替换形式,但是其特定实施例已作为例子在附图中示出,并且在此详细描述。然而应当理解的是,在此对特定实施例的描述并不打算将本公开限制到公开的具体形式,而是相反地,本公开目的是要覆盖落在本公开的精神和范围之内的所有修改、等效和替换。要注意的是,贯穿几个附图,相应的标号指示相应的部件。具体实施方式现在参考附图来更加充分地描述本公开的例子。以下描述实质上只是示例性的,而不旨在限制本公开、应用或用途。提供了示例实施例,以便本公开将会变得详尽,并且将会向本领域技术人员充分地传达其范围。阐述了众多的特定细节如特定部件、装置和方法的例子,以提供对本公开的实施例的详尽理解。对于本领域技术人员而言将会明显的是,不需要使用特定的细节,示例实施例可以用许多不同的形式来实施,它们都不应当被解释为限制本公开的范围。在某些示例实施例中,没有详细地描述众所周知的过程、众所周知的结构和众所周知的技术。本公开的目的在于提供一种字符图像处理装置,其有效地提高了字符识别的精度。本公开的字符图像处理装置利用了两种不同的字符识别方法,其中,基于一种字符识别的结果对另一种字符识别的结果进行训练过程中的参数调整,从而获得更加准确的字符识别结果。根据本公开的一个实施例,提供了一种对字符图像进行处理的装置,包括:第一识别单元,其利用第一字符识别模型对所述字符图像进行第一粗识别处理,以获得第一字符识别结果;第二识别单元,其利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果;对齐单元,其使所述第一字符识别结果与所述第二字符识别结果对齐;以及调整单元,其基于所述第二字符识别结果对所述第一粗识别处理过程中的每个粗识别结果进行调整,以获得调整后的字符识别结果,其中,所述第一识别单元还通过路径估计及搜索算法的方式,对所述调整后的字符识别结果进行处理,以获得最终的字符识别结果。如图1所示,根据本公开的对字符图像进行处理的装置100可以包括第一识别单元101、第二识别单元102、对齐单元103和调整单元104。第一识别单元101可以利用第一字符识别模型对字符图像进行第一粗识别处理,以获得第一字符识别结果。所述第一字符识别模型可以是对图片文件中的文字进行分析和识别的模型。例如,根据本公开的一个实施例,第一识别单元101可以利用光学字符识别(OCR)引擎对字符图像进行粗识别,以获得一个粗识别结果。这里,本领域技术人员应该清楚,所述OCR引擎仅是示例性的,本公开并不限于此。然后,第二识别单元102可以利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果。所述第二字符识别模型可以是基于神经网络的图片文字识别的模型例如卷积循环神经网络(CRNN)模型。CRNN模型可以描述为一种修改的卷积神经网络(CNN)模型,其中,CNN的最后一个卷积层可以由RNN替换。在CRNN模型中,CNN可以用作特征提取器,而RNN可以用作时间摘要生成器。采用RNN来聚合特征可以使得网络能够考虑全局结构,而剩余的卷积层可以用来提取局部特征。根据本公开的一个实施例,例如,将包含字符序列的输入图像馈送到CRNN模型中。然后,可以通过端到端训练来获得识别结果。这里,本领域技术人员应该清楚,所述CRNN模型仅是示例性的,本公开并不限于此。接下来,对齐单元103可以使所述第一识别单元101识别的粗识别结果与所述第二识别单元102识别的识别结果对齐。这里,可以采用任何现有技术中的对齐方法,例本文档来自技高网...

【技术保护点】
1.一种对字符图像进行处理的装置,包括:/n第一识别单元,其利用第一字符识别模型对所述字符图像进行第一粗识别处理,以获得第一字符识别结果;/n第二识别单元,其利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果;/n对齐单元,其使所述第一字符识别结果与所述第二字符识别结果对齐;以及/n调整单元,其基于所述第二字符识别结果对所述第一粗识别处理过程中的每个粗识别结果进行调整,以获得调整后的字符识别结果,/n其中,所述第一识别单元还通过路径估计及搜索算法的方式,对所述调整后的字符识别结果进行处理,以获得最终的字符识别结果。/n

【技术特征摘要】
1.一种对字符图像进行处理的装置,包括:
第一识别单元,其利用第一字符识别模型对所述字符图像进行第一粗识别处理,以获得第一字符识别结果;
第二识别单元,其利用第二字符识别模型对所述字符图像进行第二分割处理,以获得第二字符识别结果;
对齐单元,其使所述第一字符识别结果与所述第二字符识别结果对齐;以及
调整单元,其基于所述第二字符识别结果对所述第一粗识别处理过程中的每个粗识别结果进行调整,以获得调整后的字符识别结果,
其中,所述第一识别单元还通过路径估计及搜索算法的方式,对所述调整后的字符识别结果进行处理,以获得最终的字符识别结果。


2.根据权利要求1所述的装置,还包括预处理单元,其对所述字符图像进行预处理,所述预处理包括图像去噪处理、归一化处理和二值化处理。


3.根据权利要求1所述的装置,其中,所述调整单元根据替换字符操作、插入字符操作和删除字符操作对所述第一粗识别处理过程中的每个粗识别结果的系数进行调整。


4.根据权利要求1所述的装置,其中,所述第一粗识别处理包括第一分割处理和基于卷积神经网络的识别处理。


5.根据权利要求4所述的装置,其中,所述第一分割处理是过分...

【专利技术属性】
技术研发人员:汪留安于小亿孙俊
申请(专利权)人:富士通株式会社
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1