用于字符识别的方法、电子设备和存储介质技术

技术编号:30424587 阅读:15 留言:0更新日期:2021-10-24 16:55
本公开涉及用于字符识别的方法、电子设备和存储介质。在实施例中,用于字符识别的方法包括:字符模糊识别操作,其中通过动态框在特定对象的图像中检索,以获得多个字符元素;字符序列形成操作,其中基于多个字符元素形成第一字符序列;语义验证操作,其中对第一字符序列的语义进行验证。在第一字符序列未通过语义验证情况下,该方法还包括字符序列更新操作,其中基于多个字符元素形成不同于第一字符序列的第二字符序列。在第一字符序列通过语义验证的情况下,该方法还包括字符序列输出操作,其中将通过语义验证的第一字符序列作为字符识别的结果予以输出。识别的结果予以输出。识别的结果予以输出。

【技术实现步骤摘要】
用于字符识别的方法、电子设备和存储介质


[0001]本申请一般地涉及字符识别技术,并具体涉及用于提高字符识别性能的方法、电子设备和存储介质。

技术介绍

[0002]一般而言,光学字符识别(Optical Character Recognition,OCR)是通过计算处理而完成的从包含文本的图像到作为机器可编辑文本的数字形式的转换过程。OCR过程可以包括使用电子设备(例如扫描仪或数码相机)获得包含文本的图像,通过检测暗、亮的模式确定字符形状,以及用字符识别方法将字符形状翻译成计算机文字。通过OCR,可以以节省与手动输入有关的人力与时间成本的方式,将图像或影像内的字符转换为计算机字符,从而提高获取信息、利用信息的效率。
[0003]然而,当图像在对比度、亮度、是否存在歪斜等方面存在缺陷或不足时,OCR字符识别性能可能会降级。因此,需要相应的改进以提高OCR中字符识别的准确率和效率。

技术实现思路

[0004]本公开的一个方面涉及用于字符识别的方法。该方法可以包括字符模糊识别操作,其中通过动态框在特定对象的图像中检索,以获得多个字符元素。该方法可以包括字符序列形成操作,其中基于所述多个字符元素形成第一字符序列。该方法可以包括语义验证操作,其中对第一字符序列的语义进行验证。在第一字符序列未通过语义验证情况下,该方法还可以包括字符序列更新操作,其中基于所述多个字符元素形成不同于第一字符序列的第二字符序列。在第一字符序列通过语义验证的情况下,该方法还可以包括字符序列输出操作,其中将通过语义验证的第一字符序列作为所述字符识别的结果予以输出。
[0005]在上述方法的实施例中,动态框可以是横向和/或纵向大小可变的框,在图像中检索可以包括按照预定或任意的轨迹移动动态框以覆盖字符元素。
[0006]在上述方法的实施例中,还可以包括将检索到的字符元素与字符库中的字符进行匹配,以获得多个字符元素。
[0007]在上述方法的实施例中,字符序列形成操作和/或字符序列更新操作可以包括通过深度学习分类器来基于多个字符元素形成相应的字符序列。
[0008]在上述方法的实施例中,语义验证操作可以包括以下中的至少一项:将一个或多个字符与固定语料进行匹配;对第一字符序列的至少两个部分的语义进行互相验证;或者对第一字符序列的至少两个部分的语义进行依存分析。
[0009]在上述方法的实施例中,还可以包括:在第一字符序列未通过语义验证的情况下,对第二字符序列的语义进行验证;以及在第二字符序列通过语义验证的情况下,将通过语义验证的第二字符序列确定为所述字符识别的结果,并将第二字符序列与第一字符序列相关联作为对所述深度学习分类器的训练数据。
[0010]在上述方法的实施例中,特定对象包括以下中的至少一项:票据、单据、文档、书
籍、名片或宣传资料。
[0011]在上述方法的实施例中,特定对象的图像中的字符具有不同的字体、字号、版式或以上各项的组合。
[0012]本公开的另一个方面涉及用于字符识别的电子设备。该电子设备包括一个或多个处理器以及存储器,该存储器耦接到该一个或多个处理器,该存储器上存储有可执行指令,该可执行指令在由该一个或多个处理器执行时使得电子设备执行根据本公开的用于字符识别的方法的各个操作。
[0013]本公开的又一个方面涉及计算机可读存储介质,其上存储有可执行指令。可执行指令在由一个或多个处理器执行时,实现根据本公开的用于字符识别的方法的各个操作。
[0014]本
技术实现思路
旨在提供在本文档中所描述的主题中的一些的简要概述。因此,应当理解,上述特征仅为示例,并且不应解释为以任何方式缩窄本专利技术所描述的主题的范围或实质。本文所描述的主题的其它特征、方面和优点将通过以下具体实施方式、附图和权利要求书而变得显而易见。
附图说明
[0015]当结合以下附图考虑各个实施方案的以下详细描述时,可获得对本主题的更好的理解,在附图中:
[0016]图1示出了根据本公开实施例的用于字符识别的示例电子设备。
[0017]图2示出了用于根据本公开实施例的电子设备的示例逻辑框图。
[0018]图3示出了通过动态框的示例性的字符模糊识别操作。
[0019]图4A至图4C示出了通过动态框的字符模糊识别操作的具体示例。
[0020]图5示出了根据本公开实施例的通过投影预处理来促进字符模糊识别的示例操作。
[0021]图6示出了借助语义依存分析来进行语义验证的示例。
[0022]图7示出了根据本公开实施例的用于字符识别的示例操作流程图。
[0023]虽然本文所描述的特征可受各种修改形式和另选形式的影响,但其特定实施方案在附图中以举例的方式示出并在本文详细描述。然而,应当理解,附图和对其的详细描述并非旨在将本文限制于所公开的具体形式,而正相反,其目的在于覆盖落在如由所附权利要求书所限定的主题的实质和范围内的所有修改、等同物和另选方案。
具体实施方式
[0024]在本公开内容的讨论中,字符可以包括以下中的至少一项:
[0025]——文字:例如汉字、日文假名等;
[0026]——数字:例如0、1、2
……
9等;
[0027]——拼音或字母:例如a、b、Y、Z等;
[0028]——单词:例如“tax”、“import”等;
[0029]——符号:例如#、%、&、+等。
[0030]在本公开内容的讨论中,使用字符元素一词来表示构成字符的基本元素。单个字符可以由一个字符元素构成,例如字符“木”由一个字符元素“木”构成;字符“a”由一个字符
元素“a”构成。另选地,单个字符可以由多个字符元素构成,例如字符“村”由两个字符元素“木”和“寸”构成;字符“tax”由三个字符元素“t”、“a”和“x”构成。
[0031]在本公开内容的讨论中,使用字符序列一词来表示由多个字符或字符元素构成的传达一定语义的序列。
[0032]在理想情况下,首先,通过字符识别过程应当能够准确识别出图像中的多个字符元素,例如不会将“木”识别为“本”,不会将“m”识别为“nn”。其次,传统而言,字符元素应当能够与字符准确对应,例如不会将“林”对应为两个单独的“木”。如果可实现以上两点,则由识别出的多个字符或字符元素构成的字符序列与原始图像中的文本完全对应的可能性会很大。在本文中,识别出的字符序列与原始图像中的文本完全对应也称为识别结果是正确的。
[0033]在本公开的技术方案中,可以通过动态框来检索图像中的字符元素,以满足对不同字体、字号、版式的字符的识别需求。这样,可以实现对票据、单据、文档、书籍、名片或宣传资料等对象中字符的识别。在本公开的技术方案中,可以通过人工智能的方式来基于识别出的多个字符元素来形成传达一定语义的字符序列。形成字符序列的过程可以包括以多种方式来组合字符元素,并基于一定的逻辑输出字符序列。在本公开的技术方案中,还可以通过依存分析本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于字符识别的方法,所述方法包括:字符模糊识别操作,其中通过动态框在特定对象的图像中检索,以获得多个字符元素;字符序列形成操作,其中基于所述多个字符元素形成第一字符序列;语义验证操作,其中对第一字符序列的语义进行验证;以及在第一字符序列未通过语义验证情况下的字符序列更新操作,其中基于所述多个字符元素形成不同于第一字符序列的第二字符序列,或者在第一字符序列通过语义验证情况下的字符序列输出操作,其中将通过语义验证的第一字符序列作为所述字符识别的结果予以输出。2.如权利要求1所述的方法,其中所述动态框是横向和/或纵向大小可变的框,在所述图像中检索包括按照预定或任意的轨迹移动所述动态框以覆盖字符元素。3.如权利要求1所述的方法,所述方法还包括:将检索到的字符元素与字符库中的字符进行匹配,以获得所述多个字符元素。4.如权利要求1所述的方法,其中所述字符序列形成操作和/或所述字符序列更新操作包括通过深度学习分类器来基于所述多个字符元素形成相应的字符序列。5.如权利要求4所述的方法,其中所述语义验证操作包括以下中的至少一项:将一个或多个字符与固定语料进行匹配;对第...

【专利技术属性】
技术研发人员:席鹏
申请(专利权)人:华晨宝马汽车有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1