图像校正方法及装置、模型训练方法、文本识别方法制造方法及图纸

技术编号:37642212 阅读:23 留言:0更新日期:2023-05-25 10:09
本申请提供了一种图像校正方法及装置、模型训练方法、文本识别方法,涉及计算机技术领域。该图像校正方法包括:对待处理图像进行多次旋转处理,获得多个旋转图像,并确定各个旋转图像的旋转角度;提取各个旋转图像的分类特征,根据分类特征从多个旋转图像中选取目标图像;根据目标图像对应的旋转角度,对待处理图像进行角度校正,获得校正图像。根据本申请的实施例能够高效准确地对图像进行角度校正。实施例能够高效准确地对图像进行角度校正。实施例能够高效准确地对图像进行角度校正。

【技术实现步骤摘要】
图像校正方法及装置、模型训练方法、文本识别方法


[0001]本申请涉及计算机
,特别涉及一种图像校正方法及装置、模型训练方法、文本识别方法。

技术介绍

[0002]图像旋转角度校正可以作为图像应用的前置步骤,以提高图像处理结果的准确率。例如,光学字符识别(Optical Character Recognition,OCR)技术已经广泛应用于文本识别领域,用于识别图像中的文本数据。但是,在实际应用中,待识别图像通常带有一定旋转角度,从而导致识别效果较差。因此,如何高效准确地对图片进行角度校正成为当今研究的热点问题之一。

技术实现思路

[0003]本申请提供一种图像校正方法及装置、模型训练方法、文本识别方法、电子设备、存储介质。
[0004]第一方面,本申请提供了一种图像校正方法,该图像校正方法包括:对待处理图像进行多次旋转处理,获得多个旋转图像,并确定各个所述旋转图像的旋转角度;提取各个所述旋转图像的分类特征,根据所述分类特征从多个所述旋转图像中选取目标图像;根据所述目标图像对应的旋转角度,对所述待处理图像进行角度校正,获得校正图像。
[0005]第二方面,本申请提供了一种模型训练方法,将多个训练图像输入初始角度识别模型中,获得各个所述训练图像的分类特征;其中,多个所述训练图像包括至少一个正向训练图像和至少一个非正向训练图像;对所述分类特征的权重值进行调整,获得调整后的权重值;基于调整后的权重值对所述分类特征进行加权计算,获得加权特征;基于所述加权特征和预设的损失函数确定损失值;基于所述损失值对所述初始角度识别模型进行迭代更新,直至满足预设训练条件,得到所述角度识别模型。
[0006]第三方面,本申请提供了一种图像校正装置,该图像校正装置包括:旋转模块,用于对待处理图像进行多次旋转处理,获得多个旋转图像,并确定各个所述旋转图像的旋转角度;处理模块,用于提取各个所述旋转图像的分类特征,根据所述分类特征从多个所述旋转图像中选取目标图像;校正模块,用于根据所述目标图像对应的旋转角度,对所述待处理图像进行角度校正,获得校正图像。
[0007]第四方面,本申请提供了一种文本识别方法,该文本识别方法包括:对待识别文本图像进行角度校正,获得校正文本图像;对校正文本图像进行文本识别,获得文本识别结果;其中,对所述待识别文本图像进行角度校正采用本申请实施例任一项所述的图像校正方法。
[0008]第五方面,本申请提供了一种电子设备,该电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执
行,以使所述至少一个处理器能够执行上述的图像校正方法,或者模型训练方法,或者文本识别方法。
[0009]第六方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器/处理核执行时实现上述的图像校正方法,或者模型训练方法,或者文本识别方法。
[0010]本申请所提供的实施例,首先通过对待处理图像进行多次旋转处理,可以获得旋转角度差异较小的多个旋转图像,使得部分旋转图像与正向图像的接近程度较高或者成为正向图像,为后续的图像角度校正提供了图像基础;其次,通过对各个旋转图像提取分类特征,获得了可以反映旋转图像属于正向图像还是非正向图像的特征信息,从而可以根据分类特征从多个旋转图像中选取最接近正向图像或属于正向图像的目标图像,并能根据目标图像对应的旋转角度,对待处理图像进行准确地角度校正,提高了图像校正的准确性。
[0011]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用来提供对本申请的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请,并不构成对本申请的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
[0013]图1为相关技术提供的一种图像校正方法的示意图;
[0014]图2为相关技术提供的一种图像校正方法的示意图;
[0015]图3为本申请实施例提供的一种图像校正方法的流程图;
[0016]图4为本申请实施例提供的一种角度校正方法的工作过程示意图;
[0017]图5为本申请实施例提供的一种角度识别模型的示意图;
[0018]图6为本申请实施例提供的一种图像校正方法的流程图;
[0019]图7为本申请实施例提供的一种模型训练方法的流程图;
[0020]图8为本申请实施例提供的一种文本识别方法的流程图;
[0021]图9为本申请实施例提供的一种图像校正装置的框图;
[0022]图10为本申请实施例提供的一种电子设备的框图。
具体实施方式
[0023]为使本领域的技术人员更好地理解本申请的技术方案,以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0024]在不冲突的情况下,本申请各实施例及实施例中的各特征可相互组合。
[0025]如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
[0026]本文所使用的术语仅用于描述特定实施例,且不意欲限制本申请。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的
是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
[0027]除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本申请的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
[0028]随着OCR技术的发展,一些常见的证件(身份证、银行卡、营业执照)可以利用OCR技术进行文本检测,并将文本检测结果应用到相应的业务流程中,以提升处理效率。但是,通常情况下,OCR技术对正向的图像识别效果较好,对于带有旋转角度的图像识别效果较差。但是,在实际应用中,待识别的证件照大多为带有一定旋转角度的图像,从而导致识别效果较差。与此类似,在基于图像进行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像校正方法,其特征在于,包括:对待处理图像进行多次旋转处理,获得多个旋转图像,并确定各个所述旋转图像的旋转角度;提取各个所述旋转图像的分类特征,根据所述分类特征从多个所述旋转图像中选取目标图像;根据所述目标图像对应的旋转角度,对所述待处理图像进行角度校正,获得校正图像。2.根据权利要求1所述的方法,其特征在于,所述对待处理图像进行多次旋转处理,获得多个旋转图像,并确定各个所述旋转图像的旋转角度,包括:对所述待处理图像随机或者等角度地进行多次旋转处理,获得多个所述旋转图像以及各个所述旋转图像的旋转角度;所述旋转角度为所述旋转图像相较于所述待处理图像进行旋转的角度。3.根据权利要求1所述的方法,其特征在于,所述提取各个所述旋转图像的分类特征,根据所述分类特征从多个所述旋转图像中选取目标图像,包括:针对各个所述旋转图像,提取所述旋转图像的分类特征,并根据所述分类特征确定所述旋转图像的正向识别概率,所述正向识别概率表征所述旋转图像属于正向图像的概率;根据各个所述旋转图像的正向识别概率,从多个所述旋转图像中选取目标图像。4.根据权利要求3所述的方法,其特征在于,所述针对各个所述旋转图像,提取所述旋转图像的分类特征,并根据所述分类特征确定所述旋转图像的正向识别概率,包括:将多个所述旋转图像输入预设的角度识别模型,输出各个所述旋转图像的正向识别概率;其中,所述角度识别模型是基于预设的特征权重调整机制训练获得、且用于识别正向图像的模型,且所述角度识别模型至少包括特征提取层和识别处理层。5.一种模型训练方法,其特征在于,包括:将多个训练图像输入初始角度识别模型中,获得各个所述训练图像的分类特征;其中,多个所述训练图像包括至少一个正向训练图像和至少一个非正向训练图像;对所述分类特征的权重值进行调整,获得调整后的权重值;基于调整后的权重值对所述分类特征进行加权计算,获得加权特征;基于所述加权特征和预设的损失函数确定损失值;基于所述损失值对所述初始角度识别模型进行迭代更新,直至满足预设训练条件,得到角度识...

【专利技术属性】
技术研发人员:范峻植孟凡宇夏粉蒋宁
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1