文本识别方法、装置、设备、介质及产品制造方法及图纸

技术编号:37544344 阅读:13 留言:0更新日期:2023-05-12 16:14
本申请公开了一种文本识别方法、装置、设备、介质及产品。该文本识别方法包括:针对目标类型的证件设置目标识别模板;获取与目标证件对应的目标证件图像,对目标证件图像进行文本识别,得到初始识别结果;确定得到文本信息相匹配的多对目标文本区域和目标锚点区域;根据目标区域位置信息确定待识别区域在目标证件图像中的映射区域对应的映射区域位置信息;从多个文本区域中确定与映射区域相交的第一文本区域;从初始识别结果中获取与第一文本区域对应的第一文本信息,并根据第一文本信息输出目标证件图像对应的识别结果。根据本申请实施例,可以基于通用化的识别模型对不同类型的证照进行文本识别,节约了大量时间和资源。节约了大量时间和资源。节约了大量时间和资源。

【技术实现步骤摘要】
文本识别方法、装置、设备、介质及产品


[0001]本申请属于信息提取
,尤其涉及一种文本识别方法、装置、设备、介质及产品。

技术介绍

[0002]随着深度学习技术的不断发展,光学字符识别模型OCR装置作为一种文字识别技术,在日常生活中基于OCR装置的图像的文本识别、提取功能被广泛应用。
[0003]在进行有标准格式的证照的本文信息提取时,针对不同的证照需要利用识别技开发不同的OCR模型,每当证照类型进行更新后,需要再对不同类型的证照识别模型进行重新训练,浪费了大量时间和资源。

技术实现思路

[0004]本申请实施例提供一种文本识别方法、装置、设备、介质及产品,能够基于通用化的识别模型对不同类型的证照进行文本识别,节约了大量时间和资源。
[0005]第一方面,本申请实施例提供一种文本识别方法,该方法包括:
[0006]针对目标类型的证件设置目标识别模板,目标识别模板中包括与多个锚点区域分别对应的标准文本信息和锚点区域位置信息,以及与待识别区域对应的目标区域位置信息;
[0007]获取与目标证件对应的目标证件图像,对目标证件图像进行文本识别,得到初始识别结果,初始识别结果中包括与多个文本区域分别对应的文本信息和文本区域位置信息;
[0008]在目标证件的类型为目标类型的情况下,将初始识别结果中的文本信息与目标识别模板中的标准文本信息进行一一比对,确定得到文本信息相匹配的多对目标文本区域和目标锚点区域;
[0009]基于目标文本区域对应的文本区域位置信息,和目标锚点区域对应的锚点区域位置信息之间的映射关系,根据目标区域位置信息确定待识别区域在目标证件图像中的映射区域对应的映射区域位置信息;
[0010]根据映射区域位置信息和多个文本区域分别对应的文本区域位置信息,从多个文本区域中确定与映射区域相交的第一文本区域;
[0011]从初始识别结果中获取与第一文本区域对应的第一文本信息,并根据第一文本信息输出目标证件图像对应的识别结果。
[0012]第二方面,本申请实施例提供了一种文本识别装置,该装置包括:
[0013]设置模块,用于针对目标类型的证件设置目标识别模板,目标识别模板中包括与多个锚点区域分别对应的标准文本信息和锚点区域位置信息,以及与待识别区域对应的目标区域位置信息;
[0014]获取模块,用于获取与目标证件对应的目标证件图像,对目标证件图像进行文本
识别,得到初始识别结果,初始识别结果中包括与多个文本区域分别对应的文本信息和文本区域位置信息;
[0015]第一确定模块,用于在目标证件的类型为目标类型的情况下,将初始识别结果中的文本信息与目标识别模板中的标准文本信息进行一一比对,确定得到文本信息相匹配的多对目标文本区域和目标锚点区域;
[0016]第二确定模块,用于基于目标文本区域对应的文本区域位置信息,和目标锚点区域对应的锚点区域位置信息之间的映射关系,根据目标区域位置信息确定待识别区域在目标证件图像中的映射区域对应的映射区域位置信息;
[0017]第三确定模块,用于根据映射区域位置信息和多个文本区域分别对应的文本区域位置信息,从多个文本区域中确定与映射区域相交的第一文本区域;
[0018]输出模块,用于从初始识别结果中获取与第一文本区域对应的第一文本信息,并根据第一文本信息输出目标证件图像对应的识别结果。
[0019]第三方面,本申请实施例提供了一种电子设备,该电子设备包括:处理器以及存储有计算机程序指令的存储器;
[0020]处理器执行所述计算机程序指令时实现如第一方面的任一项实施例中所述的文本识别方法的步骤。
[0021]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如第一方面的任一项实施例中所述的文本识别方法的步骤。
[0022]第五方面,本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如第一方面的任一项实施例中所述的文本识别方法的步骤。
[0023]本申请实施例中的文本识别方法、装置、设备、介质及产品,通过为目标类型的证件设置识别模板,模板中设置的锚点区域对应有标准文本信息和锚点区域位置信息,以及待识别区域对应的目标区域位置信息。再通过获取目标证件图像的初始文本识别结果中的文本信息和文本区域位置信息,在确定目标证件的类型后,将文本信息和标准文本信息进行比对,以此来确定文本信息相匹配的多对目标文本区域和目标锚点区域。基于目标文本区域的文本区域位置信息和目标锚点区域对应的锚点区域位置信息之间的映射关系,可以根据目标区域位置信息确定待识别区域在目标证件图像中的映射区域对应的映射位置信息。基于映射区域位置信息和文本区域分别对应的文本区域位置信息,可以确定出与映射区域相交的第一文本区域。将第一文本区域对应的第一文本信息输出为目标证件图像对应的识别结果。在对不同证照进行文本识别时,基于模板中设置的锚点区域和待识别区域信息,实现了基于通用化的识别模板对不同类型的证照进行文本识别,节约了大量时间和资源。
附图说明
[0024]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是本申请实施例提供的一种文本识别方法的流程示意图;
[0026]图2是本申请实施例提供的一种文本识别方法的证照示意图;
[0027]图3是本申请实施例提供的一种文本识别装置的结构示意图;
[0028]图4是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0029]下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
[0030]需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0031]本申请技术方案中对数据的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法,其特征在于,包括:针对目标类型的证件设置目标识别模板,所述目标识别模板中包括与多个锚点区域分别对应的标准文本信息和锚点区域位置信息,以及与待识别区域对应的目标区域位置信息;获取与目标证件对应的目标证件图像,对所述目标证件图像进行文本识别,得到初始识别结果,所述初始识别结果中包括与多个文本区域分别对应的文本信息和文本区域位置信息;在所述目标证件的类型为所述目标类型的情况下,将所述初始识别结果中的所述文本信息与所述目标识别模板中的所述标准文本信息进行一一比对,确定得到文本信息相匹配的多对目标文本区域和目标锚点区域;基于所述目标文本区域对应的文本区域位置信息,和所述目标锚点区域对应的锚点区域位置信息之间的映射关系,根据所述目标区域位置信息确定所述待识别区域在所述目标证件图像中的映射区域对应的映射区域位置信息;根据所述映射区域位置信息和所述多个文本区域分别对应的文本区域位置信息,从所述多个文本区域中确定与所述映射区域相交的第一文本区域;从所述初始识别结果中获取与所述第一文本区域对应的第一文本信息,并根据所述第一文本信息输出所述目标证件图像对应的识别结果。2.根据权利要求1所述的方法,其特征在于,所述多个锚点区域包括固定文本区域、可变文本区域以及固定文本和可变文本组合区域。3.根据权利要求1所述的方法,其特征在于,所述目标识别模板中还包括与所述待识别区域对应的文本布局形式;在所述第一文本区域的数量为多个的情况下,所述从所述初始识别结果中获取与所述第一文本区域对应的第一文本信息,并根据所述第一文本信息输出所述目标证件图像对应的识别结果,包括:在所述文本布局形式为单行文本形式的情况下,确定所述第一文本区域与所述映射区域相交部分占所述映射区域的第一目标比例;从多个所述第一文本区域中获取所述第一目标比例最大的文本区域,作为第二文本区域;从所述初始识别结果中获取与所述第二文本区域对应的第二文本信息;根据所述第二文本信息输出所述目标证件图像对应的识别结果。4.根据权利要求3所述的方法,其特征在于,所述从所述初始识别结果中获取与所述第一文本区域对应的第一文本信息,并根据所述第一文本信息输出所述目标证件图像对应的识别结果,包括:在所述文本布局形式为多行文本形式的情况下,确定所述第一文本区域与所述映射区域相交部分占所述第一文本区域的第二目标比例;从多个所述第一文本区域中获取所述第二目标比例大于预设阈值的一个或多个文本区域,作为第二文本区域;从所述初始识别结果中获取与所述第二文本区域对应的第二文本信息;在所述第二文本区域的数量为一个的情况下,根据所述第二文本信息输出所述目标证
件图像对应的识别结果;在所述第二文本区域的数量为多个的情况下,将多个所述文本区域分别对应的第二文本信息进行拼接,得到第三文本信息,并根据所述第三文本信息输出所述目标证件图像对应的识别结果。5.根据权利要求1所述的方法,其特征在于,所述目标识别模板中还包括与所述待识别区域对应的前缀信息和/或后缀信息;所述根据所述第一文本信息输出所述目标证件图像对应的识别结果,包括:根据所述前缀信息和/或后缀信息确定所述第一文本信息中包含的多余信息;删除所述第一文本信息中的所述多余信息,输出得到所述目标证件图像对应的识别结果。6.根据权利要求5所述的方法,其特征在于,在所述前缀信息和/或所述后缀信息中包括多个固定字符且无正则表达式的情况下,所述根据所述前缀信息和/或后缀信息确定所述第一文本信息中包含的多余信息,包括:在所述多个固定字符之间进行排列组合,得到多个字符集合;将所述第一文本信息中的字符与所述多个字符集合中包含的字符分别进行比对,确定所述第一文本信息中包含的多余信息。7.根据权利要求5所述的方法,其特征在于,在所述前缀信息和/或所述后缀信息中包括正则表达式的情况下,所述根据所述前缀信息和/或后缀信息确定所述第一文本信息中包含的多余信息,包括:将所述正则表达式对应的多个可选字符分别与所述第一文本信息中的字符进行比对,确定所述第一文本信息中包含的多余信息。8.根据权利要求1所述的方法,其特征在于,所述目标识别模板中还包括与所述待识别区域对应的多个目标可选字符;所述初始识别结果中还包括与...

【专利技术属性】
技术研发人员:戴菀庭罗奕康王伊妍张士存聂砂
申请(专利权)人:建信金融科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1