一种文本校准方法、装置、设备及存储介质制造方法及图纸

技术编号:32458364 阅读:19 留言:0更新日期:2022-02-26 08:41
本申请实施例提供了一种文本校准方法、装置、设备及存储介质,涉及人工智能技术领域,该方法包括:获取目标对象的待处理图像,识别待处理图像中包含的目标文本内容,其中,目标文本内容包括目标对象的唯一标识和至少一个待校准文本。基于目标对象的唯一标识,从基准库中获取至少一个待校准文本各自对应的参考文本。若至少一个待校准文本与相应的参考文本的相似度均大于预设阈值,则将获得的各个参考文本,作为至少一个待校准文本对应的校准结果。由于,本申请中根据待校准文本与相应的参考文本的相似度,对待校准文本进行校准。在待校准文本存在部分识别错误的情况下,可以有效地对待校准文本进行校准。待校准文本进行校准。待校准文本进行校准。

【技术实现步骤摘要】
一种文本校准方法、装置、设备及存储介质


[0001]本专利技术实施例涉及人工智能
,尤其涉及一种文本校准方法、装置、设备及存储介质。

技术介绍

[0002]在商户入网材料审核、金融产品开户、企业招标等业务场景中,需要对企业资质证件进行系统录入以及证件信息审核。由于企业资质证件上包含的信息比较繁杂,一般使用OCR(Optical Character Recognition,光学字符识别)技术辅助证件信息的录入,可以有效地提升证件信息录入效率。
[0003]在使用OCR技术进行证件信息录入时,将企业资质证件拍摄为证件图像,对证件图像进行OCR识别。当证件图像存在图像质量问题时,将会严重影响OCR技术的识别结果,导致录入系统内的证件信息存在很多错误,增加后续证件信息的审核的工作量,严重影响证件信息录入和审核的效率。

技术实现思路

[0004]本申请实施例提供了一种文本校准方法、装置、设备及存储介质,用于提高文本识别的准确性,进而提高信息录入和审核的效率。
[0005]一方面,本申请实施例提供了一种文本校准方法,该方法包括:
[0006]获取目标对象的待处理图像;
[0007]识别所述待处理图像中包含的目标文本内容,所述目标文本内容包括所述目标对象的唯一标识和至少一个待校准文本;
[0008]基于所述目标对象的唯一标识,从基准库中获取所述至少一个待校准文本各自对应的参考文本;
[0009]若所述至少一个待校准文本与相应的参考文本的相似度均大于预设阈值,则将获得的各个参考文本,作为所述至少一个待校准文本对应的校准结果。
[0010]一方面,本申请实施例提供了一种文本校准装置,该装置包括:
[0011]获取模块,用于获取目标对象的待处理图像;
[0012]识别模块,用于识别所述待处理图像中包含的目标文本内容,所述目标文本内容包括所述目标对象的唯一标识和至少一个待校准文本;
[0013]检索模块,用于基于所述目标对象的唯一标识,从基准库中获取所述至少一个待校准文本各自对应的参考文本;
[0014]比较模块,用于若所述至少一个待校准文本与相应的参考文本的相似度均大于预设阈值,则将获得的各个参考文本,作为所述至少一个待校准文本对应的校准结果。
[0015]可选地,所述识别模块具体用于:
[0016]从所述待处理图像中,识别出至少一个目标文本检测框,并分别识别所述至少一个目标文本检测框中包含的子文本内容;
[0017]基于识别出的各个子文本内容,获得所述目标文本内容。
[0018]可选地,所述识别模块还用于:
[0019]对所述待处理图像进行特征提取,获得至少两个不同尺寸的图像特征;
[0020]对所述至少两个不同尺寸的图像特征融合,获得所述目标图像特征;
[0021]基于所述目标图像特征,确定至少一个第一候选文本检测框,以及所述至少一个第一候选文本检测框各自对应的置信度;
[0022]基于获得的各个置信度,对所述至少一个第一候选文本检测框进行筛选,获得至少一个目标文本检测框。
[0023]可选地,所述识别模块还用于:
[0024]对所述至少两个不同尺寸的图像特征进行迭代融合,直至所述至少两个不同尺寸的图像特征融合为一个融合特征停止,获得目标融合特征,并对所述目标融合特征进行特征提取,获得所述目标图像特征;
[0025]其中,每次迭代融合包括以下步骤:
[0026]将所述上一次迭代融合后保留的各个图像特征中,选取尺寸最小的图像特征作为基准特征;
[0027]基于所述基准特征的尺寸,调整上一次迭代融合获得的融合特征,并将调整尺寸后获得的融合特征与所述基准特征融合,获得本次迭代融合的融合特征。
[0028]可选地,所述识别模块还用于:
[0029]从所述至少一个第一候选文本检测框中,获取置信度大于等于置信度阈值的第二候选文本检测框;
[0030]基于获得的各个第二候选文本检测框之间的重叠属性,从所述各个第二候选文本检测框中,获得所述至少一个目标文本检测框。
[0031]可选地,所述识别模块还用于:
[0032]按照置信度从大到小的顺序,对所述各个第二候选文本检测框进行排序,获得排序结果;
[0033]按照排序结果,依次从保留的各个第二候选文本检测框中选取基准检测框,并基于选取的基准检测框与其他保留的第二候选文本检测框之间的重叠属性,对其他保留的第二候选文本检测框进行筛选,获得所述至少一个目标文本检测框。
[0034]可选地,所述识别模块还用于:
[0035]针对所述排序结果中,排在第N位的第二候选文本检测框,执行以下筛选步骤:
[0036]确定所述第N位的第二候选文本检测框分别与其他保留的第二候选文本检测框之间的交并比;其中,N为大于0的整数;
[0037]删除所述其他保留的第二候选文本检测框中,交并比大于预设阈值的第二候选文本检测框。
[0038]可选地,所述识别模块还用于:
[0039]针对所述至少一个目标文本检测框,分别执行以下操作:
[0040]对一个目标文本检测框内的图像进行特征提取,获得检测图像特征;
[0041]基于所述检测图像特征,确定所述一个目标文本检测框内的图像对应的时序特征;
[0042]将所述时序特征进行识别,获得所述一个目标文本检测框中包含的子文本内容。
[0043]可选地,所述至少一个待校准文本包括第一待校准文本,所述第一待校准文本与第一参考文本对应;
[0044]还包括相似度计算模块,所述相似度计算模块具体用于:
[0045]所述若所述至少一个待校准文本与相应的参考文本的相似度均大于预设阈值,则将获得的各个参考文本,作为所述至少一个待校准文本对应的校准结果之前,
[0046]确定所述第一待校准文本与所述第一参考文本之间的第一文本重叠度;
[0047]基于所述第一文本重叠度与重叠度阈值之间的关联关系,确定第一重叠标志;
[0048]根据所述第一文本重叠度、所述第一重叠标志,以及所述第一待校准文本和所述第一参考文本各自对应的文本长度,确定所述第一待校准文本与所述第一参考文本之间的第一相似度。
[0049]可选地,所述相似度计算模块还用于:
[0050]基于所述第一待校准文本中包含的各个字,在文本字典中的出现次数,确定所述第一待校准文本的待校准特征向量;
[0051]基于所述第一参考文本中包含的各个字,在文本字典中的出现次数,确定所述第一参考文本的参考特征向量;
[0052]将所述待校准特征向量中各个维度的待校准特征值,分别与所述参考特征向量中相应维度的参考特征值进行比较,获取所述待校准特征向量与所述参考特征向量之间的总重叠维度;
[0053]基于所述总重叠维度,确定所述第一待校准文本与所述第一参考文本之间的第一文本重叠度。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本校准方法,其特征在于,包括:获取目标对象的待处理图像;识别所述待处理图像中包含的目标文本内容,所述目标文本内容包括所述目标对象的唯一标识和至少一个待校准文本;基于所述目标对象的唯一标识,从基准库中获取所述至少一个待校准文本各自对应的参考文本;若所述至少一个待校准文本与相应的参考文本的相似度均大于预设阈值,则将获得的各个参考文本,作为所述至少一个待校准文本对应的校准结果。2.如权利要求1所述的方法,其特征在于,所述识别所述待处理图像中包含的目标文本内容,包括:从所述待处理图像中,识别出至少一个目标文本检测框,并分别识别所述至少一个目标文本检测框中包含的子文本内容;基于识别出的各个子文本内容,获得所述目标文本内容。3.如权利要求2所述的方法,其特征在于,所述从所述待处理图像中,识别出至少一个目标文本检测框,包括:对所述待处理图像进行特征提取,获得至少两个不同尺寸的图像特征;对所述至少两个不同尺寸的图像特征融合,获得所述目标图像特征;基于所述目标图像特征,确定至少一个第一候选文本检测框,以及所述至少一个第一候选文本检测框各自对应的置信度;基于获得的各个置信度,对所述至少一个第一候选文本检测框进行筛选,获得至少一个目标文本检测框。4.如权利要求3所述的方法,其特征在于,所述对所述至少两个不同尺寸的图像特征融合,获得所述目标图像特征,包括:对所述至少两个不同尺寸的图像特征进行迭代融合,直至所述至少两个不同尺寸的图像特征融合为一个融合特征停止,获得目标融合特征,并对所述目标融合特征进行特征提取,获得所述目标图像特征;其中,每次迭代融合包括以下步骤:将所述上一次迭代融合后保留的各个图像特征中,选取尺寸最小的图像特征作为基准特征;基于所述基准特征的尺寸,调整上一次迭代融合获得的融合特征,并将调整尺寸后获得的融合特征与所述基准特征融合,获得本次迭代融合的融合特征。5.如权利要求3所述的方法,其特征在于,所述基于获得的各个置信度,对所述至少一个第一候选文本检测框进行筛选,获得至少一个目标文本检测框,包括:从所述至少一个第一候选文本检测框中,获取置信度大于等于置信度阈值的第二候选文本检测框;基于获得的各个第二候选文本检测框之间的重叠属性,从所述各个第二候选文本检测框中,获得所述至少一个目标文本检测框。6.如权利要求5所述的方法,其特征在于,所述基于获得的各个第二候选文本检测框之间的重叠属性,从所述各个第二候选文本检测框中,获得所述至少一个目标文本检测框,包
括:按照置信度从大到小的顺序,对所述各个第二候选文本检测框进行排序,获得排序结果;按照排序结果,依次从保留的各个第二候选文本检测框中选取基准检测框,并基于选取的基准检测框与其他保留的第二候选文本检测框之间的重叠属性,对其他保留的第二候选文本检测框进行筛选,获得所述至少一个目标文本检测框。7.如权利要求6所述的方法,其特征在于,针对所述排序结果中,排在第N位的第二候选文本检测框,执行以下筛选步骤:确定所述第N位的第二候选文本检测框分别与其他保留的第二候选文本检测框之间的交并比;其中,N为大于0的整数;删除所述其他保留的第二候选文本检测框中,交并比大于预设阈值的第二候选文本检测框。8.如权利要求2所述的方法,其特征在于,分别识别所述至少一个目标文本检测框中包含的子文本内容,包括:针对所述至少一个目标文本检测框,分别执行以下操作:对一个目标文本检测框内的图像进行特征提取,获得检测图像特征;基于所述检测图像特征,确定所述一个目标文本检测框内的图像对应的时序特征;将所述时序特征进行识别,获得所述一个目标文本检测框中包含的子文本内容。9.如权利要求1所述的方法,其特征在于,所述至少一个待校准文本包括第一待校准文本,所述第一待校准文本与第一参考文本对应;所述若所述至少一个待校准文本与相应的参考文本的相似度均大于预设阈值,则将获得的各个参考文本,作为所述至少一个待校准文本对应的校准结果之前,还包括:确定所述第一待校准文本与所述第一参考文本之间的第一文本重叠度;基于所述第一文本重叠度与重叠度阈值之间的关联关系,确定第一重叠标志;根据所述第一文本重叠度、所述第一重叠标志,以及所述第一待校准文本和所述第一参考文本各自对应的文本长度,确定所述第一待校准文本与所述第一参考文本之间的第一相似度。10.如权利要求9所述的方法,其特征在于,所述确定所述第一待校准文本与第一参考文本之间的第一...

【专利技术属性】
技术研发人员:王欣晟韩韬张青清李航
申请(专利权)人:中国银联股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1