银行文字识别的方法、装置、设备和存储介质制造方法及图纸

技术编号:35695016 阅读:15 留言:0更新日期:2022-11-23 14:45
本申请提供一种银行文字识别的方法、装置、设备和存储介质,可应用于人工智能领域或金融领域,方法包括:获取待识别票据图像;利用预训练的图像分类网络确定待识别票据图像是否为折痕图像;若待识别票据图像为折痕图像,利用预训练的图像修复网络修复待识别票据图像,获得修复后图像;基于OCR技术识别修复后图像,获得文字识别结果。本方案在文字识别前,通过图像分类网络和图像修复网络,筛选出折痕图像并进行修复,从而提高了对折痕图像进行文字识别的准确率。识别的准确率。识别的准确率。

【技术实现步骤摘要】
银行文字识别的方法、装置、设备和存储介质


[0001]本专利技术涉及文字识别
,特别涉及一种银行文字识别的方法、装置、设备和存储介质。

技术介绍

[0002]随着银行业务不断地拓展,各家银行系统开展智能金融业务,例如银行票据识别系统,避免了传统人工方式比较,实现了单据的快速扫描、数据录入和人工校对。但是在票据识别的过程中,如果票据被客户折叠,就会导致被识别票据有折痕,影响识别的准确性。

技术实现思路

[0003]针对上述现有技术的缺点,本专利技术提供一种银行文字识别的方法、装置、设备和存储介质,以便消除票据上的折痕对文字识别结果的影响。
[0004]本申请第一方面提供一种银行文字识别的方法,包括:
[0005]获取待识别票据图像;
[0006]利用预训练的图像分类网络确定所述待识别票据图像是否为折痕图像;
[0007]若所述待识别票据图像为折痕图像,利用预训练的图像修复网络修复所述待识别票据图像,获得修复后图像;
[0008]基于OCR技术识别所述修复后图像,获得文字识别结果。
[0009]可选的,所述利用预训练的图像分类网络确定所述待识别票据图像是否为折痕图像之后,还包括:
[0010]若所述待识别票据图像为正常图像,基于OCR技术识别所述正常图像,获得文字识别结果。
[0011]可选的,所述利用预训练的图像分类网络确定所述待识别票据图像是否为折痕图像之前,还包括:
[0012]利用图像分类网络中的DenseNet网络模型提取每一第一样本图像的图像特征;其中,每一所述第一样本图像均对应有用于指示所述第一样本图像为折痕图像或正常图像的标注结果;
[0013]利用图像分类网络的分类器处理每一所述第一样本图像的图像特征,获得指示所述第一样本图像为折痕图像或正常图像的分类结果;
[0014]根据所述标注结果和所述分类结果的差异确定所述图像分类网络的第一损失值;
[0015]若所述第一损失值不满足预设的第一收敛条件,根据所述第一损失值更新所述图像分类网络,返回执行所述利用图像分类网络中的DenseNet网络模型提取每一第一样本图像的图像特征步骤,直至所述第一损失值满足所述第一收敛条件时,获得训练后的图像分类网络。
[0016]可选的,所述利用预训练的图像修复网络修复所述待识别票据图像之前,还包括:
[0017]获得第二样本图像以及所述第二样本图像对应的标准正常图像;其中,所述第二
样本图像为折痕图像;
[0018]利用图像修复网络修复所述第二样本图像,获得所述第二样本图像对应的第二修复图像;
[0019]根据所述第二修复图像和所述第二样本图像对应的标准正常图像的差异,确定所述图像修复网络的第二损失值;
[0020]若所述第二损失值不满足预设的第二收敛条件,根据所述第二损失值更新所述图像修复网络,返回执行所述利用图像修复网络修复所述第二样本图像,获得所述第二样本图像对应的第二修复图像步骤,直至所述第二损失值满足所述第二收敛条件时,获得训练后的图像修复网络。
[0021]本申请第二方面提供一种银行文字识别的装置,包括:
[0022]获取单元,获取待识别票据图像;
[0023]分类单元,用于用于利用预训练的图像分类网络确定所述待识别票据图像是否为折痕图像;
[0024]修复单元,用于若所述待识别票据图像为折痕图像,利用预训练的图像修复网络修复所述待识别票据图像,获得修复后图像;
[0025]识别单元,用于基于OCR技术识别所述修复后图像,获得文字识别结果。
[0026]可选的,所述识别单元还用于:
[0027]若所述待识别票据图像为正常图像,基于OCR技术识别所述正常图像,获得文字识别结果。
[0028]可选的,所述分类单元还用于:
[0029]利用图像分类网络中的DenseNet网络模型提取每一第一样本图像的图像特征;其中,每一所述第一样本图像均对应有用于指示所述第一样本图像为折痕图像或正常图像的标注结果;
[0030]利用图像分类网络的分类器处理每一所述第一样本图像的图像特征,获得指示所述第一样本图像为折痕图像或正常图像的分类结果;
[0031]根据所述标注结果和所述分类结果的差异确定所述图像分类网络的第一损失值;
[0032]若所述第一损失值不满足预设的第一收敛条件,根据所述第一损失值更新所述图像分类网络,返回执行所述利用图像分类网络中的DenseNet网络模型提取每一第一样本图像的图像特征步骤,直至所述第一损失值满足所述第一收敛条件时,获得训练后的图像分类网络。
[0033]可选的,所述修复单元还用于:
[0034]获得第二样本图像以及所述第二样本图像对应的标准正常图像;其中,所述第二样本图像为折痕图像;
[0035]利用图像修复网络修复所述第二样本图像,获得所述第二样本图像对应的第二修复图像;
[0036]根据所述第二修复图像和所述第二样本图像对应的标准正常图像的差异,确定所述图像修复网络的第二损失值;
[0037]若所述第二损失值不满足预设的第二收敛条件,根据所述第二损失值更新所述图像修复网络,返回执行所述利用图像修复网络修复所述第二样本图像,获得所述第二样本
图像对应的第二修复图像步骤,直至所述第二损失值满足所述第二收敛条件时,获得训练后的图像修复网络。
[0038]本申请第三方面提供一种电子设备,包括存储器和处理器;
[0039]其中,所述存储器用于存储计算机程序;
[0040]所述处理器用于执行所述计算机程序,所述计算机程序被执行时,具体用于实现本申请第一方面任意一项所提供的银行文字识别的方法。
[0041]本申请第四方面提供一种计算机存储介质,用于存储计算机程序,所述计算机程序被执行时,具体用于实现本申请第一方面任意一项所提供的银行文字识别的方法。
[0042]本申请提供一种银行文字识别的方法、装置、设备和存储介质,可应用于人工智能领域或金融领域,方法包括:获取待识别票据图像;利用预训练的图像分类网络确定待识别票据图像是否为折痕图像;若待识别票据图像为折痕图像,利用预训练的图像修复网络修复待识别票据图像,获得修复后图像;基于OCR技术识别修复后图像,获得文字识别结果。本方案在文字识别前,通过图像分类网络和图像修复网络,筛选出折痕图像并进行修复,从而提高了对折痕图像进行文字识别的准确率。
附图说明
[0043]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0044]图1为本申请实施例提供的一种银行文字识别的方法的流程图;
[0045]图2为本申请实施例提供的一种银行文字本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种银行文字识别的方法,其特征在于,包括:获取待识别票据图像;利用预训练的图像分类网络确定所述待识别票据图像是否为折痕图像;若所述待识别票据图像为折痕图像,利用预训练的图像修复网络修复所述待识别票据图像,获得修复后图像;基于OCR技术识别所述修复后图像,获得文字识别结果。2.根据权利要求1所述的方法,其特征在于,所述利用预训练的图像分类网络确定所述待识别票据图像是否为折痕图像之后,还包括:若所述待识别票据图像为正常图像,基于OCR技术识别所述正常图像,获得文字识别结果。3.根据权利要求1所述的方法,其特征在于,所述利用预训练的图像分类网络确定所述待识别票据图像是否为折痕图像之前,还包括:利用图像分类网络中的DenseNet网络模型提取每一第一样本图像的图像特征;其中,每一所述第一样本图像均对应有用于指示所述第一样本图像为折痕图像或正常图像的标注结果;利用图像分类网络的分类器处理每一所述第一样本图像的图像特征,获得指示所述第一样本图像为折痕图像或正常图像的分类结果;根据所述标注结果和所述分类结果的差异确定所述图像分类网络的第一损失值;若所述第一损失值不满足预设的第一收敛条件,根据所述第一损失值更新所述图像分类网络,返回执行所述利用图像分类网络中的DenseNet网络模型提取每一第一样本图像的图像特征步骤,直至所述第一损失值满足所述第一收敛条件时,获得训练后的图像分类网络。4.根据权利要求1所述的方法,其特征在于,所述利用预训练的图像修复网络修复所述待识别票据图像之前,还包括:获得第二样本图像以及所述第二样本图像对应的标准正常图像;其中,所述第二样本图像为折痕图像;利用图像修复网络修复所述第二样本图像,获得所述第二样本图像对应的第二修复图像;根据所述第二修复图像和所述第二样本图像对应的标准正常图像的差异,确定所述图像修复网络的第二损失值;若所述第二损失值不满足预设的第二收敛条件,根据所述第二损失值更新所述图像修复网络,返回执行所述利用图像修复网络修复所述第二样本图像,获得所述第二样本图像对应的第二修复图像步骤,直至所述第二损失值满足所述第二收敛条件时,获得训练后的图像修复网络。5.一种银行文字识别的装置,其特征在于,包括:获取单元,获取待识别票据图像;分类单元,用于用于利用预训练的图像分类网络确定...

【专利技术属性】
技术研发人员:李金晶黄杰董福豪王晓雪何谦谦刘浩东
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1