【技术实现步骤摘要】
票据图像中目标字段的提取方法及相关装置
本申请涉及图像处理领域,尤其涉及票据图像中目标字段的提取方法及相关装置。
技术介绍
随着人工智能的兴起,银行业务中将光学字符识别(OpticalCharacterRecognition,OCR),应用于票据图像中目标字段的识别越来越广泛。目前,从识别票据图像中的目标字段的方法包括:对票据图像中的全部字段进行检测,然后将检测出的全部字段分别进行识别,再从识别出的全部字段中提取目标字段。
技术实现思路
专利技术人在研究中发现,由于工作人员在处理业务的时候往往只需要票据图像中的几个特定字段(称为目标字段)的信息,对于非目标字段并不关心。因此,现有技术在从识别出的全部字段中提取目标字段这一过程,会出现非目标字段对目标字段的提取会造成干扰,进而,降低目标字段的提取准确性。本申请提供了一种票据图像中目标字段的提取方法及装置,目的在于解决目标字段的提取准确性低的问题。为了实现上述目的,本申请提供了以下技术方案:本申请提供了一种票据图像中目标字段的提
【技术保护点】
1.一种票据图像中目标字段的提取方法,其特征在于,包括:/n获取待处理票据图像;/n将所述待处理票据图像输入预设的区域检测模型,得到所述待处理票据图像中的目标区域;所述目标区域为包含待提取目标字段的区域;/n将所述目标区域输入预设的文字检测模型,得到所述目标区域中的各个文字分别所占的位置区域;其中,所述文字检测模型依据所述目标区域,预测核参数的取值,以及相似向量参数的取值,基于所述相似向量参数的取值修正所述核参数的取值,并通过修正后的核参数的取值重建输出文字的位置区域;其中,所述核参数的不同取值表示不同的文字;所述相似向量参数用于使得所述目标区域中相同文字分别对应的核参数取 ...
【技术特征摘要】
1.一种票据图像中目标字段的提取方法,其特征在于,包括:
获取待处理票据图像;
将所述待处理票据图像输入预设的区域检测模型,得到所述待处理票据图像中的目标区域;所述目标区域为包含待提取目标字段的区域;
将所述目标区域输入预设的文字检测模型,得到所述目标区域中的各个文字分别所占的位置区域;其中,所述文字检测模型依据所述目标区域,预测核参数的取值,以及相似向量参数的取值,基于所述相似向量参数的取值修正所述核参数的取值,并通过修正后的核参数的取值重建输出文字的位置区域;其中,所述核参数的不同取值表示不同的文字;所述相似向量参数用于使得所述目标区域中相同文字分别对应的核参数取值间的距离小于预设阈值;
对所述位置区域中的文字进行识别;
按照预设的提取规则,从识别出的文字中提取所述目标字段。
2.根据权利要求1所述的方法,其特征在于,所述区域检测模型为对预设的初始区域检测模型进行训练,得到的区域检测模型;
所述对预设的初始区域检测模型的训练过程,包括:
获取训练数据集;所述训练数据集包括:训练样本和样本标签;所述训练样本为预设的大量票据图像;所述样本标签为预先在所述票据图像中标记的包含目标字段的区域;
采用所述训练数据集对所述初始区域检测模型,进行训练;
将训练过程中满足预设训练条件时的区域检测模型,作为所述区域检测模型。
3.根据权利要求1所述的方法,其特征在于,所述按照预设的提取规则,从识别出的文字中提取所述目标字段,包括:
检测目标字段包含的各种字段;
获取与所述各种字段分别对应的预设提取算法;所述预设提取算法是依据相应字段的特点设置得到;
采用所述预设提取算法,从识别出的文字中提取所述目标字段。
4.根据权利要求1所述的方法,其特征在于,在所述获取待处理票据图像之后,且在所述将所述待处理票据图像输入预设的区域检测模型,得到所述待处理票据图像中的目标区域之前,还包括:
对所述待处理票据图像进行预处理;所述预处理包括:对所述待处理票据图像的方向检测、矫正和图像增强。
5.根据权利要求1所述的方法,其特征在于,在所述按照预设的提取规则,从识别出的文字中提取所述目标字段之后,还包括:
输出所述目标字段。
6.一种票据图像中目标字段的提取装置,其...
【专利技术属性】
技术研发人员:王建标,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。