凭证分类的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:28477393 阅读:26 留言:0更新日期:2021-05-15 21:46
本发明专利技术公开了凭证分类的方法、装置、电子设备和存储介质,涉及人工智能技术领域。该方法的一具体实施方式包括:获取凭证处理请求中的凭证图像;调用图像识别模型,识别对凭证图像中背景信息,以查询对应的业务类型;调用业务类型对应的语义分割模型,计算凭证图像中各要素参数对应的文本位置信息,以分割得出各要素参数对应的文本图像;调用文字识别模型,识别每个文本图像的文本信息,得出凭证图像的文本信息集合,进而确定文本信息集合的特征向量;调用分类模型确定凭证图像的类型,向终端发送凭证图像的类型。该实施方式能够解决现有识别方式对不标准的凭证识别困难,导致无法准确的识别出凭证的类型,进而降低凭证分类准确率的问题。率的问题。率的问题。

【技术实现步骤摘要】
凭证分类的方法、装置、电子设备和存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种凭证分类的方法、装置、电子设备和存储介质。

技术介绍

[0002]在采用标准化凭证的业务场景中,现有技术中通常为通过模板识别或二维码识别的方式即可对凭证进行类型识别,进而实现对凭证分类。但是对于一些不标准的凭证,没有采用标准化格式,或者有其他一些机构自主印刷,其使用的字体、语种、文字位置关系均具有多样性,现有的识别方式对其内容进行识别困难,导致无法准确的识别出凭证的类型,进而降低凭证分类的准确率。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供一种凭证分类的方法、装置、电子设备和存储介质,能够解决现有识别方式对不标准的凭证识别困难,导致无法准确的识别出凭证的类型,进而降低凭证分类准确率的问题。
[0004]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种凭证分类的方法。
[0005]本专利技术实施例的一种凭证分类的方法包括:接收终端发送的凭证处理请求,获取所述凭证处理请求中的凭证图像;调用图像识别模型,识别对所述凭证图像中背景信息,以基于预设映射关系查询对应的业务类型;调用所述业务类型对应的语义分割模型,计算所述凭证图像中各要素参数对应的文本位置信息,以分割得出各所述要素参数对应的文本图像;调用文字识别模型,识别每个文本图像的文本信息,得出所述凭证图像的文本信息集合,进而计算所述文本信息集合中各文本信息的词频特征值,以确定所述文本信息集合的特征向量;根据所述特征向量,调用分类模型确定所述凭证图像的类型,向所述终端发送所述凭证图像的类型。
[0006]在一个实施例中,所述调用图像识别模型,识别对所述凭证图像中背景信息,以基于预设映射关系查询对应的业务类型,包括:
[0007]调用图像识别模型,识别所述凭证图像中背景图像包括的字符,基于预设映射关系,从数据库中查询所述字符对应的业务类型。
[0008]在又一个实施例中,所述凭证图像中背景图像包括的字符包括字符图案和/字符串。
[0009]在又一个实施例中,在所述调用文字识别模型识别所述文本图像的文本信息,得出文本信息集合之后,还包括:
[0010]基于所述要素参数与所述文本图像之间的对应关系,确定所述要素参数对应的文本信息;
[0011]向所述终端发送所述业务要素参数对应的文本信息。
[0012]在又一个实施例中,所述计算所述文本信息集合中各文本信息的词频特征值,包
括:
[0013]对所述文本信息集合中每个文本信息,计算所述每个文本信息在所述文本集合中出现的次数和所述每个文本信息的逆文档频率,将所述次数与所述逆文档频率的乘积确定为所述每个文本信息的词频特征值。
[0014]在又一个实施例中,在所述接收终端发送的分类请求之前,还包括:
[0015]获取包括类型标签的历史凭证图像和待训练模型,所述待训练模型包括待训练的图像识别模型、语义分割模型、文字识别模型和分类模型;
[0016]接收输入指令,获取所述输入指令中的待定参数值,将所述待训练模型中待调整参数配置为所述待定参数值;
[0017]将所述历史凭证图像输入所述待训练模型,以调整所述待定参数值,得出训练后的模型。
[0018]在又一个实施例中,所述获取包括类型标签的历史凭证图像,包括:
[0019]从历史凭证图像库中获取多个历史凭证图像;
[0020]调用预设的标注模型,对所述多个历史凭证图像标注所属类型的类型标签,得出所述包括类型标签的历史凭证图像。
[0021]在又一个实施例中,所述从历史凭证图像库中获取多个历史凭证图像之后,还包括:
[0022]调用预设的标注模型,对所述多个历史凭证图像标注要素参数对应文本位置的标签。
[0023]为实现上述目的,根据本专利技术实施例的另一方面,提供了一种凭证分类的装置。
[0024]本专利技术实施例的一种凭证分类的装置包括:接收单元,用于接收终端发送的凭证处理请求,获取所述凭证处理请求中的凭证图像;查询单元,用于调用图像识别模型,识别对所述凭证图像中背景信息,以基于预设映射关系查询对应的业务类型;分割单元,用于调用所述业务类型对应的语义分割模型,计算所述凭证图像中各要素参数对应的文本位置信息,以分割得出各所述要素参数对应的文本图像;识别单元,用于调用文字识别模型,识别每个文本图像的文本信息,得出所述凭证图像的文本信息集合,进而计算所述文本信息集合中各文本信息的词频特征值,以确定所述文本信息集合的特征向量;分类单元,用于根据所述特征向量,调用分类模型确定所述凭证图像的类型,向所述终端发送所述凭证图像的类型。
[0025]在一个实施例中,所述查询单元,具体用于:
[0026]调用图像识别模型,识别所述凭证图像中背景图像包括的字符,基于预设映射关系,从数据库中查询所述字符对应的业务类型。
[0027]在又一个实施例中,所述装置包括:
[0028]确定单元,用于基于所述要素参数与所述文本图像之间的对应关系,确定所述要素参数对应的文本信息;
[0029]发送单元,用于向所述终端发送所述业务要素参数对应的文本信息。
[0030]在又一个实施例中,所述凭证图像中背景图像包括的字符包括字符图案和/字符串。
[0031]在又一个实施例中,所述识别单元,具体用于:
[0032]对所述文本信息集合中每个文本信息,计算所述每个文本信息在所述文本集合中出现的次数和所述每个文本信息的逆文档频率,将所述次数与所述逆文档频率的乘积确定为所述每个文本信息的词频特征值。
[0033]在又一个实施例中,所述装置还包括:
[0034]获取单元,用于获取包括类型标签的历史凭证图像和待训练模型,所述待训练模型包括待训练的图像识别模型、语义分割模型、文字识别模型和分类模型;
[0035]配置单元,用于接收输入指令,获取所述输入指令中的待定参数值,将所述待训练模型中待调整参数配置为所述待定参数值;
[0036]调整单元,用于将所述历史凭证图像输入所述待训练模型,以调整所述待定参数值,得出训练后的模型。
[0037]在又一个实施例中,所述获取单元,具体用于:
[0038]从历史凭证图像库中获取多个历史凭证图像;
[0039]调用预设的标注模型,对所述多个历史凭证图像标注所属类型的类型标签,得出所述包括类型标签的历史凭证图像。
[0040]在又一个实施例中,所述获取单元,具体用于:
[0041]调用预设的标注模型,对所述多个历史凭证图像标注要素参数对应文本位置的标签。
[0042]为实现上述目的,根据本专利技术实施例的再一个方面,提供了一种电子设备。
[0043]本专利技术实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种凭证分类的方法,其特征在于,包括:接收终端发送的凭证处理请求,获取所述凭证处理请求中的凭证图像;调用图像识别模型,识别对所述凭证图像中背景信息,以基于预设映射关系查询对应的业务类型;调用所述业务类型对应的语义分割模型,计算所述凭证图像中各要素参数对应的文本位置信息,以分割得出各所述要素参数对应的文本图像;调用文字识别模型,识别每个文本图像的文本信息,得出所述凭证图像的文本信息集合,进而计算所述文本信息集合中各文本信息的词频特征值,以确定所述文本信息集合的特征向量;根据所述特征向量,调用分类模型确定所述凭证图像的类型,向所述终端发送所述凭证图像的类型。2.根据权利要求1所述的方法,其特征在于,所述调用图像识别模型,识别对所述凭证图像中背景信息,以基于预设映射关系查询对应的业务类型,包括:调用图像识别模型,识别所述凭证图像中背景图像包括的字符,基于预设映射关系,从数据库中查询所述字符对应的业务类型。3.根据权利要求2所述的方法,其特征在于,所述凭证图像中背景图像包括的字符包括字符图案和/字符串。4.根据权利要求1所述的方法,其特征在于,在所述调用文字识别模型识别所述文本图像的文本信息,得出文本信息集合之后,还包括:基于所述要素参数与所述文本图像之间的对应关系,确定所述要素参数对应的文本信息;向所述终端发送所述业务要素参数对应的文本信息。5.根据权利要求1所述的方法,其特征在于,所述计算所述文本信息集合中各文本信息的词频特征值,包括:对所述文本信息集合中每个文本信息,计算所述每个文本信息在所述文本集合中出现的次数和所述每个文本信息的逆文档频率,将所述次数与所述逆文档频率的乘积确定为所述每个文本信息的词频特征值。6.根据权利要求1所述的方法,其特征在于,在所述接收终端发送的分类请求之前,还包括:获取包括类型标签的历史凭证图像和待训练模型,所述待训练模型包括待训练的图像识别模型、语义分割模型、文字识别模型和分类模型;接收输入指令,获取所述输入指令中的待定参数值,将所述待训练模型中待调整参数配置为所述待定参数值;将所述历史凭证图像输入所述待训练模型,以调整所述待定参数值,得出训练后的模型。7.根据权利要求6所述的方法,其特征在于,所述获取包括类型标签的历史凭证图像,包括:从历史凭证图像库中获取多个历史凭证图像;调用预设的标注模型,对所述多个历史凭证图像标注所属类型的类型标签,得出所述
包括类型标签的历史凭证图像。8.根据权利要求7所述的方法,其特征在于,所述从历史凭证图像库中获取多个历史凭证图像之后,还包...

【专利技术属性】
技术研发人员:陈冠宇王超汪维肖翔熊兰君方礼蓉张小彪许笠
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1