银行场景下的文档图像分类方法、装置、介质和设备制造方法及图纸

技术编号:39432897 阅读:29 留言:0更新日期:2023-11-19 16:16
本发明专利技术公开了一种银行场景下的文档图像分类方法、装置、介质和设备,首先通过获取待分类文档图像在不同预设图像类别下的基准提示描述,捕捉各类别关键特征,为后续分类提供基础信息。接着,利用多个描述生成模型产生多样的转述提示描述,丰富图像内容表达,为分类提供更充分信息。然后,通过关联关系模型评估不同模型下预设图像类别的关联分数,加深对关联性的理解,增强分类依据可靠性。在加权计算阶段,综合不同模型判断,提升分类准确度。随后,基于综合关联分数的排序,稳定可信地确定待分类文档图像的图像类别。该流程在银行领域成功应用,通过综合多源信息,提升了分类可信度和准确性,为决策提供可靠支持。为决策提供可靠支持。为决策提供可靠支持。

【技术实现步骤摘要】
银行场景下的文档图像分类方法、装置、介质和设备


[0001]本专利技术涉及银行文档
,尤其是涉及一种银行场景下的文档图像分类方法、装置、介质和设备。

技术介绍

[0002]在银行的各种业务场景中,每天都会涌入大量的电子文档,如身份证、结婚证、房产证、离婚证、银行流水证明等。而为了有效地对这些文档进行分类和整理,就需要首先对文档进行有效的归类和分类保存。
[0003]传统的深度学习解决方案通常包括以下步骤:收集各种文档数据;训练和优化卷积神经网络(CNN)模型;部署上线已训练完成的模型。
[0004]然而,这种解决方案往往都需要较长的时间,通常需要2

4个月不等。而且,如果需要增加新的文档类别,整个流程就需要重新进行,可见还缺乏良好的可扩展性。

技术实现思路

[0005]基于此,有必要提供银行场景下的文档图像分类方法、装置、介质和设备,以解决难以有效分类各类文档图像的问题。
[0006]一种银行场景下的文档图像分类方法,所述方法包括:
[0007]获取银行场景下的待分类文档本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种银行场景下的文档图像分类方法,其特征在于,所述方法包括:获取银行场景下的待分类文档图像,且获取所述待分类文档图像在不同预设图像类别下的基准提示描述;分别将每一基准提示描述输入多个预设的描述生成模型中,以得到不同描述生成模型所生成的对应每一预设图像类别下的转述提示描述;获取每一预设图像类别下的所有组合描述,并将每个组合描述分别输入多个预设的关联关系模型中,以得到每一关联关系模型下每一预设图像类别的多个关联分数;其中,一个组合描述由一个待分类文档图像和一个基准提示描述组成,或一个待分类文档图像和一个转述提示描述组成,所述关联分数用于指示提示描述与对应的待分类文档图像之间的关联程度;对同一关联关系模型下每一预设图像类别的多个关联分数进行加权计算,以得到同一关联关系模型下每一预设图像类别的第一综合关联分数;对不同关联关系模型下相同预设图像类别的第一综合关联分数进行加权计算,以得到每一预设图像类别的第二综合关联分数;基于所有第二综合关联分数的大小进行排序,并基于得到的排序结果确定所述待分类文档图像的图像类别。2.根据权利要求1所述的方法,其特征在于,所述获取所述待分类文档图像在不同预设图像类别下的基准提示描述,包括:对所述待分类文档图像内的图像内容进行内容识别,以生成对应的第一摘要;对所述待分类文档图像内的文字内容进行语义识别,以生成对应的第二摘要;在每一预设图像类别下,分别基于所述第一摘要与基础提示模板内关键词之间的关联程度,及所述第二摘要与基础提示模板内关键词之间的关联程度,将所述第一摘要和所述第二摘要填入不同基础提示模板中,以得到不同预设图像类别下的基准提示描述。3.根据权利要求1的方法,其特征在于,若预设的描述生成模型包括ChatGLM、ChatGPT3.5及GPT3,则对同一关联关系模型下每一预设图像类别的多个关联分数进行加权计算的公式为:上式中,S_M
i
指示关联关系模型M下预设图像类别i的第一综合关联分数,指示基准提示描述在所对应的关联关系模型M下预设图像类别i的关联分数,指示chatglm生成的转述提示描述在所对应的关联关系模型M下预设图像类别i的关联分数,指示chatgpt3.5生成的转述提示描述在所对应的关联关系模型M下预设图像类别i的关联分数,指示gpt3生成的转述提示描述在所对应的关联关系模型M下预设图像类别i的关联分数,a1、a2、a3、a4为预设的加权值。4.根据权利要求1所述的方法,其特征在于,若预设的关联关系模型包括CLIP、BLIP及BLIP2,则所述对不同关联关系模型下相同预设图像类别的第一综合关联分数进行加权计算的公式为:
S
i
=b1*S_BLIP2
i
+b2*S_BLIP
i
+b3*S_CLIP
i
上式中,S
i
指示预设图像类别i的第二综合关联分数,S_BLIP2
i
指示关联关系模型BLIP2下预设图像类别i的第一综合关联分数,S_BLIP
i
指示关联关系模型BLIP下预设图像类别i的第一综合关联分数,S_CLIP
i
指示关...

【专利技术属性】
技术研发人员:周军
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1