证件分类模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32125555 阅读:16 留言:0更新日期:2022-01-29 19:13
本发明专利技术涉及人工智能技术,揭露一种证件分类模型训练方法,包括:对原始证件图像集执行数据增强操作,得到增强证件图像集,根据所述增强证件图像集中每张增强证件图像的像素分布信息,生成对应的增强证件图像的相似证件图像,并选择有效信息量满足第一预设条件的相似证件图像组成有效相似证件图像集;利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图像集对预构建的证件分类模型进行图像分类预测训练,得到训练完成的证件分类模型,利用所述训练完成的证件分类模型对待检测的证件图像进行分类判断,得到待检测证件图像的分类结果。本发明专利技术还提出一种证件分类模型训练装置、设备以及介质。本发明专利技术可以提升证件分类模型训练的准确率。类模型训练的准确率。类模型训练的准确率。

【技术实现步骤摘要】
证件分类模型训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种证件分类模型训练方法、 装置、电子设备及计算机可读存储介质。

技术介绍

[0002]用户通过手机APP或小程序在线上办理金融、政务、医疗等业务时,需 要根据指定要求上传相应的证件图像。出于对业务办理的监管或合规风险管 控的要求,需要对用户上传的证件图像进行检测,识别用户证件图像的类型 是否符合要求,例如,为保证用户上传证件图像的清晰度、完整度,业务系 统要求用户不能上传证件翻拍照或证件截屏图片。
[0003]常见的证件图像类型包括证件翻拍、电子证件、复印件或截屏,如何识 别用户上传的证件图像的类型,当前普遍方式是利用基于深度学习的神经网 络模型,提取不同证件图像类型下每张证件图像的特征,根据对提取到的特 征进行分类分析,从而实现对证件图像类型的判断。
[0004]利用神经网络模型对证件图像进行分类,需要依赖大量的证件图像样本, 通过神经网络模型对大量的证件图像样本的特征提取的训练,才能保证神经 网络模型的分类准确性,然而证件图像涉及到用户的个人隐私数据,出于对 用户的个人隐私的安全保护,通常无法直接获取到大批量的证件样本图像, 从而导致当前基于神经网络模型的证件分类模型训练的准确率有待提升。

技术实现思路

[0005]本专利技术提供一种证件分类模型训练方法、装置及计算机可读存储介质, 其主要目的在于提升证件分类模型训练的准确率。
[0006]为实现上述目的,本专利技术提供的一种证件分类模型训练方法,包括:
[0007]获取原始证件图像集,对所述原始证件图像集执行数据增强操作,得到 增强证件图像集;
[0008]提取所述增强证件图像集中每张增强证件图像的像素分布信息,根据所 述像素分布信息生成对应的增强证件图像的相似证件图像;
[0009]计算每张所述相似证件图像的有效信息量,选择有效信息量满足第一预 设条件的相似证件图像组成有效相似证件图像集;
[0010]利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图 像集对预构建的证件分类模型进行图像分类的预测训练,直到所述预测训练 满足第二预设条件时,退出所述预测训练,得到训练完成的证件分类模型。
[0011]可选地,所述对所述原始证件图像集执行数据增强操作,包括:
[0012]根据预设的旋转角度对所述原始证件图像集执行旋转操作,得到旋转后 的图像集;
[0013]根据预设的缩放比例对所述原始证件图像集执行缩放操作,得到缩放后 的图像
集;
[0014]对所述原始证件图像集执行至少一种噪声添加的噪声增强操作,得到增 强噪声图像集;
[0015]汇集所述旋转后的图像集、缩放后的图像集及增强噪声图像集为增强证 件图像集。
[0016]可选地,所述对所述原始证件图像集执行至少一种噪声添加的噪声增强 操作,得到增强噪声图像集,包括:
[0017]对所述原始证件图像集中每张原始证件图像进行噪声染色,得到第一增 噪图像集;
[0018]对所述第一增噪图像集中每张第一增噪图像进行局部遮掩,得到增强噪 声图像集。
[0019]可选地,所述根据所述像素分布信息生成对应的增强证件图像的相似证 件图像,包括:
[0020]利用预构建的图像生成模型,根据每张增强证件图像的像素分布信息, 生成每张增强证件图像相应的初始相似证件图像;
[0021]计算每张所述初始相似证件图像与对应的增强证件图像之间的差异度, 并统计小于预设的差异阈值的差异度对应的初始相似证件图像数量与所有初 始相似证件图像的数量之间的生成比例;
[0022]当所述生成比例小于预设的生成比例阈值时,则调整所述图像生成模型 的参数,返回上述的利用预构建的图像生成模型,根据每张增强证件图像的 像素分布信息,生成每张增强证件图像相应的初始相似证件图像的步骤,直 到所述生成比例大于或等于所述预设的生成比例阈值;
[0023]从所述差异度中选择小于预设的差异阈值的差异度对应的初始相似证件 图像作为相似证件图像。
[0024]可选的,所述计算每张所述相似证件图像的有效信息量,包括:
[0025]统计所述相似证件图像中含有的有效信息的像素点个数及所述相似证件 图像中的像素点总数;
[0026]计算所述相似证件图像中含有有效信息的像素点个数与所述相似证件图 像中的像素点总数之间的比值,将所述比值作为每张所述相似证件图像的有 效信息量;
[0027]可选地,所述统计所述相似证件图像中含有的有效信息的像素点个数之 前,所述方法还包括:
[0028]对每张所述相似证件图像中的像素点进行二值化处理,得到每个像素点 的灰度值;
[0029]将灰度值大于预设像素阈值的像素点作为有效信息的像素点。
[0030]可选地,所述利用所述原始证件图像集、所述增强证件图像集及所述有 效相似证件图像集对预构建的证件分类模型进行图像分类的预测训练,直到 所述预测训练满足第二预设条件时,退出所述预测训练,得到训练完成的证 件分类模型,包括:
[0031]在所述原始证件图像集、所述增强证件图像集及所述有效相似证件图像 集中,为每张原始证件图像及其对应的增强证件图像、对应的有效相似证件 图像分配一个相同的
编号;
[0032]利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图 像集对预构建的证件分类模型进行图像分类的预测训练,得到分类预测结果;
[0033]统计所述分类预测结果中,同一编号的相同分类结果的图像数量与具有 所述编号的图像的总量之间的占比,并对所有编号的占比求平均,得到平均 占比值;
[0034]判断所述平均占比值是否满足第二预设条件;
[0035]若所述平均占比值不所述第二预设条件,则调整所述预构建的证件分类 模型的参数,并返回上述的利用所述原始证件图像集、所述增强证件图像集 及所述有效相似证件图像集对预构建的证件分类模型进行图像分类的预测训 练的步骤;
[0036]若所述平均占比值满足所述第二预设条件,则退出所述预测训练,得到 训练完成的证件分类模型。
[0037]为了解决上述问题,本专利技术还提供一种证件分类模型训练装置,所述装 置包括:
[0038]增强样本生成模块,用于获取原始证件图像集,对所述原始证件图像集 执行数据增强操作,得到增强证件图像集;
[0039]有效相似样本生成模块,用于提取所述增强证件图像集中每张增强证件 图像的像素分布信息,根据所述像素分布信息生成对应的增强证件图像的相 似证件图像;计算每张所述相似证件图像的有效信息量,选择有效信息量满 足第一预设条件的相似证件图像组成有效相似证件图像集;
[0040]分类模型训练模块,用于利用所述原始证件图像集、所述增强证件图像 集及所述有效相似证件图像集对预构建的证件分类模型进行图像分类的预测 训练,直到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种证件分类模型训练方法,其特征在于,所述方法包括:获取原始证件图像集,对所述原始证件图像集执行数据增强操作,得到增强证件图像集;提取所述增强证件图像集中每张增强证件图像的像素分布信息,根据所述像素分布信息生成对应的增强证件图像的相似证件图像;计算每张所述相似证件图像的有效信息量,选择有效信息量满足第一预设条件的相似证件图像组成有效相似证件图像集;利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图像集对预构建的证件分类模型进行图像分类的预测训练,直到所述预测训练满足第二预设条件时,退出所述预测训练,得到训练完成的证件分类模型。2.如权利要求1所述的证件分类模型训练方法,其特征在于,所述对所述原始证件图像集执行数据增强操作,包括:根据预设的旋转角度对所述原始证件图像集执行旋转操作,得到旋转后的图像集;根据预设的缩放比例对所述原始证件图像集执行缩放操作,得到缩放后的图像集;对所述原始证件图像集执行至少一种噪声添加的噪声增强操作,得到增强噪声图像集;汇集所述旋转后的图像集、缩放后的图像集及增强噪声图像集为增强证件图像集。3.如权利要求2所述的证件分类模型训练方法,其特征在于,所述对所述原始证件图像集执行至少一种噪声添加的噪声增强操作,得到增强噪声图像集,包括:对所述原始证件图像集中每张原始证件图像进行噪声染色,得到第一增噪图像集;对所述第一增噪图像集中每张第一增噪图像进行局部遮掩,得到增强噪声图像集。4.如权利要求1所述的证件分类模型训练方法,其特征在于,所述根据所述像素分布信息生成对应的增强证件图像的相似证件图像,包括:利用预构建的图像生成模型,根据每张增强证件图像的像素分布信息,生成每张增强证件图像相应的初始相似证件图像;计算每张所述初始相似证件图像与对应的增强证件图像之间的差异度,并统计小于预设的差异阈值的差异度对应的初始相似证件图像数量与所有初始相似证件图像的数量之间的生成比例;当所述生成比例小于预设的生成比例阈值时,则调整所述图像生成模型的参数,返回上述的利用预构建的图像生成模型,根据每张增强证件图像的像素分布信息,生成每张增强证件图像相应的初始相似证件图像的步骤,直到所述生成比例大于或等于所述预设的生成比例阈值;从所述差异度中选择小于预设的差异阈值的差异度对应的初始相似证件图像作为相似证件图像。5.如权利要求1所述的证件分类模型训练方法,其特征在于,所述计算每张所述相似证件图像的有效信息量,包括:统计所述相似证件图像中含有的有效信息的像素点个数及所述相似证件图像中的像素点总数;计算所述相似证件图像中含有有效信息的像素点个数与所述相似证件图像中的像素
点总数之间的比值,将所述比值作为每张所述相似证件图像的有效信息量。6.如权利要求5所述的...

【专利技术属性】
技术研发人员:董伟
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1