证件分类模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32125555 阅读：16 留言：0更新日期：2022-01-29 19:13

本发明专利技术涉及人工智能技术，揭露一种证件分类模型训练方法，包括：对原始证件图像集执行数据增强操作，得到增强证件图像集，根据所述增强证件图像集中每张增强证件图像的像素分布信息，生成对应的增强证件图像的相似证件图像，并选择有效信息量满足第一预设条件的相似证件图像组成有效相似证件图像集；利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图像集对预构建的证件分类模型进行图像分类预测训练，得到训练完成的证件分类模型，利用所述训练完成的证件分类模型对待检测的证件图像进行分类判断，得到待检测证件图像的分类结果。本发明专利技术还提出一种证件分类模型训练装置、设备以及介质。本发明专利技术可以提升证件分类模型训练的准确率。类模型训练的准确率。类模型训练的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
证件分类模型训练方法、装置、电子设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种证件分类模型训练方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]用户通过手机APP或小程序在线上办理金融、政务、医疗等业务时，需要根据指定要求上传相应的证件图像。出于对业务办理的监管或合规风险管控的要求，需要对用户上传的证件图像进行检测，识别用户证件图像的类型是否符合要求，例如，为保证用户上传证件图像的清晰度、完整度，业务系统要求用户不能上传证件翻拍照或证件截屏图片。
[0003]常见的证件图像类型包括证件翻拍、电子证件、复印件或截屏，如何识别用户上传的证件图像的类型，当前普遍方式是利用基于深度学习的神经网络模型，提取不同证件图像类型下每张证件图像的特征，根据对提取到的特征进行分类分析，从而实现对证件图像类型的判断。
[0004]利用神经网络模型对证件图像进行分类，需要依赖大量的证件图像样本，通过神经网络模型对大量的证件图像样本的特征提取的训练，才能保证神经网络模型的分类准确性，然而证件图像涉及到用户的个人隐私数据，出于对用户的个人隐私的安全保护，通常无法直接获取到大批量的证件样本图像，从而导致当前基于神经网络模型的证件分类模型训练的准确率有待提升。

技术实现思路

[0005]本专利技术提供一种证件分类模型训练方法、装置及计算机可读存储介质，其主要目的在于提升证件分类模型训练的准确率。
[0006]为实现上述目的，本专利技术提供的一...

【技术保护点】

【技术特征摘要】
1.一种证件分类模型训练方法，其特征在于，所述方法包括：获取原始证件图像集，对所述原始证件图像集执行数据增强操作，得到增强证件图像集；提取所述增强证件图像集中每张增强证件图像的像素分布信息，根据所述像素分布信息生成对应的增强证件图像的相似证件图像；计算每张所述相似证件图像的有效信息量，选择有效信息量满足第一预设条件的相似证件图像组成有效相似证件图像集；利用所述原始证件图像集、所述增强证件图像集及所述有效相似证件图像集对预构建的证件分类模型进行图像分类的预测训练，直到所述预测训练满足第二预设条件时，退出所述预测训练，得到训练完成的证件分类模型。2.如权利要求1所述的证件分类模型训练方法，其特征在于，所述对所述原始证件图像集执行数据增强操作，包括：根据预设的旋转角度对所述原始证件图像集执行旋转操作，得到旋转后的图像集；根据预设的缩放比例对所述原始证件图像集执行缩放操作，得到缩放后的图像集；对所述原始证件图像集执行至少一种噪声添加的噪声增强操作，得到增强噪声图像集；汇集所述旋转后的图像集、缩放后的图像集及增强噪声图像集为增强证件图像集。3.如权利要求2所述的证件分类模型训练方法，其特征在于，所述对所述原始证件图像集执行至少一种噪声添加的噪声增强操作，得到增强噪声图像集，包括：对所述原始证件图像集中每张原始证件图像进行噪声染色，得到第一增噪图像集；对所述第一增噪图像集中每张第一增噪图像进行局部遮掩，得到增强噪声图像集。4.如权利要求1所述的证件分类模型训练方法，其特征在于，所述根据所述像素分布信息生成对应的增强证件图像的相似证件图像，包括：利用预构建的图像生成模型，根据每张增强证件图像的像素分布信息，生成每张增强证件图像相应的初始相似证件图像；计算每张所述初始相似证件图像与对应的增强证件图像之间的差异度，并统计小于预设的差异阈值的差异度对应的初始相似证件图像数量与所有初始相似证件图像的数量之间的生成比例；当所述生成比例小于预设的生成比例阈值时，则调整所述图像生成模型的参数，返回上述的利用预构建的图像生成模型，根据每张增强证件图像的像素分布信息，生成每张增强证件图像相应的初始相似证件图像的步骤，直到所述生成比例大于或等于所述预设的生成比例阈值；从所述差异度中选择小于预设的差异阈值的差异度对应的初始相似证件图像作为相似证件图像。5.如权利要求1所述的证件分类模型训练方法，其特征在于，所述计算每张所述相似证件图像的有效信息量，包括：统计所述相似证件图像中含有的有效信息的像素点个数及所述相似证件图像中的像素点总数；计算所述相似证件图像中含有有效信息的像素点个数与所述相似证件图像中的像素
点总数之间的比值，将所述比值作为每张所述相似证件图像的有效信息量。6.如权利要求5所述的...

【专利技术属性】
技术研发人员：董伟，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人