基于标签平滑的扩散标签深度学习模型训练方法及介质技术

技术编号：39315052 阅读：37 留言：0更新日期：2023-11-12 15:58

本发明专利技术公开了一种基于标签平滑的扩散标签深度学习模型训练方法，包括如：步骤1、获取原始训练数据和对应的原始标签；步骤2、将所述原始训练数据和对应的原始标签输入到深度学习模型中；步骤3、对原始训练数据进行混合扩充，得到处理后的混合训练数据；步骤4、根据所述混合训练数据中参与扩充的原始训练数据所对应的原始标签，计算出所述混合训练数据对应的混合标签；步骤5、所述深度学习模型按照扩散的标签平滑方式对原始训练数据、原始标签、混合训练数据和混合标签进行训练，输出预测结果。本发明专利技术还提供一种计算机可读存储介质，可以解决泛化性差、过拟合、抗噪能力弱、样本分布和类别不平衡问题。和类别不平衡问题。和类别不平衡问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于标签平滑的扩散标签深度学习模型训练方法及介质

[0001]本专利技术涉及模型训练
，尤其涉及一种基于标签平滑的扩散标签深度学习模型训练方法及介质。

技术介绍

[0002]人脸识别技术在各种有安全性需求的身份识别鉴定场景有着广泛应用，随着技术的发展，人脸防伪（face anti
‑
spoofing）/活体检测(liveness detection)技术得到了越来越多的关注。
[0003]人脸活体检测技术需要获取用于人脸活体检测的原始训练数据进行训练和分析，通常采用深度学习模型对用于人脸活体检测的原始训练数据进行训练。在深度学习模型的训练中，如果在用于人脸活体检测的训练集上拟合的太好可能导致泛化性不足，为了不让模型拟合的太快，也为了对数据中的噪声有一定抵抗作用，有一种标签平滑（labelsmoothing）的方案被提出。通常在深度学习领域将数据集中的错误样本当作噪声。以正样本中的错误样本举例，因为正样本的标签值为1，而错误样本本应该分类为0，却对应到1的标签，会影响模型的训练收敛过程。
>[0004]在通常本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于标签平滑的扩散标签深度学习模型训练方法，其特征在于，包括如下步骤：步骤1、获取用于人脸活体检测的原始训练数据和对应的原始标签；具体为：获取用于人脸活体检测的原始训练数据，包括多个原始样本，具体包括多个简单正样本标志T
S
、多个困难正样本标志T
H
、多个错误正样本标志T
W
、多个简单负样本标志F
S
、多个困难负样本标志F
H
和多个错误负样本标志F
W
，其中，T表示正样本，F表示负样本，S表示简单样本，H表示困难样本，W表示错误样本；所述简单正样本标志T
S
、困难正样本标志T
H
和错误正样本标志T
W
对应的原始标签为1，所述简单负样本标志F
S
、困难负样本标志F
H
和错误负样本标志F
W
对应的原始标签为0；步骤2、将所述用于人脸活体检测的原始训练数据和对应的原始标签输入到深度学习模型中；步骤3、对所述用于人脸活体检测的原始训练数据进行混合扩充，得到处理后的用于人脸活体检测的混合训练数据；具体包括：步骤31、设定混合操作的概率p的取值，p的范围为0＜p＜1；步骤32、从输入的用于人脸活体检测的原始训练数据中任意选取至少两个原始样本，并生成一个随机数R；步骤33、判断所述随机数R是否位于0＜R≤p范围内，若是，则对至少两个原始样本进行混合操作，得到混合后的样本；否则，不执行混合操作；步骤34、重复步骤32
‑
步骤33，得到多个混合后的样本构成用于人脸活体检测的混合训练数据，多个混合后的样本总数M与用于人脸活体检测的原始训练数据中的原始样本总数N一样；步骤4、根据所述用于人脸活体检测的混合训练数据中参与扩充的用于人脸活体检测的原始训练数据所对应的原始标签，计算出所述用于人脸活体检测的混合训练数据对应的混合标签；步骤5、将所述用于人脸活体检测的原始训练数据、原始标签、用于人脸活体检测的混合训练数据和混合标签作为人脸活体检测的防伪数据集，所述深度学习模型按照扩散的标签平滑方式对人脸活体检测的防伪数据集进行训练，输出预测结果。2.如权利要求1所述的基于标签平滑的扩散标签深度学习模型训练方法，其特征在于，所述步骤33中对至少两个原始样本进行混合操作，得到混合后的样本，具体为：假设从输入的用于人脸活体检测的原始训练数据中任意选取的原始样本个数为n;若n=2时，从输入的用于人脸活体检测的原始训练数据中任意选取原始样本D1和原始样本D2，其中，D1{T
S
,T
H
,T
W
,F
S
,F
H
,F
W
}，D2T
S
,T
H
,T
W
,F
S
,F
H
,F
W
},则对原始样本D1和原始样本D2进行混合操作，得到混合后的样本：=，其中为混合操作的强度，的范围为0≤≤1，Mix表示混合操作；若N＞n≥3且n为整数时，从输入的用于人脸活体检测的原始训练数据中任意选取原始样本D1、原始样本D2……
原始样本D
n
，先对前两个原始样本D1和D2进行混合操作，得到的当前混合操作结果再与下一个原始样本继续进行混合操作，以此类推，直至完成原始样本D
n
的混合操作，得到最终混合后的样本。3.如权利要求2所述的基于标签平滑的扩散标签深度学习模型训练方法，其特征在于，所...

【专利技术属性】
技术研发人员：黄慜哲，聂昌伟，兰泽华，
申请(专利权)人：睿云联厦门网络通讯技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人