一种基于样本分类的深度学习模型训练方法技术

技术编号：37997114 阅读：23 留言：0更新日期：2023-06-30 10:11

本发明专利技术公开了一种基于样本分类的深度学习模型训练方法，包括如下步骤：步骤1、抽取样本数据，将样本数据输入至深度学习模型训练，并获得输出结果；步骤2、根据输出结果，统计每个样本数据最近k次被选择后深度学习判断正确的次数以及相应的置信度，并设置置信度阈值；步骤3、根据步骤2的结果将样本数据分为简单样本、困难样本以及错误样本；步骤4、将简单样本直接进入损失函数的计算，将困难样本添加被抽取的概率后进入损失函数的计算，将错误样本终止进入损失函数的计算；步骤5、根据步骤4的结果进行损失函数的计算，然后更新模型参数，以此迭代直至训练结束。本发明专利技术可以提高深度学习模型训练的精度，增加了深度学习模型的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于样本分类的深度学习模型训练方法

[0001]本专利技术涉及深度学习
，特别涉及一种基于样本分类的深度学习模型训练方法。

技术介绍

[0002]深度学习已被广泛地应用到图像、视觉领域，给人机交互体验带来了深刻的变革。然而大部分研究都是对模型架构的改进，极少有研究会对训练技巧作深入探讨，但训练技巧却是影响深度学习泛化性能的重要因素之一。以面部表情识别领域为例，在之前的研究中有研究人员发现，该领域使用的不管是野外采集的数据集，还是在实验室中诱导产生的数据集中都存在一部分“错误”数据。这部分数据的错误可能是在样本收集过程中产生的，也可能来源于样本收集后的标注工作。同时，由于人脸表情本身的复杂性，这部分错误几乎是不可避免的，而这部分的错误数据又会影响到模型的训练。2018年，有学者提出将表情状态分为“模拟”、“掩盖”、“中立”三种类型，并使用有效的知识转移训练CNN进行面部表情识别，在一定程度上解决了表情虚假的问题。也有学者对于面部表情的虚假问题，于2021年提出通过面部微动可以更好地判断表情真实性。除了表情的虚假问题以...

【技术保护点】

【技术特征摘要】
1.一种基于样本分类的深度学习模型训练方法，其特征在于：包括如下步骤：步骤1、抽取样本数据，将样本数据输入至深度学习模型训练，并获得输出结果；步骤2、根据输出结果，统计每个样本数据最近k次被选择后深度学习模型判断正确的次数，同时统计深度学习模型识别样本数据时得到的置信度，并设置置信度阈值；步骤3、基于深度学习模型对样本数据判断正确与否、次数以及置信度阈值，将样本数据分为简单样本、困难样本以及错误样本；步骤4、将简单样本直接进入损失函数的计算，将困难样本添加被抽取的概率后进入损失函数的计算，将错误样本终止进入损失函数的计算；步骤5、根据步骤4的结果进行损失函数的计算，然后更新模型参数，以此迭代直至训练结束。2.根据权利要求1所述的基于样本分类的深度学习模型训练方法，其特征在于：所述样本数据抽取方法使用了蓄水池抽样算法。3.根据权利要求1所述的基于样本分类的深度学习模型训练方法，其特征在于：步骤2中，所述置信度阈值的计算公式如下：AT＝β
×
x
×
sigmoid(x)，0≤β≤1；式中：x为某个正确分类样本数据的平均置信度，C(i)表示第i个样本数据的置信度，AT为置信度阈值，β是一个常数；sigmoid( )表示激活函数；n为样本数据的个数。4...

【专利技术属性】
技术研发人员：林雪芬，吴宇菲，马伟锋，徐志毅，唐伟，
申请(专利权)人：浙江科技学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人