【技术实现步骤摘要】
一种基于样本分类的深度学习模型训练方法
[0001]本专利技术涉及深度学习
,特别涉及一种基于样本分类的深度学习模型训练方法。
技术介绍
[0002]深度学习已被广泛地应用到图像、视觉领域,给人机交互体验带来了深刻的变革。然而大部分研究都是对模型架构的改进,极少有研究会对训练技巧作深入探讨,但训练技巧却是影响深度学习泛化性能的重要因素之一。以面部表情识别领域为例,在之前的研究中有研究人员发现,该领域使用的不管是野外采集的数据集,还是在实验室中诱导产生的数据集中都存在一部分“错误”数据。这部分数据的错误可能是在样本收集过程中产生的,也可能来源于样本收集后的标注工作。同时,由于人脸表情本身的复杂性,这部分错误几乎是不可避免的,而这部分的错误数据又会影响到模型的训练。2018年,有学者提出将表情状态分为“模拟”、“掩盖”、“中立”三种类型,并使用有效的知识转移训练CNN进行面部表情识别,在一定程度上解决了表情虚假的问题。也有学者对于面部表情的虚假问题,于2021年提出通过面部微动可以更好地判断表情真实性。除了表情的虚假问题以 ...
【技术保护点】
【技术特征摘要】
1.一种基于样本分类的深度学习模型训练方法,其特征在于:包括如下步骤:步骤1、抽取样本数据,将样本数据输入至深度学习模型训练,并获得输出结果;步骤2、根据输出结果,统计每个样本数据最近k次被选择后深度学习模型判断正确的次数,同时统计深度学习模型识别样本数据时得到的置信度,并设置置信度阈值;步骤3、基于深度学习模型对样本数据判断正确与否、次数以及置信度阈值,将样本数据分为简单样本、困难样本以及错误样本;步骤4、将简单样本直接进入损失函数的计算,将困难样本添加被抽取的概率后进入损失函数的计算,将错误样本终止进入损失函数的计算;步骤5、根据步骤4的结果进行损失函数的计算,然后更新模型参数,以此迭代直至训练结束。2.根据权利要求1所述的基于样本分类的深度学习模型训练方法,其特征在于:所述样本数据抽取方法使用了蓄水池抽样算法。3.根据权利要求1所述的基于样本分类的深度学习模型训练方法,其特征在于:步骤2中,所述置信度阈值的计算公式如下:AT=β
×
x
×
sigmoid(x),0≤β≤1;式中:x为某个正确分类样本数据的平均置信度,C(i)表示第i个样本数据的置信度,AT为置信度阈值,β是一个常数;sigmoid( )表示激活函数;n为样本数据的个数。4...
【专利技术属性】
技术研发人员:林雪芬,吴宇菲,马伟锋,徐志毅,唐伟,
申请(专利权)人:浙江科技学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。