【技术实现步骤摘要】
一种基于梯度的样本学习难度度量方法及装置
[0001]本专利技术涉及计算机应用
,尤其是涉及一种基于梯度的样本学习难度的度量方法及装置。
技术介绍
[0002]在图像识别,目标检测等诸多领域,需要对不同难度的样本应用不同的学习策略。而对样本进行学习难度上的划分则是其中的核心技术。
[0003]近年来,诸多算法分别提出依据样本在训练过程中的损失函数值大小,或Softmax之后的prediction进行样本学习难度的区分,并运用不同的学习策略,以提升模型的性能或准确率。但是根据已有的研究,训练样本的损失函数值在训练后期趋于0,且prediction受多种因素影响,反映样本学习难度的准确性存在一定程度的浮动。以上两种度量标准并不适用于一些对样本学习难度度量准确率要求较高的应用场合。
[0004]目前虽已有一些区别于以上两种度量的方法被提出,然而适用场景大多受限于个别学习问题,并无一个统一规范,相对合理且适用于大多数应用场合的标准。
技术实现思路
[0005]为解决现有技术的不足,本专利技术依据 ...
【技术保护点】
【技术特征摘要】
1.一种基于梯度的样本学习难度度量方法,其特征在于包括如下步骤:S1,采集图像数据作为训练样本,构建深度神经网络,并采用随机梯度下降进行训练;S2,使用深度神经网络,对图像样本进行一次完整训练;记录每个图像样本在一次训练过程中K次迭代的Softmax层前一层的梯度向量;S3,计算每个图像样本K次迭代的梯度的模;S4,基于每个图像样本K次迭代的梯度的模,得到每个图像样本的学习难度度量;S5,在给定样本邻域内样本数和加权参数下,以两个图像样本之间的学习难度差距为距离度量,求得每个图像样本的局部异常因子,根据异常因子确定异常点;S6,针对异常点,构建线性回归模型,找到使异常点的局部异常因子最大的参数,并对其进行调节,使学习难度更高的图像样本作为异常点,与其他图像样本区分开。2.根据权利要求1所述的一种基于梯度的样本学习难度度量方法,其特征在于所述S2中的K次迭代,是指各个图像样本在一次完整的训练过程中,以为间隔,总共K次迭代的,在Softmax层前一层的梯度向量。3.根据权利要求1所述的一种基于梯度的样本学习难度度量方法,其特征在于所述S2中的梯度向量表示为i表示第i个训练样本,N表示描述样本的特征个数。4.根据权利要求1所述的一种基于梯度的样本学习难度度量方法,其特征在于所述S3中的模,是在一维空间上的1
‑
范数和/或2
‑
范数,即各方向上的分量的绝对值之和。5.根据权利要求1所述的一种基于梯度的样本学习难度度量方法,其特征在于所述S3中的模表示为|
·
|表示模运算。6.根据权利要求5所述的一种基于梯度的样本学习难度度量方法,其特征在于所述S4基于每个样本K次迭代的梯度的模求得梯度的均值和方差根据均...
【专利技术属性】
技术研发人员:张吉,吴偶,祝蔚瑶,朱玉,许增辉,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。