【技术实现步骤摘要】
一种深度学习全局优化方法、识别方法、装置及介质
[0001]本专利技术涉及人工智能领域,尤其涉及一种深度学习全局优化方法、识别方法、装置及介质。
技术介绍
[0002]深度学习模型已经成为多种应用场景中必不可少的组成部分。训练一个深度学习模型需要大量的训练样本。在许多应用了深度学习技术的任务中,模型训练是由样本驱动的。即模型通过学习样本与样本之间的相似与差异,从而掌握相关的特征,具备实现任务目标的能力。样本多样性的大小决定着模型最终性能的优劣。然而,由于硬件限制,目前的深度学习模型都是基于批次训练的,导致样本的多样性被严重限制了。具体地说,就是在同一时间内模型只能获得少量样本的信息,由这些样本的多样性远远低于整个训练集的多样性,这就极大地影响了模型的性能。
[0003]深度学习模型的训练除了需要训练样本,还需要与之相对应的标签。例如,在图像分类任务中,训练样本是图片,标签是该图片的类别。研究人员根据图片的标签与图片间的相似度设计损失函数,来为模型的训练提供方向。然而,无论是人工标注还是算法标注,都会不可避免地产生错误,给训练样本标注错误的标签。模型为了拟合这些带有错误标签的训练样本(简称错误样本),可能会出现如收敛速度降低,性能下降等现象。并且,在全局优化时,错误样本的负面影响会更大。
技术实现思路
[0004]为至少一定程度上解决现有技术中存在的技术问题之一,本专利技术的目的在于提供一种深度学习全局优化方法、识别方法、装置及介质。
[0005]本专利技术所采用的技术方案是:
...
【技术保护点】
【技术特征摘要】
1.一种深度学习全局优化方法,其特征在于,包括以下步骤:获取训练数据集其中,x
i
是训练图像,y
i
是对应的标签,i是这对数据的索引,N为训练集样本总数量;将训练数据集导入深度模型f(x),对于训练图像x
i
,模型输出特征向量为f
i
=f(x
i
);预设记忆集用于储存训练集Train中x
i
经深度模型f(x)输出的特征向量f
i
;获取用于深度学习的训练批次,每一个批次由b个训练集Train中的样本组成,表示为Batch=(x
i
,y
i
)|
i∈B
,B为训练集Train中b个样本的索引的集合;对于每个批次模型Batch,深度模型f(x)的输出为f
i
=f(x
i
)|
i∈B
;对于训练图像x
i
在记忆集中的特征向量f
im
,根据该向量之前的特征向量与该批次输出的特征向量f
i
来更新;设更新特征的函数为UP_f(),则更新过程表示为其中表示更新之前的f
im
;根据更新后的记忆集特征向量未更新的记忆集标签来更新记忆集标签设更新标签的函数为UP_y(),则更新过程表示为其中表示更新之前的根据当前批次内的特征向量f
i
|
i∈B
与记忆集中的特征向量对于每个特征向量f
i
|
i∈B
,筛选出记忆集中对模型优化最重要的k个样本其中Ki表示关于f
i
最重要的k个样本的索引;根据当前批次的特征向量f
i
|
i∈B
与对应的标签y
i
|
i∈B
、筛选出的记忆集中对模型优化最重要的样本与对应的标签对深度模型f(x)的参数进行优化学习。2.根据权利要求1所述的一种深度学习全局优化方法,其特征在于,通过以下方式更新特征向量f
im
:直接赋值法:深度模型f(x)每输出一个批次的特征向量f
i
=f(x
i
)|
i∈B
,记忆集中对应的特征向量f
im
=f
i
;或者,滑动平均更新法:获取滑动系数λ,深度模型f(x)每输出一个批次的特征向量f
i
=f(x
i
)|
i∈B
,则记忆集中对应的特征向量3.根据权利要求1所述的一种深度学习全局优化方法,其特征在于,通过...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。