深度学习任务处理方法、图像识别任务处理方法和装置制造方法及图纸

技术编号:24800635 阅读:27 留言:0更新日期:2020-07-07 21:13
本发明专利技术提供了一种深度学习任务处理方法、图像识别任务处理方法和装置;其中,该深度学习任务处理方法包括:获取待处理对象,将待处理对象输入至预先训练完成的网络模型中,输出待处理对象对应的特征数据;基于特征数据,完成预设的深度学习任务;其中,网络模型根据第一样本特征和第二样本特征训练得到;预设的训练样本输入至网络模型后,网络模型输出第一样本特征;第一样本特征经预设的映射矩阵映射后,得到第二样本特征;映射矩阵根据第一样本特征对应的训练样本的类别标签和预设的目标类别确定。该方式可以在特征归一化的情况下,实现在特征层面的数据增强。

【技术实现步骤摘要】
深度学习任务处理方法、图像识别任务处理方法和装置
本专利技术涉及深度学习
,尤其是涉及一种深度学习任务处理方法、图像识别任务处理方法和装置。
技术介绍
数据增强可以有效增加深度学习网络的训练数据的多样性。常用的数据增强方式中,通常在源数据层面进行增强,例如对训练图像进行随机的旋转、平移、缩放等;但是这些方式通常都需要人工设计,导致增强后的数据种类有限。另一种方式中,可以在网络输出的特征层面进行增强,但是现有的在特征层面进行增强的方式,难以适用于特征归一化的情况,不利于从整体上提高网络训练的精确度。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种深度学习任务处理方法、图像识别任务处理方法和装置,以在特征归一化的情况下,实现在特征层面的数据增强。第一方面,本专利技术实施例提供了一种深度学习任务处理方法,方法包括:获取待处理对象,将待处理对象输入至预先训练完成的网络模型中,输出待处理对象对应的特征数据;基于特征数据,完成预设的深度学习任务;其中,网络模型根据第一样本特征和第二样本特征训练得到;预设的训练样本输入本文档来自技高网...

【技术保护点】
1.一种深度学习任务处理方法,其特征在于,所述方法包括:/n获取待处理对象,将所述待处理对象输入至预先训练完成的网络模型中,输出所述待处理对象对应的特征数据;/n基于所述特征数据,完成预设的深度学习任务;/n其中,所述网络模型根据第一样本特征和第二样本特征训练得到;预设的训练样本输入至所述网络模型后,所述网络模型输出所述第一样本特征;所述第一样本特征经预设的映射矩阵映射后,得到所述第二样本特征;所述映射矩阵根据所述第一样本特征对应的训练样本的类别标签和预设的目标类别确定。/n

【技术特征摘要】
1.一种深度学习任务处理方法,其特征在于,所述方法包括:
获取待处理对象,将所述待处理对象输入至预先训练完成的网络模型中,输出所述待处理对象对应的特征数据;
基于所述特征数据,完成预设的深度学习任务;
其中,所述网络模型根据第一样本特征和第二样本特征训练得到;预设的训练样本输入至所述网络模型后,所述网络模型输出所述第一样本特征;所述第一样本特征经预设的映射矩阵映射后,得到所述第二样本特征;所述映射矩阵根据所述第一样本特征对应的训练样本的类别标签和预设的目标类别确定。


2.根据权利要求1所述的方法,其特征在于,所述网络模型具体通过下述方式训练得到:
将预设的多个训练样本输入至所述网络模型中,输出每个所述训练样本对应的第一样本特征;其中,每个所述训练样本携带有该训练样本的类别标签;
针对每个所述训练样本,从预设的备选类别中确定目标类别;根据所述目标类别和该训练样本的类别标签,确定映射矩阵;根据所述映射矩阵和该训练样本对应的第一样本特征,确定该训练样本的第二样本特征;
根据每个所述训练样本的第一样本特征和第二样本特征,确定损失值,根据所述损失值训练所述网络模型。


3.根据权利要求2所述的方法,其特征在于,根据所述目标类别和该训练样本的类别标签,确定映射矩阵的步骤,包括:
所述映射矩阵
其中,A为所述映射矩阵;I为预设的单位矩阵;ni=μi;μi为该训练样本的类别标签的特征向量几何中心;为所述ni的转置;μj为所述目标类别的特征向量几何中心;为所述μj的转置;||||2代表二次范数;α为该训练样本的类别标签的特征向量几何中心与所述目标类别的特征向量几何中心之间的旋转角;


4.根据权利要求2所述的方法,其特征在于,根据所述映射矩阵和该训练样本对应的第一样本特征,确定该训练样本的第二样本特征的步骤,包括:
该训练样本的第二样本特征
其中,为该训练样本的第二样本特征;xi为该训练样本对应的第一样本特征;A为所述映射矩阵。


5.根据权利要求2所述的方法,其特征在于,根据每个所述训练样本的第一样本特征和第二样本特征,确定损失值的步骤,包括:
所述损失值loss=L(X,Y)+λL(Xgen,Ygen);
其中,loss为所述损失值;L()为预设的损失函数;X为每个所述训练样本的第一样本特征,Y为每个所述训练样本的类别标签;λ为预设的权重系数;Xgen为每个所述训练样本的第二样本特征;Ygen为每个所述训练样本对应的目标类别。


6.根据权利要求2所述的方法,其特征在于,所述备选类别包括多种;每个所述训练样本对应的类别标签,属于所述备选类别中的一种;
所述根据所述映射矩阵和该训练样本对应的第一样本特征,确定该训练样本的第二样本特征的步骤之后,所述方法还包括:根据每个所述训练样本对应的第一样本特征,更新每种所述备选类别的特征向量几何中心。


7.根据权利要求6所述的方法,其特征在于,根据每个所述训练样本对应的第一样本特征,更新每种所述备选类别的特征向量几何中心的步骤,包括:
针对每种备选类别,确定该备选类别的特征向量几何中心的更新量
基于所述更新量,更新该备选类别的特征向量几何中心;
其中,k为第k个备选类别;Δμk代表第k个备选类别的特征向量几何中心的更新量;m为所述训练样本的总量;i代表第i个训练样本;δ()为预设的指示函数,当y...

【专利技术属性】
技术研发人员:朱禹轲柏炎
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1