【技术实现步骤摘要】
神经网络模型的训练方法、装置、图像分类方法和介质
本申请涉及深度学习领域,特别是涉及一种神经网络模型的训练方法、神经网络模型的训练装置、图像分类方法和计算机可读存储介质。
技术介绍
随着移动互联网与硬件处理器技术的不断发展,海量数据处理与计算能力不断提高,深度学习备受关注。卷积神经网络ConvolutionalNeuralNetwork,CNN)和循环神经网络(RecurrentNeuralNetwork,RNN)等经典神经网络模型被相继提出。CNN通过其特有的权值共享机制输入是空间上的变化,即以图像为典型例子的空间域数据表现非常好,但对于样本序列出现的时间顺序上的变化,即时间域数据无法建模。RNN正是针对时域序列数据提出的,其特殊的网络结构使神经元的输出可以在下一个时间点作为输入直接作用到本身,实现网络的输出为该时刻的输入与历史所有时刻共同作用的结果,达到对序列建模的目的。长短时记忆神经网络(LongShort-termMemoryNetworks,LSTM)是一种RNN特殊的类型,可以学习长期依赖信息。常见的时间 ...
【技术保护点】
1.一种神经网络模型的训练方法,其特征在于,所述训练方法包括:/n获取标注有标签的多组图像序列,所述标签包括具有映射关系的第一类标签和第二类标签,所述第一类标签的时间粒度大于所述第二类标签;/n利用初始的神经网络模型对每一组所述图像序列进行标签分类,得到对每一组所述图像序列预测的第一类标签和第二类标签;/n基于所述图像序列标注的第一类标签、第二类标签和所述预测的第一类标签和第二类标签计算所述初始神经网络模型的总损失函数;/n收敛所述总损失函数,以得到训练后的神经网络模型。/n
【技术特征摘要】
1.一种神经网络模型的训练方法,其特征在于,所述训练方法包括:
获取标注有标签的多组图像序列,所述标签包括具有映射关系的第一类标签和第二类标签,所述第一类标签的时间粒度大于所述第二类标签;
利用初始的神经网络模型对每一组所述图像序列进行标签分类,得到对每一组所述图像序列预测的第一类标签和第二类标签;
基于所述图像序列标注的第一类标签、第二类标签和所述预测的第一类标签和第二类标签计算所述初始神经网络模型的总损失函数;
收敛所述总损失函数,以得到训练后的神经网络模型。
2.根据权利要求1所述的训练方法,其特征在于,所述神经网络模型包括主干网络和第一分支,所述第一分支连接所述主干网络的输出端,所述利用初始的神经网络模型对每一组所述图像序列进行标签分类,得到对每一组所述图像序列预测的第一类标签和第二类标签,包括:
利用所述主干网络提取所述图像序列中每一图像的空间特征,得到表征所述每一图像的空间特征的空间特征向量;
使用所述第一分支对所述空间特征向量进行时空融合,得到所述空间特征向量的所述预测的第一类标签和第二类标签。
3.根据权利要求2所述的训练方法,其特征在于,所述第一分支包括长短时记忆网络和连接所述长短时记忆网络输出端的全连接层和映射函数,所述使用所述第一分支对所述空间特征向量进行时空融合,得到所述图像序列的所述预测的第一类标签和第二类标签,包括:
利用所述长短时记忆网络所述空间特征向量进行时间序列预测,输出所述包括时间序列的时空特征向量;
将所述时空特征向量输入所述全连接层进行第二类标签的分类,得到所述时空特征向量的预测的第二类标签;
将所述预测的第二类标签输入到映射函数,得到所述时空特征向量的预测的第一类标签。
4.根据权利要求2所述的训练方法,其特征在于,所述神经网络还包括第二分支,所述方法还包括:
基于所述空间特征向量标注的第二类标签和所述预测的第二类标签构建三元组样本,所述三元组样本包括固定样本、正样本和负样本;
将所述三元组样本输入所述第二分支,以计算所述第二分支的三元组损失函数。
5.根据权利要求4所述的训练方法,其特征在于,所述第二类标签包括多个子标签,所述多个子标签包括子标签i和除子标签i以外的其他子标签,所述基于所述空间特征向量标注的第二类标签和所述预测的第二类标签构建三元组样本,包括:
记标签为所述子标签i的空间特征向量为所述固定样本;
比对所述空间特征向量标注的子标签和预测的子标签;
将标注为所述子标签i预测为所述其他子标签的空间特征向量作为所述正样本;
将标注为所述其他子标签预测为所述子标签i的空间特征向量作为所述负样本。
6.根据权利要求4所述的训练方法,其特征在于,...
【专利技术属性】
技术研发人员:贾富仓,夏彤,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。