动作识别模型训练方法和装置、动作识别方法和装置制造方法及图纸

技术编号:36445924 阅读:65 留言:0更新日期:2023-01-25 22:40
本公开提供了一种动作识别模型训练方法和装置,涉及计算机视觉、深度学习等技术领域。具体实现方案为:获取预置的样本集;获取预先建立的动作识别网络,动作识别网络包括卷积神经网络、循环神经网络,以及与卷积神经网络相连接、用于对图像属性进行分类的全连接层;执行以下训练步骤:基于从样本集中选取的属性标注样本,采用卷积神经网络和全连接层,计算属性损失值;基于从样本集中选取的动作标注样本,采用卷积神经网络和循环神经网络,计算动作损失值;由属性损失值和动作损失值,得到动作识别网络损失值;响应于动作识别网络满足训练完成条件,则将动作识别网络作为动作识别模型。该实施方式提高了动作识别的准确性。该实施方式提高了动作识别的准确性。该实施方式提高了动作识别的准确性。

【技术实现步骤摘要】
动作识别模型训练方法和装置、动作识别方法和装置


[0001]本公开涉及计算机
,具体涉及计算机视觉、深度学习等
,尤其涉及一种动作识别模型训练方法和装置、动作识别方法和装置、电子设备、计算机可读介质以及计算机程序产品。

技术介绍

[0002]近年来,在动作识别的深度学习(Deep Learning,DL)方法中,一种较为普遍的做法是利用卷积神经网络(Convolutional Neural Network,CNN)提取视频中图像帧的特征,再将提取的特征输入循环神经网络(Recurrent Neural Network,RNN)中提取多个连续图像帧特征中的时间序列关系,但是这种结构较为繁琐,卷积神经网络和循环神经网络较难形成一个统一整体,因此难以形成很好的针对目标的特征提取能力。

技术实现思路

[0003]提供了一种动作识别模型训练方法和装置、动作识别方法和装置、电子设备、计算机可读介质以及计算机程序产品。
[0004]根据第一方面,提供了一种动作识别模型训练方法,该方法包括:获取预置的样本集,其中,样本集包括本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种动作识别模型训练方法,所述方法包括:获取预置的样本集,其中,所述样本集包括:属性标注样本和动作标注样本;获取预先建立的动作识别网络,所述动作识别网络包括卷积神经网络、循环神经网络,以及与所述卷积神经网络相连接、用于对图像属性进行分类的全连接层;执行以下训练步骤:基于从所述样本集中选取的属性标注样本,采用所述卷积神经网络和所述全连接层,计算属性损失值;基于从所述样本集中选取的动作标注样本,采用所述卷积神经网络和所述循环神经网络,计算动作损失值;由所述属性损失值和所述动作损失值,得到动作识别网络损失值;响应于所述动作识别网络满足训练完成条件,则将所述动作识别网络作为动作识别模型。2.根据权利要求1所述的方法,所述方法还包括:响应于所述动作识别网络不满足训练完成条件,则调整所述动作识别网络中的相关参数使得所述动作识别网络损失值收敛,基于调整后的动作识别网络,继续执行上述训练步骤。3.根据权利要求1所述的方法,其中,所述基于从所述样本集中选取的属性标注样本,采用所述卷积神经网络和所述全连接层,计算属性损失值,包括:将所述属性标注样本输入所述卷积神经网络,得到所述卷积神经网络输出的特征向量;将所述特征向量输入所述全连接层,得到所述全连接层输出的所述属性标注样本的属性分类结果;基于所述属性分类结果,计算属性损失值。4.根据权利要求3所述的方法,其中,所述卷积神经网络包括:输入层、卷积层和全局池化层;所述将所述属性标注样本输入所述卷积神经网络,得到所述卷积神经网络输出的特征向量,包括:将所述属性标注样本输入所述输入层进行图像预处理,得到预处理图像;将所述预处理图像输入所述卷积层进行卷积运算,得到特征图;将所述特征图输入所述全局池化层进行全局平均池化,得到特征向量。5.根据权利要求3所述的方法,其中,所述卷积神经网络包括:输入层、卷积层和区域池化层;所述将所述属性标注样本输入所述卷积神经网络,得到所述卷积神经网络输出的特征向量,包括:将所述属性标注样本输入所述输入层进行图像预处理,得到预处理图像;将所述预处理图像输入所述卷积层进行卷积运算,得到特征图;划分所述特征图为多个不同区域;将各个区域中的特征图输入所述区域池化层进行区域平均池化,得到特征向量。6.根据权利要求1

5之一所述的方法,其中,所述动作标注样本为多帧标注图像,所述基于所述样本集中选取的动作标注样本,采用所述卷积神经网络和所述循环神经网络,计算动作损失值,包括:将所述多帧标注图像中每帧图像依次输入所述卷积神经网络,得到多帧标注图像中每帧图像对应的特征向量;将多帧标注图像中每帧图像对应的特征向量打包后,输入所述循环神经网络,得到所
述循环神经网络输出的所述多帧标注图像的动作分类结果;基于所述动作分类结果,计算动作损失值。7.一种动作识别方法,所述方法包括:获取待进行动作识别的视频序列;将所述视频序列输入采用如权利要求1

6中任一项所述的方法生成的动作识别模型中,输出所述视频序列的动作分类结果。8.一种动作识别模型训练装置,所述装置包括:样本获取单元,被配置成获取预置的样本集,其中,所述样本集包括:属性标注样本和动作标注样本;网络获取单元,被配置成获取预先建立的动作识别网络,所述动作识别网络包括卷积神经网络、循环神经网络,以及与所述卷积神经网络相连接、用于对图像属性进行分类的全连接层;属性计算单元,被配置成基于从所述样本集中选取的属性标注样本,采用所述卷积神经网络和所述全连接层,计算属性损失值...

【专利技术属性】
技术研发人员:吕以豪卢飞翔刘宗岱
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1