【技术实现步骤摘要】
本公开涉及计算机视觉领域,尤其涉及一种人体行为识别方法、设备及存储介质。
技术介绍
1、相关技术中主要使用二维卷积神经网络(convolutional neural networks,cnn)和循环神经网络(recurrent neural network,rnn)相结合,进行人体行为识别,例如最具代表性的lrcn(long-term recurrent convolutional networks)算法,lrcn网络首先通过二维的alexnet卷积神经网络提取视频中的空间信息,再利用单向lstm(long short termmemory,长短期记忆)建模二维卷积特征中的时间信息,实现对动作的分类。
2、然而,二维的alexnet卷积神经网络通过先空间再时间的方式将时空信息分离处理,忽略了视频中动作的潜在时空相关性,单向的lstm未能充分利用视频中的时间信息,因此会影响最终的检测效果。
技术实现思路
1、本公开的第一方面实施例提出了一种人体行为识别方法,该方法包括:对输入视频
...【技术保护点】
1.一种人体行为识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对输入视频进行分解及采样处理,得到待处理视频帧包括:
3.根据权利要求1所述的方法,其特征在于,所述三维残差卷积神经网络包括三维卷积核、池化层及三维残差模块,所述通过三维残差卷积神经网络对所述待处理视频帧进行特征提取,得到所述输入视频的局部短时时空特征包括:
4.根据权利要求1所述的方法,其特征在于,所述时空注意力模块包括时间注意力模块和空间注意力模块,所述在所述三维残差卷积神经网络插入时空注意力模块,以对所述局部短时时空特征进行时空
...【技术特征摘要】
1.一种人体行为识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对输入视频进行分解及采样处理,得到待处理视频帧包括:
3.根据权利要求1所述的方法,其特征在于,所述三维残差卷积神经网络包括三维卷积核、池化层及三维残差模块,所述通过三维残差卷积神经网络对所述待处理视频帧进行特征提取,得到所述输入视频的局部短时时空特征包括:
4.根据权利要求1所述的方法,其特征在于,所述时空注意力模块包括时间注意力模块和空间注意力模块,所述在所述三维残差卷积神经网络插入时空注意力模块,以对所述局部短时时空特征进行时空特征增强,得到增强后的局部短时时空特征包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述局部短...
【专利技术属性】
技术研发人员:余金锁,陈焱山,程志超,
申请(专利权)人:中移苏州软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。