一种用于视频分析中的动作识别方法技术

技术编号：23625123 阅读：37 留言：0更新日期：2020-03-31 22:49

本发明专利技术公开了一种用于视频分析中的动作识别方法，包括如下步骤：(1)获取动作视频，将其处理成静止视频帧，计算叠加光流图；(2)采用步骤(1)中获得的静止图像帧数据以及光流图作为输入分别进行训练，学习特征；(3)对于步骤(2)中卷积层的时空特征进行卷积计算进行融合，并且进行3D池化，同时光流网络不截断，进行3D池化后继续提取特征；(4)将步骤(3)中得到的融合特征与光流特征进行平均计算融合；(5)根据损失函数对网络迭代训练，直至模型结果收敛。本发明专利技术能够在有限的时间规模内，尽量多的获取视频中的信息，从而增加网络的鲁棒性以及提高识别的准确率。

An action recognition method for video analysis

全部详细技术资料下载

【技术实现步骤摘要】
一种用于视频分析中的动作识别方法
本专利技术涉及视频分析
，尤其是一种用于视频分析中的动作识别方法。
技术介绍
随着多媒体时代的到来，共享视频变得更加普遍，网络上视频的传播与获取变得越来越便捷，使得视频数据的数量急剧上升。针对数量巨大的视频数据，如何分析和利用这些数据的内容成为计算机视觉领域内的一个具有重要意义和研究价值的难题。视频分析人体动作的目标是获取视频中的图像序列，训练学习并且分析理解其中人的行为动作的含义。因此动作识别在信息获取、视频监控、人机交互等各个领域有着广泛的应用价值。由于卷积神经网络在计算机视觉领域内的图像应用上得到了很好的成果，由此，研究学者们将其应用于视频分析来进行动作识别中的特征提取。单是获取视频图像中的空间、纹理、背景等静态信息对于复杂的识别任务是不够的，所以需要捕捉更多的动态信息，光流能够对视频中的时间信息有效地提取，被广泛地应用于视频分析任务中。视频分析动作识别的重要研究内容之一是如何充分利用视频中的图像信息以及运动信息，同时这也是研究过程中亟需解决的难题。动作识别的主要...

【技术保护点】
1.一种用于视频分析中的动作识别方法，其特征在于，包括如下步骤：/n(1)获取动作视频，将其处理成静止视频帧，计算叠加光流图；/n(2)采用步骤(1)中获得的静止图像帧数据以及光流图作为输入分别进行训练，学习特征；/n(3)对于步骤(2)中卷积层的时空特征进行卷积计算进行融合，并且进行3D池化，同时光流网络不截断，进行3D池化后继续提取特征；/n(4)将步骤(3)中得到的融合特征与光流特征进行平均计算融合；/n(5)根据损失函数对网络迭代训练，直至模型结果收敛。/n

【技术特征摘要】
1.一种用于视频分析中的动作识别方法，其特征在于，包括如下步骤：
(1)获取动作视频，将其处理成静止视频帧，计算叠加光流图；
(2)采用步骤(1)中获得的静止图像帧数据以及光流图作为输入分别进行训练，学习特征；
(3)对于步骤(2)中卷积层的时空特征进行卷积计算进行融合，并且进行3D池化，同时光流网络不截断，进行3D池化后继续提取特征；
(4)将步骤(3)中得到的融合特征与光流特征进行平均计算融合；
(5)根据损失函数对网络迭代训练，直至模型结果收敛。

2.如权利要求1所述的用于视频分析中的动作识别方法，其特征在于，步骤(1)中，计算叠加光流图具体包括如下步骤：
(11)首先计算光流图的光流矢量；对于连续帧t和t+1，它们之间的一组位移矢量场表示为dt，在第t帧的像素点(u,v)处的位移矢量使用dt(u,v)表示，它表示该像素点从第t帧移动到第t+1帧的对应像素点的位移矢量；
(12)将长度为L的连续帧矢量场的水平分量和垂直分量叠加起来，形成总长为2L的输入光流矢量用来表示连续帧间的运动信息：

其中，u＝[1,W],v＝[1,H],k＝[1,L]，W和H为视频的宽度和高度，对于任意像素点(u,v)，叠加光流矢量表示为Iτ(u,v,c)，c＝[1,2L]是对长度为L的帧序列中该像素点运...

【专利技术属性】
技术研发人员：王敏，吴敏，
申请(专利权)人：河海大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人