The invention discloses a method for action recognition based on CNN and SVM, the method adopts convolution neural network to identify the video in the human body, and then the support vector machine to recognize the human action areas identified. The support vector machine classification, picture frame body area on the output of a convolutional neural network method to extract and remove the small amount of information using the effective frame, then the effective input frame fragment Pyramid feature optimization model of a continuous action to carry out comprehensive description, not only reduces the amount of data, improved method in real time, and improve the accuracy of recognition.
【技术实现步骤摘要】
一种基于CNN和SVM的动作识别方法
本专利技术属于计算机视觉分析
,特别涉及了一种动作识别方法。
技术介绍
动作识别已经成为计算机视觉分析领域的热点方向,动作识别技术可以运用在智能家居中,可以对危险动作做出预计,协助监控社会治安如对打架斗殴动作,偷窃动作等进行检测和识别。动作检测有着巨大的实用价值。现阶段,常见的对人体动作进行识别的技术包括:基于3DCNN人体动作识别,双路CNN人体动作识别。基于LSTM和CNN的动作识别方法。这些方法存在重复计算,识别精度不高,识别过程中对硬件的寻求较大,对模型训练时需要的数据量和时间较长等问题。利用深度学习能对人体动作进行分析,基本可以达到的对视频中的人的动作进行识别。但是也存在着些问题,使用深度学习对计算机的硬件要求较高,在添加新的类别时训练模型所要花费的时间较多,使用较大训练数据集前提下才能得出较为准确的预测值,实时性不高等缺点。2013年在《IEEETransactionsonPatternAnalysisandMachineIntelligence》上发表的《3DConvolutionalNeuralNetworksforHumanActionRecognition》在动作识别中提出了使用3D卷积网络来对动作做分类。该模型可以从视频中的空间和时间维度进行特征提取,然后进行3D卷积,以捕捉从多个连续帧得到的运动信息。基于3D卷积特征提取器构造了一个3D卷积神经网络。这个架构可以从连续的几帧中产生多通道信息,然后在每一个通道都分离地进行卷积和采样操作,最后将所有通道的信息组合起来得到最终的特征描述。通过将空 ...
【技术保护点】
一种基于CNN和SVM的动作识别方法,其特征在于,包括以下步骤:(1)选择CNN训练数据集,进行卷积神经网络训练,得到人体识别模型,能够在视频中识别出人体;(2)选择SVM训练数据集,进行支持向量机训练,得到动作识别模型,能够对人体动作进行分类;(3)将待识别的视频输入步骤(1)得到的人体识别模型,从而识别出视频中的目标,即人体,并保存目标的位置坐标;(4)读取步骤(3)保存的目标位置坐标,从待识别的视频各帧中截取对应位置区域的图片,并将其中的连续帧图片归为一类;(5)构建有效帧提选取方法,使用有效帧提取方法从连续帧图片中选取有效信息集中的有效帧作为一个数据组;(6)将步骤(5)得到的数据组输入卷积神经网络,提取fc7特征向量;(7)构建金字塔特征优化模型,对步骤(6)得到的fc7特征向量进行优化;(8)将优化后的特征向量进行整合,再输入步骤(2)得到的动作识别模型中进行分类,得到动作识别结果。
【技术特征摘要】
1.一种基于CNN和SVM的动作识别方法,其特征在于,包括以下步骤:(1)选择CNN训练数据集,进行卷积神经网络训练,得到人体识别模型,能够在视频中识别出人体;(2)选择SVM训练数据集,进行支持向量机训练,得到动作识别模型,能够对人体动作进行分类;(3)将待识别的视频输入步骤(1)得到的人体识别模型,从而识别出视频中的目标,即人体,并保存目标的位置坐标;(4)读取步骤(3)保存的目标位置坐标,从待识别的视频各帧中截取对应位置区域的图片,并将其中的连续帧图片归为一类;(5)构建有效帧提选取方法,使用有效帧提取方法从连续帧图片中选取有效信息集中的有效帧作为一个数据组;(6)将步骤(5)得到的数据组输入卷积神经网络,提取fc7特征向量;(7)构建金字塔特征优化模型,对步骤(6)得到的fc7特征向量进行优化;(8)将优化后的特征向量进行整合,再输入步骤(2)得到的动作识别模型中进行分类,得到动作识别结果。2.根据权利要求1所述基于CNN和SVM的动作识别方法,其特征在于:步骤(1)的具体过程如下:采用PASCALVOC数据集作为CNN训练数据集,将人体图片转化成lmdb格式数据,将lmdb格式的人体图片和图片中人体的坐标输入卷积神经网络中进行训练,得到人体识别模型。3.根据权利要求1所述基于CNN和SVM的动作识别方法,其特征在于:步骤(2)的具体过程如下:采用UCFsports数据集作为SVM训练集,在该数据集的每个动作中给定了人的图片和图片中相应的动作及相应的坐标,采用OPENCV中的cvSetImageRO...
【专利技术属性】
技术研发人员:施旭涛,孙知信,赵学健,骆冰清,
申请(专利权)人:南京邮电大学盐城大数据研究院有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。