A multi-model voting mean action recognition method based on cross-level fusion is proposed. By improving the action recognition model and setting various parameters, a multi-model voting mean action recognition system is constructed. Using the approximate sort pooling method, the motion information in the video is aggregated to generate an RGB image, that is, an approximate dynamic image. Horizontal flipping of approximate dynamic images doubles the amount of video data. Video data is input into the convolution neural network model, and the model is improved. At the same time, before the convolution feature extracted from the convolution neural network model is input into the full connection layer, the convolution feature is reversed horizontally to increase the data volume of the convolution feature directly. Many different parameters are set up to train the model many times, and many different pre-training models are obtained. Using the idea of ensemble learning, a multi-model voting mean recognition system is constructed. The multi-model voting mean system of the invention can enhance the robustness of the system and further improve the recognition rate. It has practical application value in engineering field.
【技术实现步骤摘要】
一种基于跨层融合的多模型投票均值动作识别方法
本专利技术属于计算机视觉领域,涉及动作类视频的预处理、动作识别模型的改进、多个动作动作识别模型的融合以及动作识别。
技术介绍
作为计算机视觉中的重要分支,动作识别主要是采用一系列方法识别视频中的某一动作。目前,对动作识别的研究及应用发展较快,特别是传统的动作识别方法经过几十年的发展,变得更加成熟。比较经典的传统方法可大致分为以下几类:流形学习法、轨迹法和重叠法。而在近些年借助硬件GPU等的快速发展,深度动作识别取得了飞快的发展。比较著名的用于动作识别的模型有AlexNet模型、VGGNet模型、GoogleInceptionNet模型以及ResNet模型,等等。当今许多更高效率的动作识别系统及其应用正在研究和不断探索中。相对于传统的动作识别方法,基于跨层融合的多模型投票动作识别方法中的动作识别模型是深度动作模型,更适合用于提取更有效的人体动作的特征,并且提取的动作特征泛化能力强、更加有利于识别视频中的动作。相对于深度模型相比,本专利技术的跨层融合模型可保证特征在传输过程完整性,即通过跨层融合结构识别前面层的特征直接传输到后面去。此外,在动作识别中,单个动作识别模型的识别率对动作的预处理比较敏感,预处理结果细微的差异或者动作类模糊等等,其动作的识别准确率也会相差甚远,特别是动作类间相似性较高的动作如快跑和慢跑。而基于跨层融合的多模型投票动作识别方法由于是融合了多个动作识别模型,识别的准确率是多个模型的平均值,因此多模型具有较强的鲁棒性。
技术实现思路
本专利技术的目的是提出跨层融合的多模型投票系统的动作识别设计方法。 ...
【技术保护点】
1.一种基于跨层融合的多模型投票均值动作识别方法,包括以下步骤:步骤(1):在排序池化操作的基础上,构建近似排序池化的方法聚集视频中的动作信息,生成近似动态图像;步骤(2):对近似动态图像进行水平翻转操作,使得图像的数据量翻倍;步骤(3):在动态网络模型的基础上,对卷积神经网络提取到的动作特征进行水平翻转操作,使得可区别的动作特征数据量翻倍,为便于区分,将此模型定义为无融合模型;步骤(4):对无融合模型添加跨层融合结构,即将模型第二层的输出与模型第五层的输出进行融合,构建跨层融合模型;步骤(5):采用三种数据划分方式以及两种生成近似动态图像的顺序在无融合模型以及跨层融合模型上分别进行训练,得到多个不同的分类器;步骤(6):采用集成学习的思想将多个已训练好的动作模型进行融合,同时借助投票的方法,构成多模型投票均值的动作识别系统;步骤(7):随机抽取验证集中的视频数据,按照步骤(1)的方法生成近似动态图像,并将近似动态图像输入到多模型投票均值的识别系统中,即可得到动作类的识别准确率。
【技术特征摘要】
1.一种基于跨层融合的多模型投票均值动作识别方法,包括以下步骤:步骤(1):在排序池化操作的基础上,构建近似排序池化的方法聚集视频中的动作信息,生成近似动态图像;步骤(2):对近似动态图像进行水平翻转操作,使得图像的数据量翻倍;步骤(3):在动态网络模型的基础上,对卷积神经网络提取到的动作特征进行水平翻转操作,使得可区别的动作特征数据量翻倍,为便于区分,将此模型定义为无融合模型;步骤(4):对无融合模型添加跨层融合结构,即将模型第二层的输出与模型第五层的输出进行融合,构建跨层融合模型;步骤(5):采用三种数据划分方式以及两种生成近似动态图像的顺序在无融合模型以及跨层融合模型上分别进行训练,得到多个不同的分类器;步骤(6):采用集成学习的思想将多个已训练好的动作模型进行融合,同时借助投票的方法,构成多模型投票均值的动作识别系统;步骤(7):随机抽取验证集中的视频数据,按照步骤(1)的方法生成近似动态图像,并将近似动态图像输入到多模型投票均值的识别系统中,即可得到动作类的识别准确率。2.如权利要求1所述的一种基于跨层融合的多模型投票均值动作识别方法,其特征在于:所述的近似排序池化是指通...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。