一种图像行为识别方法、装置、计算设备及存储介质制造方法及图纸

技术编号:26731237 阅读:22 留言:0更新日期:2020-12-15 14:33
本申请公开了一种图像行为识别方法、装置、计算设备及存储介质。所述方法及装置包括:视频输入;预处理,得到训练样本集和测试样本集;构造3D卷积神经网络;提取特征向量;进行分类训练;对模型进行测试,测试合格则对待测图像进行人体行为识别,测试不合格则重新训练。所述计算设备包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序,所述处理器执行所述计算机程序时实现本发明专利技术所述的方法。所述存储介质,优选为非易失性可读存储介质,其内存储有计算机程序,所述计算机程序在由处理器执行时实现本发明专利技术所述的方法。

【技术实现步骤摘要】
一种图像行为识别方法、装置、计算设备及存储介质
本申请涉及图像处理领域,特别是涉及一种图像行为识别方法、装置、计算设备及存储介质。
技术介绍
识别图像中的人或动物的各种行为,通常采用的模型是卷积神经网络CNN,该模型支持向量积SVM,优化不好,在原始输入中提取人工特征过于复杂,所以很难检测到目标具有的特征,导致行为识别结果不准确,且计算分析数据慢,降低了识别速度。
技术实现思路
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。根据本申请的一个方面,提供了一种图像行为识别方法,包括:逐帧读取输入的视频图像信息,并根据所述视频图像信息筛选人体行为特征明显的图像,将筛选后的图像进行保存;将所述筛选后的图像进行预处理,并将预处理后的图像分为训练样本和测试样本两部分;对训练样本和测试样本均提取灰度、x和y方向的光流、以及x和y方向的梯度共计五个通道信息,并将所述光流和梯度信息进行标记;计算训练样本和测试样本每张图像灰度值的变化率;对所述五个通道信息中的每个通道分别进行卷本文档来自技高网...

【技术保护点】
1.一种图像行为识别方法,包括:/n逐帧读取输入的视频图像信息,并根据所述视频图像信息筛选人体行为特征明显的图像,将筛选后的图像进行保存;/n将所述筛选后的图像进行预处理,并将预处理后的图像分为训练样本和测试样本两部分;/n对训练样本和测试样本均提取灰度、x和y方向的光流、以及x和y方向的梯度共计五个通道信息,并将所述光流和梯度信息进行标记;/n计算训练样本和测试样本每张图像灰度值的变化率;/n对所述五个通道信息中的每个通道分别进行卷积和下采样操作,得到每一层卷积层和下采样层的特征图的大小;/n利用训练样本的特征图构建3D卷积神经网络模型;/n将第二层采样层得到的特征图拉伸成一个向量,并对所述...

【技术特征摘要】
1.一种图像行为识别方法,包括:
逐帧读取输入的视频图像信息,并根据所述视频图像信息筛选人体行为特征明显的图像,将筛选后的图像进行保存;
将所述筛选后的图像进行预处理,并将预处理后的图像分为训练样本和测试样本两部分;
对训练样本和测试样本均提取灰度、x和y方向的光流、以及x和y方向的梯度共计五个通道信息,并将所述光流和梯度信息进行标记;
计算训练样本和测试样本每张图像灰度值的变化率;
对所述五个通道信息中的每个通道分别进行卷积和下采样操作,得到每一层卷积层和下采样层的特征图的大小;
利用训练样本的特征图构建3D卷积神经网络模型;
将第二层采样层得到的特征图拉伸成一个向量,并对所述向量进行降维,将降维后的向量作为图像的特征向量;
利用所述特征向量对所述3D卷积神经网络模型进行训练;
利用训练后的3D卷积神经网络模型对测试样本进行测试;
当测试结果合格时,利用所述的训练后的3D卷积神经网络模型对待测视频图像进行图像行为识别;
当测试结果不合格时,对所述3D卷积神经网络模型重新训练,直至测试结果合格为止。


2.根据权利要求1所述的方法,其特征在于,所述的筛选后的图像为KTH数据集。


3.根据权利要求1或2所述的方法,其特征在于,所述的将所述筛选后的图像进行预处理包括:
将筛选后的图像尺寸进行统一。


4.根据权利要求1-3中任一项所述的方法,其特征在于,所述的利用所述特征向量对所述3D卷积神经网络模型进行训练包括:
采用线性分类器对所述特征向量进行分类;
采用反向传播BP算法对训练样本进行在线训练。


5.一种图像行为识别装置,包括:
筛选模块,其配置成逐帧读取输入的视频图像信息,并根据所述视频图像信息筛选人体行为特征明显的图像,将筛选后的图像进行保存;
预处理模块,其配置成将所述筛选后的图像进行预处理,并将预处理后的图像分为训练样本和测...

【专利技术属性】
技术研发人员:吉长江
申请(专利权)人:北京影谱科技股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1