一种基于DenseNet网络与帧差法特征输入的人体行为识别方法技术

技术编号：21833798 阅读：29 留言：0更新日期：2019-08-10 18:25

本发明专利技术提供一种基于DenseNet网络与帧差法特征输入的人体行为识别方法，其可以在占用较少内存和更少训练时间的基础上，在进行人体行为识别的时候取得较高的准确率。其包括：S1：获得待识别动作视频数据；获取待识别动作视频数据的静态灰度图像序列,利用帧差法生成包含运动主体运动特征的运动帧差图；S2：以DenseNet模型为基础构建骨干网络模型，通过骨干网络模型分别搭建时间流网络和空间流网络；S3：分别训练时间流网络和空间流网络，获得训练好的时间流网络和空间流网络；S4：将静态灰度图像序列的序列作为训练好的空间流网络的输入；将运动帧差图的序列作为训练好的时间流网络的输入，获得行为识别最终结果，完成动作识别操作。

A Human Behavior Recognition Method Based on DenseNet Network and Frame Difference Feature Input

全部详细技术资料下载

【技术实现步骤摘要】
一种基于DenseNet网络与帧差法特征输入的人体行为识别方法
本专利技术涉及计算机视觉的行为识别
，具体为一种基于DenseNet网络与帧差法特征输入的人体行为识别方法。
技术介绍
从视频序列中识别人体行为的行为识别技术是一门涉及计算机视觉、模式识别和人工智能等诸多领域的研究课题。因其在视频监控、人机交互、运动分析和视频分类等多个领域中具有巨大的应用前景，因此人体行为识别技术已经成为机器视觉领域的研究热点之一。但是因为其应用环境的复杂性及相机抖动、背景复杂多变、行为的类内差异性等影响因素，现有的基于光流图片的时空双流行为识别模型存在着识别准确率低、训练时间长、因为稠密连接导致的模型参数量庞大的问题。
技术实现思路
为了解决现有技术中从视频序列中识别人体行为准确率低、训练时间长、模型参数量庞大的问题，本专利技术提供一种基于DenseNet网络与帧差法特征输入的人体行为识别方法，其可以在占用较少内存和更少训练时间的基础上，在进行人体行为识别的时候取得较高的准确率。本专利技术的技术方案是这样的：一种基于DenseNet网络与帧差法特征输入的人体行为识别方法，其包括以下步骤：S1：获得待识别动作视频数据；S2：构建骨干网络模型，通过所述骨干网络模型分别搭建时间流网络和空间流网络；S3：分别训练所述时间流网络和所述空间流网络，获得训练好的所述时间流网络和所述空间流网络；S4：把所述待识别动作视频数据输入到训练好的所述时间流网络和训练好的所述空间流网络，获得行为识别最终结果，完成动作识别操作；其特征在于：步骤S2中所述骨干网络模型是以DenseNet模型为基础构建...

【技术保护点】
1.一种基于DenseNet网络与帧差法特征输入的人体行为识别方法，其包括以下步骤：S1：获得待识别动作视频数据；S2：构建骨干网络模型，通过所述骨干网络模型分别搭建时间流网络和空间流网络；S3：分别训练所述时间流网络和所述空间流网络，获得训练好的所述时间流网络和所述空间流网络；S4：把所述待识别动作视频数据输入到训练好的所述时间流网络和训练好的所述空间流网络，获得行为识别最终结果，完成动作识别操作；其特征在于：步骤S2中所述骨干网络模型是以DenseNet模型为基础构建的，其包括4个Dense Block、3个融合层，所述Dense Block之间设置所述融合层；所述骨干网络模型后面依次连接全连接层；步骤S1中，获得待识别动作视频数据，包括以下步骤：S1‑1：对于所述待识别动作视频数据进行分割采样与色彩空间转换，获取所述待识别动作视频数据的静态灰度图像序列；S1‑2：提取所述静态灰度图像序列间的图像运动信息特征，利用帧差法生成包含运动主体运动特征的运动帧差图；步骤S4中，把所述待识别动作视频数据输入到训练好的所述时间流网络和训练好的所述空间流网络，包括以下步骤：S4‑1：将所述静态灰...

【技术特征摘要】
1.一种基于DenseNet网络与帧差法特征输入的人体行为识别方法，其包括以下步骤：S1：获得待识别动作视频数据；S2：构建骨干网络模型，通过所述骨干网络模型分别搭建时间流网络和空间流网络；S3：分别训练所述时间流网络和所述空间流网络，获得训练好的所述时间流网络和所述空间流网络；S4：把所述待识别动作视频数据输入到训练好的所述时间流网络和训练好的所述空间流网络，获得行为识别最终结果，完成动作识别操作；其特征在于：步骤S2中所述骨干网络模型是以DenseNet模型为基础构建的，其包括4个DenseBlock、3个融合层，所述DenseBlock之间设置所述融合层；所述骨干网络模型后面依次连接全连接层；步骤S1中，获得待识别动作视频数据，包括以下步骤：S1-1：对于所述待识别动作视频数据进行分割采样与色彩空间转换，获取所述待识别动作视频数据的静态灰度图像序列；S1-2：提取所述静态灰度图像序列间的图像运动信息特征，利用帧差法生成包含运动主体运动特征的运动帧差图；步骤S4中，把所述待识别动作视频数据输入到训练好的所述时间流网络和训练好的所述空间流网络，包括以下步骤：S4-1：将所述静态灰度图像序列的序列作为所述空间流网络的输入；S4-2:将步骤S4-1中选取的所述静态灰度图像序列对应的所述运动帧差图的序列作为所述时间流网络的输入。2.根据权利要求1所述一种基于DenseNet网络与帧差法特征输入的人体行为识别方法，其特征在于：步骤S4中，还包括以下步骤：S4-3：把所述运动帧差图的序列和所述静态灰度图像序列分别输入到所述时间流网络、所述空间流网络后，生成两段具有显著特征的高层特征图连续序列，即时间流高层时间轴特征序列和空间流高层语义特征序列；S4-4：把所述时间流高层时间轴特征序列输入到所述时间流网络中的时间流分类器，采用分类器计算所述时间流高层时间轴特征对于动作标签的时间概率分布；S4-5：把所述空间流高层语义特征序列输入到所述空间流网络中的空间流分类器，采用所述分类器计算所述空间流高层语义特征序列对于动作标签的空间概率分布；S4-6：通过所述时间概率分布和所述空间概率进行平均求和来获取动作的总体概率分布，完成行为识别模型的双流融合，通过筛选出概率最高的动作类作为所述行为识别最终结果。3.根据权利要求1所述一种基于DenseNet网络与帧差法特征输入的人体行为识别方法，其特征在于：所述骨干网络模型中的DenseBlock中包括4个ConvCore，每一个ConvCore中含有一个1×1卷积和一个3×3卷积的操作，每个3×3卷积层...

【专利技术属性】
技术研发人员：曹毅，刘晨，黄子龙，盛永健，林苗，李巍，
申请(专利权)人：江南大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人