一种基于双流卷积神经网络的危险行为自动识别方法技术

技术编号：21772689 阅读：25 留言：0更新日期：2019-08-03 21:50

本发明专利技术公开了一种基于双流卷积神经网络的危险行为自动识别方法，本发明专利技术通过对视频中的人物进行部分人工标注来减小视频背景对人物行为识别的影响；使用LeNet‑5网络学习视频中的时间特征和空间特征，将融合后的时空特征送入3D卷积神经网络中完成对视频中人物动作的识别。本发明专利技术针对视频中存在的大量无关的背景信息，本发明专利技术对部分视频帧中的人物进行人工标注，通过增加输入的监督信息来降低噪声的干扰，有效解决了视频无关背景信息对人物动作识别的干扰。本发明专利技术基于双流卷积神经网络和3D卷积神经网络的危险动作自动识别方法，构建人物危险动作自动识别网络，使用人物危险动作视频数据训练网络，构建人物危险动作自动识别模型。

An Automatic Recognition Method of Dangerous Behavior Based on Two-stream Convolutional Neural Network

全部详细技术资料下载

【技术实现步骤摘要】
一种基于双流卷积神经网络的危险行为自动识别方法
本专利技术涉及一种基于双流卷积神经网络的人体姿态估计和行为识别，更具体的是涉及一种针对监控视频数据的危险行为自动识别方法。
技术介绍
对于监狱、银行等一些特定的场所，需要避免暴力冲突、非法闯入等不稳定事件的发生，因此保持全天候的监管是十分必要的。单纯的通过安保人员巡查上述特定场所，需要耗费大量的时间成本和人力成本，效率相对低下。随着监控视频的大量普及，上述特定场所开始使用监控摄像头与安保人员相结合的方式，即安保人员借助监控摄像头实现在线巡查，对出现异常的区域再进行人为巡查和处理。这种方式要求安保人员长时间保持注意力高度集中，短时间的走神或者疏忽就可能导致非法闯入等危险行为。因此，急需一种能够辅助安保人员的基于监控视频数据的人体行为识别方法，对监控视频流中的人物姿态和动作自动识别，对可能出现的危险动作及时报警，在减轻了安保人员工作强度的同时也能提高上述特定场所的稳定程度。随着科技的不断进步，基于深度学习算法的视频数据智能分析正在快速发展，在人物脸部识别、人物位置预测等领域已经被大量应用。视频人物动作识别其本质是在时间上连续变化的序列图片的分类问题，所以图片识别的深度学习算法在视频人物动作识别研究中被大量应用。卷积神经网络(ConvolutionalNeuralNetworks,CNNs)是当前图像识别领域主流的深度学习网络，但是在基于视频的人物动作识别领域的应用受到抑制，主要的原因一方面是相较于图像数据集，视频数据集一般规模较小且质量较低（包含大量的无关噪声）；另一方面，传统的卷积神经网络不能充分的学习时间特征...

【技术保护点】
1.一种基于双流卷积神经网络的危险行为自动识别方法，其特征在于，包括以下步骤：Step1 原始数据准备针对常见的人物危险行为，选择自杀、偷窃和打架三种相对典型的人物危险动作，通过来自监狱、银行、超市以及部分来自公安系统的包含上述危险动作的视频数据；Step2 数据预处理数据增强：通过对视频进行水平翻转、对比度、亮度以及加噪处理，将原来的视频数据扩大4倍；将大小、帧率各不相同的视频数据统一到相同的大小和25帧率；Step3 数据集制作针对Step 2预处理后的数据进行人工分类，将人工分类信息作为网络训练的类别监督信息；随机选取增强后视频数据的60%作为训练数据，剩余的作为测试数据；随机选取训练数据中的30%使用可视化的图像标定工具labelimg将视频中的人物标出；Step4空间特征与时间特征的提取网络构建Step4‑1 空间特征提取网络构建空间流卷积神经网络的输入是单个视频帧，它是一种通过提取静态图片信息来完成视频人物动作识别的深度学习模型；本空间特征提取网络基于LeNet‑5网络构建；LeNet‑5是卷积神经网络“Convolutional Neural Networks, CNN”...

【技术特征摘要】
1.一种基于双流卷积神经网络的危险行为自动识别方法，其特征在于，包括以下步骤：Step1原始数据准备针对常见的人物危险行为，选择自杀、偷窃和打架三种相对典型的人物危险动作，通过来自监狱、银行、超市以及部分来自公安系统的包含上述危险动作的视频数据；Step2数据预处理数据增强：通过对视频进行水平翻转、对比度、亮度以及加噪处理，将原来的视频数据扩大4倍；将大小、帧率各不相同的视频数据统一到相同的大小和25帧率；Step3数据集制作针对Step2预处理后的数据进行人工分类，将人工分类信息作为网络训练的类别监督信息；随机选取增强后视频数据的60%作为训练数据，剩余的作为测试数据；随机选取训练数据中的30%使用可视化的图像标定工具labelimg将视频中的人物标出；Step4空间特征与时间特征的提取网络构建Step4-1空间特征提取网络构建空间流卷积神经网络的输入是单个视频帧，它是一种通过提取静态图片信息来完成视频人物动作识别的深度学习模型；本空间特征提取网络基于LeNet-5网络构建；LeNet-5是卷积神经网络“ConvolutionalNeuralNetworks,CNN”的一种代表性网络，包括有卷积层、池化层、连接层和输出层，每层包含多个相互独立的神经单元；经典的LeNet-5网络共包括7层，卷积层C1、C3、C5均使用5*5的卷积核，池化层S2、S4均使用大小为2*2模板进行平均池化，F6全连接层包括84个神经元节点，计算C5输出向量和权重向量之间的点积，OUTPUT层由一个全连接层构成，包括10个节点，采用径向欧式距离函数“EuclideanRadialBasisFunction”的网络连接方式，RBF的计算方法如公式（1）所示：（1）其中，表示输出层第i个的输出，表示F6层第j个节点的值，表示i节点和j节点之间的连接权重；Step4-2时间特征提取网络构建光流信息是连续视频帧之间的像素点位移场，描述的是视频的运动信息；对于视频中第i帧的像素点，在第k帧上记该像素点为，使用FlowNet“LearningOpticalFlowwithConvolutionalNetwork”计算光流，则该像素点从i帧到k帧的光流描述为变化，的计算方法如公式（2）所示：（2）其中，分别表示视频中第i帧和第帧；对于第i帧上所有的像素点逐像素的计算其在第k帧上对应的光流，最终获得第i帧到第j帧的光流图；本时间特征提取网络采用与空间特征提取网络相同的LeNet-5网络；时间流卷积神经网络输入的是间隔T帧之间的光流图片；Step5时空特征融合本融合视频数据中的空间特征和时间特征...

【专利技术属性】
技术研发人员：邓杨敏，李亨，吕继团，
申请(专利权)人：江苏德劭信息科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人