【技术实现步骤摘要】
一种基于双流卷积神经网络和SVM的抽烟动作识别方法
本专利技术涉及基于双流卷积神经网络的人体行为识别,更具体的是涉及一种针对监控视频数据的抽烟动作自动识别方法。
技术介绍
吸烟不仅是一种对人体健康危害巨大的不良习惯,更是一种安全隐患的主要诱发原因。对于加油站、油库、化学药品库等存储大量易燃易爆物品的场所,吸烟的明火可能导致火灾或爆炸等安全事故,造成巨大的经济损失和人员伤亡。目前,在上述场所下对于吸烟行为的防范主要依靠宣传标语警示或安全人员监察,将可能引发的巨大灾难寄托在依靠宣传标语唤醒的人员素质是不可靠的,安全人员也难以时刻观察场所内所有人员的行为,在吸烟后发现和及时制止,安全隐患已经出现。因此,我们急需一种在吸烟安全隐患刚刚出现的瞬间就能检测并报警的基于监控视频的抽烟行为自动识别方法,通过对禁烟场所的监控视频流中人员姿态的估计和动作的识别,对可能存在的抽烟动作及时预警,提醒管理人员重点注意,在减轻了安保人员工作强度的同时提高大幅度降低可能存在的安全隐患。目前,基于计算机视觉的吸烟检测主要是通过分析和识别烟雾,包括利用颜色、能量等烟雾静态特征或飘动方向等动态特征。相比于火灾产生的浓烟,吸烟烟雾的浓度相对低且范围相对小;在露天情况下,烟雾特征受光照、风向、风速等干扰,现有的技术难以提取到理想的烟雾特征进行吸烟行为识别。随着技术的不断进步,基于深度学习算法的视频数据智能分析正在快速发展,在人物脸部识别、人物位置预测等领域已经被大量应用。
技术实现思路
针对以上问题,本专利技术提出了一种基于双流 ...
【技术保护点】
1.一种基于双流卷积神经网络和SVM的抽烟动作识别方法,其特征在于,包括以下步骤:/nStep1原始数据准备/n针对常见场景下的人物抽烟行为,通过收集来自吸烟室监控摄像头及网络的视频数据,共收集抽烟视频数据1108条;/nStep2数据预处理/n(1)将大小、帧率各不相同的视频数据统一到相同大小和25帧率;/n(2)截取视频数据中关键的抽烟动作部分,将视频的时长控制在10s左右;/n(3)将每一个视频拆成视频帧,每一个视频随机抽取10张图片,组成图片数据集;/nStep3数据集制作/n针对Step2预处理后的数据进行人工分类,将人工分类信息作为网络训练的类别监督信息;随机选取增强后视频数据的60%作为训练数据,剩余的作为测试数据;随机选取图片数据集中的60%作为训练数据,其余的作为测试数据;/nStep4空域卷积网络的构建与训练/nStep4-1空域卷积网络的构建/n空间流卷积神经网络的输入是单个视频帧,它是一种通过提取静态图片信息来完成视频人物动作识别的深度学习模型;此处空间特征提取网络基于ZF网络构建,ZF是卷积神经网络“Convolutional Neural Networks, ...
【技术特征摘要】
1.一种基于双流卷积神经网络和SVM的抽烟动作识别方法,其特征在于,包括以下步骤:
Step1原始数据准备
针对常见场景下的人物抽烟行为,通过收集来自吸烟室监控摄像头及网络的视频数据,共收集抽烟视频数据1108条;
Step2数据预处理
(1)将大小、帧率各不相同的视频数据统一到相同大小和25帧率;
(2)截取视频数据中关键的抽烟动作部分,将视频的时长控制在10s左右;
(3)将每一个视频拆成视频帧,每一个视频随机抽取10张图片,组成图片数据集;
Step3数据集制作
针对Step2预处理后的数据进行人工分类,将人工分类信息作为网络训练的类别监督信息;随机选取增强后视频数据的60%作为训练数据,剩余的作为测试数据;随机选取图片数据集中的60%作为训练数据,其余的作为测试数据;
Step4空域卷积网络的构建与训练
Step4-1空域卷积网络的构建
空间流卷积神经网络的输入是单个视频帧,它是一种通过提取静态图片信息来完成视频人物动作识别的深度学习模型;此处空间特征提取网络基于ZF网络构建,ZF是卷积神经网络“ConvolutionalNeuralNetworks,CNN”的一种代表性网络,包括有卷积层、池化层、连接层和输出层,每层包含多个相互独立的神经单元;
ZF网络由5层深度的卷积层构成;前两层卷积核的大小分别为7*7和5*5,滑动步长“stride”均为2个像素,通过边界扩充“pad=2”保持输入输出维度不变,每层卷积后均进行窗口为3*3的最大池化“maxpooling”;后三层卷积的卷积核大小均为3*3,滑动步长均为1个像素,边界扩充1个像素;FC层表示一个全连接层,通过卷积核大小为1*1的卷积层实现,最后使用一个Softmax分类器来实现分类;
Step4-2空域卷积网络的训练
空域卷积网络的训练分为前向传播和后向传播两个部分;前向阶段:将抽烟图片数据集中选择批量数据输入网络,然后根据网络的数据流传播计算对应所属的实际动作种类;后向阶段:网络的实际输出与理想输出存在误差,对误差函数求各个偏置和权值的偏导数,从而使误差沿着降速最快的方向调整各个权值和偏置;
(1)前向训练
网络输出层的每一个神经元的输出值对应于输入视频属于各类危险动作的概率大小,表达式为如公式(4)所示:
其中,表示前一层的输出特征向量;Wij表示输入i到输出j的连接权值;bk表示输出层第k个输出的偏置;Yk表示输出层中第k个输出;f()表示非线性激励函数;
(2)反向训练
反向传播的目的是使误差达到最小,根据误差函数E来对权值参数w、偏置参数b的梯度进行调整;对于有M个输出类别和N个训练样本的多分类问题,使用的误差函数计算方法如公式(2)所示;
其中,表示第n个样本中第k类对应的分类标签;为网络输出层实际输出向量;
Step5时域卷积网络的构建与训练
Step5-1时域卷积网络的构建
此处时域卷积网络采用与空域卷积网络相同的ZF网络;
时域卷积网络的输入是基于视频数据计算和转换而来的灰度的光流图;光流信息是连续视频帧之间的像素点位移...
【专利技术属性】
技术研发人员:邓杨敏,李亨,吕继团,
申请(专利权)人:江苏德劭信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。