采用卷积神经网络的视频行为检测方法技术

技术编号:34601874 阅读:10 留言:0更新日期:2022-08-20 09:04
一种基于卷积神经网络的视频行为检测方法,步骤是先采集视频,然后对视频采用行为检测模型进行处理。所述行为检测模型的建立步骤包括:1)搭建PyTorch深度学习框架,用YOLOv5算法训练行为检测模型;2)修改YOLOv5网络:2.1)YOLOv5网络在完成特征提取后,进行多尺度的特征图构建特征金字塔:2.2)在YOLOv5网络加入可变形卷积网络:2.3)在YOLOv5网络的特征提取网络中加入注意力机制;3)训练网络;4)利用训练好的模型进行detect,从而得到检测网络模型。从而得到检测网络模型。从而得到检测网络模型。

【技术实现步骤摘要】
采用卷积神经网络的视频行为检测方法


[0001]本专利技术涉及人群计数
,具体涉及一种采用卷积神经网络的行为检测方法。

技术介绍

[0002]基于计算机视觉的人体行为识别,是在成功完成跟踪和特征提取的基础上来实现的,属于更高层次的视觉任务。
[0003]近些年,人体行为识别已经成为了计算机视觉领域的研究热点,其在视频监控、虚拟现实、人机智能交互、视频检索、医疗看护和运动分析等领域都有重大的研究意义,同时也具有很强的实用价值。
[0004]目前国内外对人体行为识别都投入了大量研究,也取得了一定进展,但是由于人体动作具有高度的复杂性和多变性,加上复杂的外界条件,使得行为识别的精确度和高效性并不能满足相关行业的要求,离实用化还有相当一段距离。近年来,研究人员提出了很多不同的方法进行人体行为识别,其中基于机器学习的方法受到越来越多的关注。

技术实现思路

[0005]本专利技术要解决的技术问题是提供一种基于卷积神经网络的视频行为检测方法,步骤是,先采集视频,然后对视频采用行为检测模型进行处理。所述行为检测模型的建立步骤包括:
[0006]1)搭建PyTorch深度学习框架,用YOLOv5算法训练行为检测模型;
[0007]2)修改YOLOv5网络:
[0008]2.1)YOLOv5网络在完成特征提取后,进行多尺度的特征图构建特征金字塔:先得到尺度最大的特征层即为第一特征层;然后进行一个上采样获得一个特征层;再使用route层获取一个倒数第二次下采样的卷积层;将两个中尺度的特征层混合得到第二特征层,以此类推,得到第三特征层和第四特征层;
[0009]2.2)在YOLOv5网络加入可变形卷积网络:
[0010]YOLOv5中的特征金字塔结构采用自下而上的方式进行特征融合,3个特征层的提取均与底层残差块的输出相关联,因此提高底层残差模块对特征图上不同大小感受野的适应能力能够在最大程度上提高模型的定位精度,使用可变形卷积替换了主干网络中第4个残差块(Residual Block4)部分的3
×
3卷积;
[0011]2.3)在YOLOv5网络的特征提取网络中加入注意力机制
[0012]3)训练网络;
[0013]4)利用训练好的模型进行detect,从而得到检测网络模型。
[0014]所述步骤1)中:首先,进行行人数据采集,采用旋转、翻转及随机裁剪等数据增广的方法扩大样本,每三十到六十帧截取一张图像;增强处理后的图像进入分类网络,经过多层卷积,提取图像特征信息,生成不同尺度的特征图,形成特征金字塔进入检测网络。
[0015]所述步骤2.3)中,将SENet通道注意力机制引入backbone中第二个卷积模块后,用于增强含有较大信息的通道特征,并对含有特征信息较少的通道进行抑制,改善对被遮挡、靠近群体等特征信息不明显目标的检测效果。
附图说明
[0016]图1是YOLOv5网络示意图;
[0017]图2是特征预测金字塔示意图;
[0018]图3是SE注意力模块示意图。
具体实施方式
[0019]下面结合附图与具体实施方式对本技术方案进行说明:
[0020]一种采用卷积神经网络的视频行为检测方法,先采集视频,然后对视频采用行为检测模型进行处理;所述行为检测模型的建立步骤包括:
[0021]1)搭建PyTorch深度学习框架,用YOLOv5算法训练行为检测模型,网络模型参考图1;
[0022]首先,进行行人数据采集,采用旋转、翻转及随机裁剪等数据增广的方法扩大样本,每三十到六十帧截取一张图像。增强处理后的图像进入分类网络,经过多层卷积,提取图像特征信息,生成不同尺度的特征图,形成特征金字塔进入检测网络。
[0023]2)修改YOLOv5网络:
[0024]2.1)参考图2,YOLOv5网络在完成特征提取后,进行多尺度的特征图构建特征金字塔:先得到尺度最大的特征层即为第一特征层;然后进行一个上采样获得一个特征层;再使用route层获取一个倒数第二次下采样的卷积层;将两个中尺度的特征层混合得到第二特征层,以此类推,得到第三特征层和第四特征层;
[0025]2.2)在YOLOv5网络加入可变形卷积网络:
[0026]YOLOv5中的特征金字塔结构采用自下而上的方式进行特征融合,3个特征层的提取均与底层残差块的输出相关联,因此提高底层残差模块对特征图上不同大小感受野的适应能力能够在最大程度上提高模型的定位精度,使用可变形卷积替换了主干网络中第4个残差块(Residual Block4)部分的3
×
3卷积;
[0027]本专利技术加入了可变形卷积网络,使得网络可以自适应的学习特征点的感受野,从而对不同尺寸和形状的目标提取更有效的特征,提高检测精度。
[0028](普通卷积),
[0029](可变形卷积)
[0030]Δp
n
为偏移矩阵。
[0031]2.3)参考图3,在YOLOv5网络的特征提取网络中加入注意力机制:
[0032]将SENet通道注意力机制引入backbone中第二个卷积模块后,用于增强含有较大信息的通道特征,并对含有特征信息较少的通道进行抑制,改善对被遮挡、靠近群体等特征信息不明显目标的检测效果;
[0033]3)训练网络;
[0034]4)利用训练好的模型进行detect,从而得到检测网络模型。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种采用卷积神经网络的视频行为检测方法,先采集视频,然后对视频采用行为检测模型进行处理;所述行为检测模型的建立步骤包括:1)搭建PyTorch深度学习框架,用YOLOv5算法训练行为检测模型;2)修改YOLOv5网络:2.1)YOLOv5网络在完成特征提取后,进行多尺度的特征图构建特征金字塔:先得到尺度最大的特征层即为第一特征层;然后进行一个上采样获得一个特征层;再使用route层获取一个倒数第二次下采样的卷积层;将两个中尺度的特征层混合得到第二特征层,以此类推,得到第三特征层和第四特征层;2.2)在YOLOv5网络加入可变形卷积网络:YOLOv5中的特征金字塔结构采用自下而上的方式进行特征融合,3个特征层的提取均与底层残差块的输出相关联;使用可变形卷积替换了主干网络中第4个残差块Residual Blo...

【专利技术属性】
技术研发人员:张修文
申请(专利权)人:苏州玖合智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1