当前位置: 首页 > 专利查询>江南大学专利>正文

一种基于轻量级时空联合网络的视频动作检测方法技术

技术编号:40204340 阅读:17 留言:0更新日期:2024-02-02 22:16
本发明专利技术公开了一种基于轻量级时空联合网络的视频动作检测方法,属于视频行为识别技术领域。本发明专利技术使用3D骨干网络和2D骨干网络来分别提取时序信息上的空间特征和时序特征,并通过将卷积与自注意力机制深度融合从而设计得到的轻量级时空特征融合模块来进一步充分融合并提取时空上的特征;此外使用仅含有2D卷积的时空平移模块TSM作为时空特征提取模块的骨干分支。本发明专利技术的YOWOv3模型不仅能够比最新的高效时空动作检测模型更加轻量,且精度也达到了同量级中的最佳表现;进一步优化而来的YOWOv3‑TSM不仅降低了训练的难度,并且在精度与速度上同时保持着优异的表现,在视频动作检测上取得了最佳的精度与速度的平衡。

【技术实现步骤摘要】

本专利技术涉及一种基于轻量级时空联合网络的视频动作检测方法,属于视频行为识别。


技术介绍

1、时空动作检测在安防监控、驾驶员或乘客行为识别、短视频审核等具有广泛的应用前景。时空动作检测相较于普通的视觉目标检测,除了对动作主体的检测以外,还在于对动作主体的行为分析,这需要时序上信息的帮助才能理解目标主体的具体行为,如开门关门动作,仅凭借单帧画面信息无法帮助我们完成对行为主体的行为分类,因此这还需要我们对时序特征进行提取,然而一旦引入了时序特征提取网络,模型往往变得臃肿不堪,造成难以部署和直接使用。

2、chen s等人提出了一个名为“watch once only(woo)”的端到端视频动作检测框架,采用一个统一的视频骨干来同时提取动作的位置和动作分类的特征(chen s,sun p,xie e,et al.watch only once:an end-to-end video action detection framework[c].proceedings of the ieee/cvf international conference on本文档来自技高网...

【技术保护点】

1.一种视频动作检测方法,其特征在于,所述视频动作检测方法包括:构建轻量级的时空动作检测深度神经网络,具体按照以下步骤实施:

2.根据权利要求1所述的视频动作检测方法,其特征在于,所述时空特征提取网络使用3D-ShuffleNetV2网络,构建方法包括:将轻量级网络ShuffleNetV2通过扩展膨胀的方式到三维,将2D卷积转化为3D卷积,将2D池化转化为3D池化;同时为了避免部分设备存在不支持3D卷积操作的风险,使用仅含有2D卷积的时空平移模块TSM作为时空特征提取模块的骨干分支。

3.根据权利要求1所述的视频动作检测方法,其特征在于,所述步骤5包括:

<...

【技术特征摘要】

1.一种视频动作检测方法,其特征在于,所述视频动作检测方法包括:构建轻量级的时空动作检测深度神经网络,具体按照以下步骤实施:

2.根据权利要求1所述的视频动作检测方法,其特征在于,所述时空特征提取网络使用3d-shufflenetv2网络,构建方法包括:将轻量级网络shufflenetv2通过扩展膨胀的方式到三维,将2d卷积转化为3d卷积,将2d池化转化为3d池化;同时为了避免部分设备存在不支持3d卷积操作的风险,使用仅含有2d卷积的时空平移模块tsm作为时空特征提取模块的骨干分支。

3.根据权利要求1所述的视频动作检测方法,其特征在于,所述步骤5包括:

4.根据权利要求3所述的视频动作检测方法,其特征在于,所述步骤5.1中的两个标准的3x3卷积为cbr模块。

5.根据权利要求3所述的视频动作检测方法,其特征在于,所述步骤5.2的自注意力机制计算中,通过对窗...

【专利技术属性】
技术研发人员:王映辉祝安磊
申请(专利权)人:江南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1