基于全局信息的端到端的anchor-free时序动作检测方法技术

技术编号:37472401 阅读:38 留言:0更新日期:2023-05-06 09:55
时序动作检测是一个重要并且具有挑战性的视频理解任务。此任务旨在推理未修剪的长视频中动作实例的开始,结束位置和动作类别。目前表现优异的模型大多数是anchor

【技术实现步骤摘要】
基于全局信息的端到端的anchor

free时序动作检测方法


[0001]本申请属于视频理解领域,使用更加灵活的anchor

free方法完成时序动作检测任务,提高网络模型的效率。

技术介绍

[0002]随着网络和多媒体技术的飞速发展,视频成为最重要的数据格式,并以指数级的速度增长。因此,分析和理解视频内容就变得越来越重要。时序动作检测是一个重要并且具有挑战性的视频理解任务。此任务旨在推理未修剪的长视频中动作实例的开始,结束位置和动作类别。此任务为众多视频理解的下游任务提供了数据支持,因此时序动作检测已广泛应用于智能视频监控和家庭环境监控、视频存储和检索、智能驾驶和运动分析等应用中。
[0003]目前时序动作检测的方法分为两类——anchor

base和anchor

free两种。虽然anchor

base类的方法是更精确的,但是这类方法严重依赖预定义anchor的大小和数量并且会产生大量冗余的anchor。例如,对于预定义anchor的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于全局信息的端到端anchor

free的时序动作检测方法,其特征在于,包括:使用视频数据集kinetics对backbone网络进行预训练,充分利用预训练模型的优势。并构建特征金字塔网络和自注意力模块,通过该部分网络模块生成带有全局信息的视频特征。2.如权利要求1所述的方法,其特征在于,建立并训练用以生成proposal的网络模型,具体包括:构建anchor

fr...

【专利技术属性】
技术研发人员:黄先开蔡志彬王晓川
申请(专利权)人:北京工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1