【技术实现步骤摘要】
基于全局信息的端到端的anchor
‑
free时序动作检测方法
[0001]本申请属于视频理解领域,使用更加灵活的anchor
‑
free方法完成时序动作检测任务,提高网络模型的效率。
技术介绍
[0002]随着网络和多媒体技术的飞速发展,视频成为最重要的数据格式,并以指数级的速度增长。因此,分析和理解视频内容就变得越来越重要。时序动作检测是一个重要并且具有挑战性的视频理解任务。此任务旨在推理未修剪的长视频中动作实例的开始,结束位置和动作类别。此任务为众多视频理解的下游任务提供了数据支持,因此时序动作检测已广泛应用于智能视频监控和家庭环境监控、视频存储和检索、智能驾驶和运动分析等应用中。
[0003]目前时序动作检测的方法分为两类——anchor
‑
base和anchor
‑
free两种。虽然anchor
‑
base类的方法是更精确的,但是这类方法严重依赖预定义anchor的大小和数量并且会产生大量冗余的anchor。例如,对于 ...
【技术保护点】
【技术特征摘要】
1.基于全局信息的端到端anchor
‑
free的时序动作检测方法,其特征在于,包括:使用视频数据集kinetics对backbone网络进行预训练,充分利用预训练模型的优势。并构建特征金字塔网络和自注意力模块,通过该部分网络模块生成带有全局信息的视频特征。2.如权利要求1所述的方法,其特征在于,建立并训练用以生成proposal的网络模型,具体包括:构建anchor
‑
fr...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。