当前位置: 首页 > 专利查询>复旦大学专利>正文

基于自适应图网络的行人动作检测方法及装置制造方法及图纸

技术编号:28560243 阅读:35 留言:0更新日期:2021-05-25 17:55
本发明专利技术提供了一种基于自适应图网络的行人动作检测方法,属于机器学习领域,用于对无裁切视频进行视频的动作定位以及动作分类,其特征在于,包括如下步骤:步骤S1,从原始的无裁切视频中提取多个视频特征;步骤S2,根据步骤S1中获得的多个视频特征生成无裁切视频的多个视频提名;步骤S3,根据无裁切视频的多个视频特征以及多个视频提名建立自适应图神经网络模型;步骤S4,将包含多个训练视频的训练集输入步骤S3中的自适应图神经网络模型进行训练,得到训练完成的自适应图神经网络模型;步骤S5,根据新输入的无裁切视频的视频特征以及视频提名,利用训练完成的自适应图神经网络模型的得到动作定位以及动作分类。

【技术实现步骤摘要】
基于自适应图网络的行人动作检测方法及装置
本专利技术属于机器学习领域,涉及视频动作检测
,具体涉及基于图神经网络多阶段视频动作检测分类方法。
技术介绍
随着网络、互联网技术的迅速发展,计算机视觉动作检测技术在当今互联网已经是非常重要的信息文化内容载体,并且视频的数量在近几年呈现爆发式的增长,因此对视频内容的分析理解技术至关重要。未裁切的视频通常包含很多无用的背景视频段、多个动作实例片段,且动作发生的起始位置、动作类别标签都是未知的。视频动作检测方法是能够识别出未裁切视频中多个动作实例的类别标签以及对多个动作的起止位置进行定位的方法。基于深度学习的视频动作检测是目前视频内容分析理解的重要研究方向。为了处理无裁切的视频,视频动作定位算法不仅要求对视频的动作片段进行定位,更要对动作进行具体分类。目前来看,视频时序动作定位分类主要分为一阶算法以及多阶算法。一阶算法是基于已经生成的整段视频的特征,通过神经网络模型在提取出一系列的动作提名后,对提名进行筛选分析进而得到准确的视频动作的定位以及分类。多阶算法则是基于已经生成的整段视频特征本文档来自技高网...

【技术保护点】
1.一种基于自适应图网络的行人动作检测方法,用于对无裁切视频进行视频的动作定位以及动作分类,其特征在于,包括如下步骤:/n步骤S1,从原始的所述无裁切视频中提取多个视频特征;/n步骤S2,根据所述步骤S1中获得的多个所述视频特征生成所述无裁切视频的多个视频提名;/n步骤S3,根据所述无裁切视频的多个所述视频特征以及多个所述视频提名建立自适应图神经网络模型;/n步骤S4,将包含多个训练视频的训练集输入步骤S3中的所述自适应图神经网络模型进行训练,得到训练完成的自适应图神经网络模型;/n步骤S5,根据新输入的所述无裁切视频的所述视频特征以及所述视频提名,利用训练完成的所述自适应图神经网络模型的得到...

【技术特征摘要】
1.一种基于自适应图网络的行人动作检测方法,用于对无裁切视频进行视频的动作定位以及动作分类,其特征在于,包括如下步骤:
步骤S1,从原始的所述无裁切视频中提取多个视频特征;
步骤S2,根据所述步骤S1中获得的多个所述视频特征生成所述无裁切视频的多个视频提名;
步骤S3,根据所述无裁切视频的多个所述视频特征以及多个所述视频提名建立自适应图神经网络模型;
步骤S4,将包含多个训练视频的训练集输入步骤S3中的所述自适应图神经网络模型进行训练,得到训练完成的自适应图神经网络模型;
步骤S5,根据新输入的所述无裁切视频的所述视频特征以及所述视频提名,利用训练完成的所述自适应图神经网络模型的得到所述动作定位以及所述动作分类,
其中,所述自适应图神经网络模型在训练过程中自适应地改变所述视频提名之间的联系。


2.根据权利要求1所述的基于自适应图网络的行人动作检测方法,其特征在于,步骤S3具体包括:
步骤S3-1,建立包括固定邻接矩阵的无向图,所述固定邻接矩阵将所述视频提名作为图节点,将所述视频提名之间的所述联系作为图边;
步骤S3-2,在所述无向图中建立一个初始值为0的邻接矩阵作为自适应邻接矩阵,自适应地改变所述无向图的拓扑结构;
步骤S3-3,对所述无向图的所述图节点进行图卷积,更新所述图节点,建立所述自适应图神经网络模型。


3.根据权利要求2所述的基于自适应图网络的行人动作检测方法,其特征在于:
其中,步骤S3-1中,采用SAGE方法在步骤S2中所有的所述视频提名中进行采样,均匀采样得到多个所述视频提名作为所述图节点。


4.根据权利要求1所述的基于自适应图网络的行人动作检测方法,其特征在于,步骤S1包括如下步骤:
步骤S1-1,用户向计算机输入所述无裁切视频,所述计算机按照一定的帧率将所述无裁切视频导出为视频帧图片;
步骤S1-2,取一定张数的所述步骤S1-1中得到的所述视频帧图片,通过TVL1算法的计算得到视频光流特征,并将所述视频帧图片输入I3D网络得到RGB视频特征,所述视频特征即为所述视频光流特征以及所述RGB视频特征。


5.根据权利要求1所述的基于自适应图网络的行人动作检测方法,其特征在于,所述步骤S2包括如下步骤...

【专利技术属性】
技术研发人员:李帅成冯瑞
申请(专利权)人:复旦大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1