当前位置: 首页 > 专利查询>湘潭大学专利>正文

基于分离时空关系的群体行为识别方法、设备和介质技术

技术编号:41881608 阅读:25 留言:0更新日期:2024-07-02 00:35
本发明专利技术公开了一种基于分离时空关系的群体行为识别方法、设备和介质,本发明专利技术将排球数据集和群体行为数据集作为网络的训练样本,采用了图像预处理操作能够防止模型过拟合,同时提高模型的适应能力;针对分离并增强后的时空特征,采用了包含多头自注意力层的时空关系聚合模块,使源于同一个特征的不同维度的特征重新融合,充分发挥了自注意力机制的强大性能,使不同维度的特征充分弥补,以增强群体行为识别能力。

【技术实现步骤摘要】

本专利技术属于深度学习及机器视觉领域,具体涉及一种分离时空关系的群体行为识别方法。


技术介绍

1、群体行为识别是一个计算机视觉领域中的一个重要研究方向,在体育赛事分析、监控和社会行为理解有很多实际应用。要学习群体行为场景,模型不仅需要理解上下文中每个人的个体动作,还需要学习整个群体的活动。

2、如今的群体行为识别首先由卷积神经网络提取,然后这些方法通过一个全局机制来整合这些特征来获取群体特征。hirf提出建模人物变量的层次依赖性进行推理高阶群体行为特征。hrn提出了群体行为识别模型,该方法利用cnn对群体行为中的个体进行初始表征,然后通过多个关系层网络来学习个体行为的关系图以识别群体行为。可看出想要专注于提高网络中个人特征之间的相关关系对于群体行为识别至关重要。然而,侧重于群体的时间与空间关系建模更合理并更具有挑战性,为了解决这一问题,很多方法根据任务的位置更加明确地模拟了这些空间与时间的关系。din提出动态关系模块和动态游走模块组成的动态推理网络推理特定人的时空信息预测,dual-ai通过一个双路径人物交互框架灵活互补两条时空路径增强人物交互本文档来自技高网...

【技术保护点】

1.一种基于分离时空关系的群体行为识别方法、设备和介质,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述的步骤1中,主干网络是基于现有的Backbone主干网络构成。

3.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系分离模块包括:

4.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系聚合模块包括:

5.根据权利要求4所述的方法,其特征在于:所述多头注意力层与多头交叉注意力层具体操作是将输入张量与三个线性投影矩阵相乘分别记为Q,K,V,将Q与K相乘后softmax操作,再与其他张量的V...

【技术特征摘要】

1.一种基于分离时空关系的群体行为识别方法、设备和介质,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述的步骤1中,主干网络是基于现有的backbone主干网络构成。

3.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系分离模块包括:

4.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系聚合模块包括:

5.根据权利要求4所述的方法,其特征在于:所述多头注意力层与多头交叉注意力层具体操作是将输入张量与三个线性投影矩阵相乘分别记为q,k,v,将q与k相乘后softmax操作,再...

【专利技术属性】
技术研发人员:王冬丽王中元周彦郑席红
申请(专利权)人:湘潭大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1