【技术实现步骤摘要】
本专利技术属于深度学习及机器视觉领域,具体涉及一种分离时空关系的群体行为识别方法。
技术介绍
1、群体行为识别是一个计算机视觉领域中的一个重要研究方向,在体育赛事分析、监控和社会行为理解有很多实际应用。要学习群体行为场景,模型不仅需要理解上下文中每个人的个体动作,还需要学习整个群体的活动。
2、如今的群体行为识别首先由卷积神经网络提取,然后这些方法通过一个全局机制来整合这些特征来获取群体特征。hirf提出建模人物变量的层次依赖性进行推理高阶群体行为特征。hrn提出了群体行为识别模型,该方法利用cnn对群体行为中的个体进行初始表征,然后通过多个关系层网络来学习个体行为的关系图以识别群体行为。可看出想要专注于提高网络中个人特征之间的相关关系对于群体行为识别至关重要。然而,侧重于群体的时间与空间关系建模更合理并更具有挑战性,为了解决这一问题,很多方法根据任务的位置更加明确地模拟了这些空间与时间的关系。din提出动态关系模块和动态游走模块组成的动态推理网络推理特定人的时空信息预测,dual-ai通过一个双路径人物交互框架灵活互补两条
...【技术保护点】
1.一种基于分离时空关系的群体行为识别方法、设备和介质,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述的步骤1中,主干网络是基于现有的Backbone主干网络构成。
3.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系分离模块包括:
4.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系聚合模块包括:
5.根据权利要求4所述的方法,其特征在于:所述多头注意力层与多头交叉注意力层具体操作是将输入张量与三个线性投影矩阵相乘分别记为Q,K,V,将Q与K相乘后softmax操
...【技术特征摘要】
1.一种基于分离时空关系的群体行为识别方法、设备和介质,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述的步骤1中,主干网络是基于现有的backbone主干网络构成。
3.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系分离模块包括:
4.根据权利要求1所述的方法,其特征在于:所述的步骤1中,时空关系聚合模块包括:
5.根据权利要求4所述的方法,其特征在于:所述多头注意力层与多头交叉注意力层具体操作是将输入张量与三个线性投影矩阵相乘分别记为q,k,v,将q与k相乘后softmax操作,再...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。