当前位置: 首页 > 专利查询>北京大学专利>正文

一种基于夏普利值引导数据混合的长尾骨架动作识别方法技术

技术编号:43468280 阅读:12 留言:0更新日期:2024-11-27 13:05
本发明专利技术公开了一种基于夏普利值引导数据混合的长尾骨架动作识别方法,属于动作识别领域和长尾学习领域。本发明专利技术通过夏普利值计算人体骨架数据中不同关节部位的显著性,裁剪尾部类别的显著性运动区域,进行数据混合增强。本发明专利技术解决了长尾分布下骨架动作识别准确率低的问题,扩充了尾部类别的数据样本,促进了尾部类别的决策边界学习。本发明专利技术通过在线动量更新显著性估计结果,生成更具表示性的混合数据,并采用长尾学习的重加权损失对模型进行优化训练,显著提升了尾部类别的识别效果和模型的泛化能力。

【技术实现步骤摘要】

本专利技术属于动作识别领域和长尾学习领域,具体设计一种基于夏普利值(shapleyvalue)引导数据混合的长尾骨架动作识别方法。


技术介绍

1、基于人体骨架的动作识别是指利用人体各个关节的三维坐标数据来推断和分类不同动作的技术。过去,研究主要集中在利用循环神经网络(rnn)和卷积神经网络(cnn)对骨架数据进行建模,将其视为时间序列或伪二维图像。然而,随着对人体结构拓扑关系的深入理解,基于图卷积神经网络(gcn)的方法开始受到关注,并取得了显著的性能提升。gcn能够有效地捕捉骨架数据中节点之间的关系,从而更好地理解动作的结构和上下文信息。近年来,基于transformer的模型也在动作识别领域展现出了潜力。transformer模型通过引入自注意力机制,能够捕捉骨架序列中的长期依赖关系,从而提高了动作识别的准确性和性能。

2、长尾学习是指在数据集中存在严重不平衡的情况下,使得模型学习到一个良好的表征空间,尤其是对与数量稀少的尾部类别。该场景下的困难点在于长尾分布下,模型往往倾向于更多地学习到出现频率高的类别,而对于出现频率低的类别学习不足,导本文档来自技高网...

【技术保护点】

1.一种基于夏普利值引导数据混合的长尾骨架动作识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,模型采用通道感知的卷积神经网络模型CTR-GCN。

3.如权利要求1所述的方法,其特征在于,显著性分数的计算式如下:

4.如权利要求1或3所述的方法,其特征在于,模型进行每轮迭代,随机挑选一个身体部位组合b并估计显著性分数然后以滑动指数平均的方式更新显著性估计列表中的显著性分数。

5.如权利要求1所述的方法,其特征在于,基于该显著性分数进行采样的步骤包括:

6.如权利要求1所述的方法,其特征在于,交叉熵损失...

【技术特征摘要】

1.一种基于夏普利值引导数据混合的长尾骨架动作识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,模型采用通道感知的卷积神经网络模型ctr-gcn。

3.如权利要求1所述的方法,其特征在于,显著性分数的计算式如下:

4.如权利要求1或3所述的方法,其特征在于,模型进行每轮迭代,随机挑选一个身体部位组合b并估计显著性分数然后以滑动指数平均的方式更...

【专利技术属性】
技术研发人员:刘家瑛张佳航林里浪
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1