用于动作识别的动作结构自注意力图卷积网络制造技术

技术编号：27777629 阅读：41 留言：0更新日期：2021-03-23 13:25

本申请描述了使用图卷积网络(GCN)来识别人体动作的方法、设备和非暂时性计算机可读存储介质。该方法包括通过设备获得多个关节点姿态。该设备包括存储有指令的存储器和与该存储器通信的处理器。该方法还包括：通过该设备对多个关节点姿态进行归一化以获得多个归一化的关节点姿态；通过该设备使用改进的时空图卷积网络(ST‑GCN)从多个归一化的关节点姿态中提取多个粗略特征；通过该设备降低多个粗略特征的特征维度以获得多个降维的特征；通过该设备基于自注意力模型对多个降维的特征进行优化，以获得多个优化特征；进而通过该设备根据多个优化特征来识别人体动作。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于动作识别的动作结构自注意力图卷积网络
本专利技术涉及用于人体动作识别的图卷积网络(graphconvolutionalnetwork，GCN)，特别涉及具有自注意力模型(self-attentionmodel)的改进的时空图卷积网络。
技术介绍
近年来，由于人体动作(humanaction)识别在视频理解中起着重要作用，因此得到了积极的发展。通常，可以从外观、深度、光流、身体等多种模态中识别出人的动作。在这些模态中，动态的人体骨骼通常传达出重要信息，与其他模态形成互补。然而，传统的骨骼建模方法通常依赖于手工制作的特征或遍历规则，因此导致表达力有限，难以推广和/或应用。现有的通过骨骼建模来识别人体动作的方法存在许多问题和难题，例如但不限于识别效率低、识别速度慢和/或识别精度低。本申请描述了使用动作结构自注意力图卷积网络(GCN)来识别人体动作的方法、设备、系统和存储介质，其可以克服上述讨论的一些挑战和缺点，改善整体性能，提高识别速度，而不牺牲识别精度。
技术实现思路
本申请的实施例包括用于识别一个或多个动作的动作结构自注意力图卷积网络(GCN)系统的方法、设备和计算机可读介质。本申请描述了一种使用图卷积网络(GCN)识别人体动作的方法。该方法包括通过设备获得多个关节点姿态。该设备包括存储指令的存储器和与该存储器通信的处理器。该方法还包括通过该设备对多个关节点姿态进行归一化处理以获得多个归一化的关节点姿态；通过该设备使用改进的时空图卷积网络(spatial-temporal...

【技术保护点】
1.一种使用图卷积网络(GCN)识别人体动作的方法，该方法包括：/n通过设备获得多个关节点姿态，所述设备包括存储有指令的存储器和与所述存储器通信的处理器；/n通过所述设备对所述多个关节点姿态进行归一化处理，以获得多个归一化的关节点姿态；/n通过所述设备使用改进的时空图卷积网络(ST-GCN)从所述多个归一化的关节点姿态中提取多个粗略特征；/n通过所述设备降低所述多个粗略特征的特征维度，以获得多个降维的特征；/n通过所述设备基于自注意力模型对所述多个降维的特征进行优化，以获得多个优化特征；/n通过所述设备根据所述多个优化特征，识别人体动作。/n

【技术特征摘要】
【国外来华专利技术】20201029 US 17/083,7381.一种使用图卷积网络(GCN)识别人体动作的方法，该方法包括：
通过设备获得多个关节点姿态，所述设备包括存储有指令的存储器和与所述存储器通信的处理器；
通过所述设备对所述多个关节点姿态进行归一化处理，以获得多个归一化的关节点姿态；
通过所述设备使用改进的时空图卷积网络(ST-GCN)从所述多个归一化的关节点姿态中提取多个粗略特征；
通过所述设备降低所述多个粗略特征的特征维度，以获得多个降维的特征；
通过所述设备基于自注意力模型对所述多个降维的特征进行优化，以获得多个优化特征；
通过所述设备根据所述多个优化特征，识别人体动作。

2.根据权利要求1所述的方法，其中通过所述设备对所述多个关节点姿态进行归一化处理以获得所述多个归一化的关节点姿态包括：
通过所述设备获得所述多个关节点姿态中的每个关节点姿态的躯干长度；
通过所述设备根据所述获得的躯干长度，对所述多个关节点姿态中的每个关节点姿态进行归一化处理，以获得所述多个归一化的关节点姿态。

3.根据权利要求1所述的方法，其中：所述改进的ST-GCN比标准ST-GCN包含更少的时空图卷积模块。

4.根据权利要求3所述的方法，其中：所述改进的ST-GCN包含7个时空图卷积模块。

5.根据权利要求1所述的方法，其中通过所述设备降低所述多个粗略特征的特征维度以获得所述多个降维的特征包括：
通过所述设备对所述多个粗略特征进行卷积，以降低所述多个粗略特征的特征维度，获得与多个关键关节相关联的所述多个降维的特征。

6.根据权利要求5所述的方法，其中：所述自注意力模型包括变形编码器，所述变形编码器包括预定数量的多头注意层和前馈层。

7.根据权利要求1所述的方法，其中通过所述设备根据所述多个优化特征，识别人体动作，包括：
通过所述设备从基于所述多个优化特征的softmax函数中生成多个概率值；
通过所述设备根据所述多个概率值，预测所述人体动作。

8.一种使用图卷积网络(GCN)识别人体动作的设备，该设备包括：
存储有指令的存储器；
与所述存储器通信的处理器，其中，当所述处理器执行所述指令时，所述处理器被配置为使所述设备：
获得多个关节点姿态；
归一化所述多个关节点姿态，以获得多个归一化的关节点姿态；
使用改进的时空图卷积网络(ST-GCN)从所述多个归一化的关节点姿态中提取多个粗略特征；
降低所述多个粗略特征的特征维度以获得多个降维的特征；
基于自注意力模型，优化所述多个降维的特征，得到多个优化特征；
根据所述多个优化特征，识别人体动作。

9.根据权利要求8所述的设备，其中，当所述处理器被配置为使所述设备对所述多个关节点姿态进行归一化以获得所述多个归一化的关节点姿态时，所述处理器被配置为使所述设备：
获得所述多个关节点姿态中的每个关节点姿态的躯干长度；
根据所述获得的躯干长度对所述多个关节点姿态中的每...

【专利技术属性】
技术研发人员：李海良，刘扬，李文迪，雷志斌，
申请(专利权)人：香港应用科技研究院有限公司，
类型：发明
国别省市：中国香港;81

全部详细技术资料下载我是这个专利的主人