基于神经网络的动作检测制造技术

技术编号：18019183 阅读：71 留言：0更新日期：2018-05-23 05:19

本公开的各种实现涉及基于神经网络的动作检测。提出了一种使用神经网络的动作检测方案。该动作检测方案可以基于不同帧各自的重要性来设计和优化神经网络模型，使得较高的权重倾向于被分配给对动作识别而言重要性较高或判别性较高的帧，较低的权重倾向于被分配给对动作识别而言重要性较低或判别性较低的帧。

全部详细技术资料下载

【技术实现步骤摘要】
基于神经网络的动作检测
技术介绍
检测诸如人类、机器人、动物或者其他移动对象等各种实体的动作或者活动，在很多领域具有重要的应用价值。这样的领域包括但不限于监控、卫生保健、人机交互、智能机器人导航、计算机游戏，等等。动作检测通常依赖于被称为“动作分类器”的训练模型。这样的模型可以利用与一个或多个移动的动作有关的视频来训练。一旦被训练，该模型可以被用于处理输入视频以便确定是否发生特定的动作。尽管付出了很大努力，但是基于模型的实体动作检测仍然是一项富有挑战的任务。期望进一步提升动作识别的性能以将其投入各种应用中。具体地，在快速有效识别关键特征，提升动作识别的精度以及减少模型训练的复杂度等方面存在改进的空间和需求。
技术实现思路
根据本公开的实现，提出了一种使用神经网络的动作检测方案。该动作检测方案基于视频或视频片段中的不同的帧对分类结果的判别性具有不同的影响。由此，可以考虑视频或视频片段的不同帧的不同的重要性(也称“注意力”)，使得神经网络模型倾向于分配较高的权重给对动作识别而言重要性较高或判别性较高的帧，分配较低的权重给对动作识别而言重要性较低或判别性较低的帧。相似地，一个视频帧中，不同区域(例如，在骨架表示中也可以称为“关节点”)有不同的重要性，使得神经网络模型倾向于分配较高的权重给对动作识别而言重要性较高或判别性较高的区域，分配较低的权重给对动作识别而言重要性较低或判别性较低的区域。提供
技术实现思路
部分是为了简化的形式来介绍对概念的选择，它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识要求保护的主题的关键特征或主要特征，也无意限制要求保护的主题的范...
基于神经网络的动作检测

【技术保护点】
一种设备，包括：处理单元；存储器，耦合至所述处理单元并且包含存储于其上的指令，所述指令在由所述处理单元执行时使所述设备执行以下动作：获取视频的多个帧的表示信息和针对所述视频的预定义动作标签，所述表示信息表示所述多个帧中的实体并且所述预定义动作标签与所述实体的动作相关联；以及基于所述多个帧的所述表示信息和所述预定义动作标签来更新学习网络，所述学习网络包括第一子网络，更新所述学习网络包括：使所述第一子网络基于所述表示信息确定所述多个帧的重要性；以及使所述学习网络基于所述表示信息和所述多个帧的重要性确定所述视频与预定义动作标签相关联的概率。

【技术特征摘要】
1.一种设备，包括：处理单元；存储器，耦合至所述处理单元并且包含存储于其上的指令，所述指令在由所述处理单元执行时使所述设备执行以下动作：获取视频的多个帧的表示信息和针对所述视频的预定义动作标签，所述表示信息表示所述多个帧中的实体并且所述预定义动作标签与所述实体的动作相关联；以及基于所述多个帧的所述表示信息和所述预定义动作标签来更新学习网络，所述学习网络包括第一子网络，更新所述学习网络包括：使所述第一子网络基于所述表示信息确定所述多个帧的重要性；以及使所述学习网络基于所述表示信息和所述多个帧的重要性确定所述视频与预定义动作标签相关联的概率。2.根据权利要求1所述的设备，其中所述动作还包括：使所述第一子网络接收针对所述多个帧中的第一帧和在所述第一帧之前的第二帧的所述表示信息，并且基于非线性函数确定所述第一帧的重要性。3.根据权利要求1所述的设备，其中所述学习网络还包括第二子网络，并且所述动作还包括：使所述第二子网络基于所述表示信息确定所述多个帧中的多个预定部分或多个预定关注点的重要性。4.根据权利要求3所述的设备，其中所述动作还包括：使所述第二子网络接收针对所述多个帧中的第一帧和在所述第一帧之前的第二帧的所述表示信息，并且基于非线性函数确定所述第一帧中的所述多个预定部分或所述多个预定关注点的重要性。5.根据权利要求1所述的设备，其中更新所述学习网络包括：基于由所述学习网络输出的动作标签的概率和由所述第一子网络确定的重要性，更新所述学习网络使得目标量最小化，所述目标量限制由所述第一子网络所确定的重要性的值的增加。6.根据权利要求3所述的设备，其中更新所述学习网络包括：基于由所述学习网络输出的动作标签的概率和由所述第二子网络确定的重要性，更新所述学习网络使得目标量最小化，所述目标量促使由所述第二子网络所确定的重要性平均分布于所述多个帧中的所述多个部分或所述多个关注点。7.根据权利要求3所述的设备，其中所述学习网络包括主网络，所述主网络的输入与所述第二子网络的输出耦合，所述主网络的输出与所述第一子网络的输出耦合，并且更新所述学习网络包括：在固定所述第一子网络和所述第二子网络中的第一类型子网络的参数的情况下，更新所述第一子网络和所述第二子网络中的第二类型子网络的参数和所述主网络的参数，所述第一类型不同于所述第二类型；在固定所述第一子网络和所述第二子网络中的所述第二类型子网络的参数的情况下，更新所述第一子网络和所述第二子网络中的所述第一类型子网络的参数和所述主网络的参数；在固定所述第一子网络和所述第二子网络的参数的情况下，更新所述主网络的参数；以及联合更新所述学习网络的参数。8.根据权利要求7所述的设备，其中更新所述第一子网络和所述第二子网络中的第二类型子网络的参数和所述主网络的参数包括：在固定所述第一子网络和所述第二子网络中的第一类型子网络的参数的情况下，更新所述第二类型子网络的参数和简化的所述主网络的参数；在固定经更新的所述第二类型子网络的参数的情况下，更新所述主网络的参数；以及联合更新所述第二类型子网络和所述主网络的参数。9.根据权利要求...

【专利技术属性】
技术研发人员：兰翠玲，曾文军，宋思捷，兴军亮，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：美国,US

全部详细技术资料下载我是这个专利的主人