基于过去完成度和未来趋势的自监督三维动作预测方法技术

技术编号：38012346 阅读：19 留言：0更新日期：2023-06-30 10:34

基于过去完成度和未来趋势的自监督三维动作预测方法，属于计算机视觉领域。首先提出动作完成度感知任务和运动预测任务，以监督模型学习包含动作状态信息和趋势信息的特征表示。并且设计一个多任务自监督学习框架，引入对比学习辅助任务提取关于动作的高阶语义特征，在不需要人工标签的前提下，融合多项自监督任务损失引导网络学习具有判别性的动作特征。最后在此基础上提出一个完整动作序列生成模块，充分利用自监督训练的动作完成度感知器和运动预测器，从不完整序列生成对应的完整序列，补全序列中缺失的信息，融合部分预测和全局预测得到最终预测，有效提高动作预测的精度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
基于过去完成度和未来趋势的自监督三维动作预测方法

[0001]本专利技术属于计算机视觉领域，主要针对三维动作预测方法，尤其是涉及一种基于过去完成度和未来趋势的自监督三维动作预测方法。

技术介绍

[0002]基于骨架的三维动作预测是智能行为理解领域的重要研究课题之一，它可以在动作完全发生之前预测出动作的类别，随着深度传感器的普及和姿态估计算法的发展，它在智能安防等应用场景中发挥着越来越重要的作用。在大数据时代，互联网上存在着海量的视频数据，应用姿态估计算法可以轻易得到对应的骨架数据，如何在无需人工标注的前提下利用大量未经处理的骨架序列训练深度神经网络进行动作预测，是三维视觉领域迫切待解决的研究问题。
[0003]三维动作预测在动作执行的过程中就能预测出动作类别，具有广泛的实用价值，但也面临着以下问题：1)同一动作在不同观察率下具有不同的特征完整性；2)同一动作在不同视角下具有不同的外观表现；3)同一类别的动作，由不同主体执行时具有持续时间和运动速率上的差异性；4)不同种类的动作在动作执行的早期阶段可能会有相似性；5)由于动作序列的不完整，往往会缺失一些判别性信息；6)不同动作由于视角的变换可能具有相似的外观表现。
[0004]目前，关于三维动作预测的研究才刚刚起步，很少有研究去考虑这些难点，且都集中在有监督学习的框架下，需要大量的人工标签。现有的有监督三维动作预测方法都是在训练时采用各种策略，如使用软标签或与观察率相关的损失来防止拟合，使用正则化或对抗学习迫使网络学习隐含的全局信息，存储难以区分的实例对...

【技术保护点】

【技术特征摘要】
1.基于过去完成度和未来趋势的自监督三维动作预测方法，其特征包括以下步骤：1)预处理三维骨架序列数据集，生成三维动作预测数据集；2)设计动作完成度感知任务和运动预测任务监督模型训练，监督模型提取不完整动作序列中的过去完成度信息和未来趋势信息；3)设计对比学习辅助任务，监督模型提取不完整动作序列中的高阶语义信息，优化特征空间，并设计多任务自监督学习框架，进一步增强模型的鲁棒性；4)设计基于完整序列生成模块的三维动作预测网络，在不引入额外参数的前提下生成完整序列，补全缺失信息，并融合部分预测和全局预测得到最终预测；5)在三维动作预测数据集上，计算多任务自监督学习框架中的各项损失和，通过反向传播算法和随机梯度下降法对网络进行训练，得到最终训练好的模型；6)利用训练好的模型测试三维动作预测的识别效果，模型输出各个动作类别的预测值，对输出值进行归一化得到最终的动作预测结果。2.如权利要求1所述基于过去完成度和未来趋势的自监督三维动作预测方法，其特征在与步骤1)中，所述预处理三维骨架序列数据集，生成三维动作预测数据集的具体步骤为：(1)在大规模骨架序列数据上，对关节点坐标进行归一化处理，并应用下采样技术将所有样本帧数统一；(2)定义0.1到0.9九种不同的观察率，对数据集中所有样本进行遍历处理，每个样本都生成在九种不同观察率下的序列，记录每个序列对应的观察率，统一所有序列的长度，用最后一帧填充空白帧。3.如权利要求1所述基于过去完成度和未来趋势的自监督三维动作预测方法，其特征在于步骤2)中，所述设计动作完成度感知任务和运动预测任务监督模型训练的具体步骤可为：(1)基于一个两层的双向门控循环单元...

【专利技术属性】
技术研发人员：王一帆，赵冲，王其聪，秦启峰，
申请(专利权)人：厦门大学深圳研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人