一种基于跨视图一致性挖掘的自监督骨架动作识别方法技术

技术编号：38258879 阅读：16 留言：0更新日期：2023-07-27 10:20

本发明专利技术涉及视频处理技术领域，具体涉及一种基于跨视图一致性挖掘的自监督骨架动作识别方法，通过采集无标签骨架数据并进行预处理，从骨架序列生成3D骨架的多种视图，结合多种数据增强方法获得多视图数据的扩增序列，通过编码器得到不同视图的编码特征，建立单视图对比学习框架；进一步通过实例判别的对比学习对多个视图分支进行并行自监督训练，产生多个单视图嵌入特征，通过最近邻挖掘正样本方法，构建单视图语义级的对比学习，经过结合跨视图一致性挖掘模块，学习多视图的协同表示，最后在动作识别任务上利用测试数据对模型效果进行评估，得到模型的识别性能。本发明专利技术提高了人体骨架动作识别模型的性能，改善现有的人体骨架动作识别方法的存在问题。架动作识别方法的存在问题。架动作识别方法的存在问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于跨视图一致性挖掘的自监督骨架动作识别方法

[0001]本专利技术涉及视频处理
，具体涉及一种基于跨视图一致性挖掘的自监督骨架动作识别方法。

技术介绍

[0002]随着5G、互联网技术的飞速发展，图像和视频等多媒体信息也呈爆发式增长，这些海量、冗杂的视觉数据仅依靠传统的人工方式处理会消耗极大的人力和财力，为数据分析与理解带来了巨大的挑战。计算机视觉技术可以快速、实时地捕获数据中的有效信息，实现对视频中的目标进行检测、跟踪、行为识别等任务，是人工智能领域落地最广的技术之一。
[0003]人体动作识别是计算机视觉领域中的研究热点，主要是通过分析视频序列中的图像帧的相关性和视觉外观特征来确定人体行为，在智能监控、智能安防、视频检索等多个领域具有广阔的应用前景。基于监督学习的深度神经网络已经成功应用于各种计算机视觉任务，这类方法需要在有标签的数据集上进行训练，因此模型性能在一定程度上依赖于标注数据的数量和质量，这些数据需要耗费大量的资源进行人工方式标注，成本高昂，这促使利用现成的未标注数据的无监督学习受到越来越多研究者的关注。自监督学习作为无监督学习的一种，可以有效利用大数据时代的大量未标记数据，通过对数据本身的关系做自我监督得到泛化的特征，迁移到下游任务中，可以有效提高人体行为识别模型的性能。
[0004]视频数据的多种模态都可以用来表示人体动作特征，许多基于RGB模态的动作识别技术已经取得了显著的成果，但是RGB模态数据易受背景、外观、光照变化等因素影响，导致动作识别模型对环境因素鲁棒性较差，...

【技术保护点】

【技术特征摘要】
1.一种基于跨视图一致性挖掘的自监督骨架动作识别方法，其特征在于，包括下列步骤：采集无标签骨架数据，并对数据进行预处理；从骨架序列生成3D骨架的多种视图；结合多种数据增强方法获得多视图数据的扩增序列；通过编码器得到不同视图的编码特征，并投影到低维嵌入空间；基于单视图骨架对比学习框架，对多个视图分支进行并行自监督训练，产生多个单视图嵌入特征；通过最近邻挖掘正样本方法，构建单视图语义级的对比学习；结合跨视图一致性挖掘模块，学习多视图的协同表示；在动作识别任务上利用测试数据对模型效果进行评估，得到模型的识别性能。2.如权利要求1所述的基于跨视图一致性挖掘的自监督骨架动作识别方法，其特征在于，在采集无标签骨架数据，并对数据进行预处理的过程中，使用深度传感器从不同的视角采集无标签人体骨架数据，骨架序列利用骨骼关节点的3D位置坐标来表示人体，对于数据预处理，先去除每个骨架序列的无效帧，然后通过线性插值将所述骨架序列大小调整为50帧。3.如权利要求2所述的基于跨视图一致性挖掘的自监督骨架动作识别方法，其特征在于，所述3D骨架的多种视图具体为使用骨架数据的三种视图：关节、运动和骨骼视图，给定一个含有T帧的3D人体骨架序列x，x∈R
C
×
T
×
J
，J为骨骼关节点数，每个关节点的位置向量维度C＝3；骨架序列的运动视图表示为相邻帧之间的时间位移：x
:,t+1,:
‑
x
:,t,:
；骨骼视图表示为同一帧中两个相邻关节之间的距离：4.如权利要求3所述的基于跨视图一致性挖掘的自监督骨架动作识别方法，其特征在于，结合多种数据增强方法获得多视图数据的扩增序列的过程，利用无标签骨架多种视图数据的批次数量作为输入，通过错切变换、时序裁剪和关节点掩码三种策略进...

【专利技术属性】
技术研发人员：徐增敏，王露露，蒙儒省，
申请(专利权)人：桂林安维科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人