一种基于骨骼节点的端到端人类行为识别方法与模型技术

技术编号：33786258 阅读：12 留言：0更新日期：2022-06-12 14:41

本发明专利技术提出了一种基于骨骼节点的端到端人类行为识别方法与模型。深度学习网络模型的构建包括：视频序列人体行为跟踪；骨骼关节点检测识别；生成骨骼序列时空图拓扑；骨骼序列训练前预处理；使用深度学习网络训练获得的骨骼时空序列以获取人类行为语义特征表示；在不同层网络结构中对骨骼关节点进行端到端的优化；最终网络分类器识别人类行为类别。本发明专利技术意在从视频序列获取人体骨骼关节点，通过提出一个对骨骼关节实现端到端的优化的方法，在深度学习网络模型框架下对骨骼关节图拓扑进行建模，学习一个更优的骨骼关节图拓扑结构，从而达到更优的行为识别准确率。而达到更优的行为识别准确率。而达到更优的行为识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于骨骼节点的端到端人类行为识别方法与模型

[0001]本专利技术涉及到计算机视觉
，具体涉及一种基于深度学习的人类行为识别方法以及行为识别模型的构建。

技术介绍

[0002]人类行为识别任务是让计算机或其他智能设备依靠提供的视频序列，智能的从中识别人体行为属于何种行为，然后依据识别的个任务特定的需求进行下一步操作的。在对人体行为进行识别与判断的任务中，传统的做法是采用目标检测算法，这类算法无需使用大型数据集进行学习训练，仅仅对视频的行为进行框出和跟踪的低级机器视觉的处理方式。由于人体的行为是高等级的行为特征，这需要对视频序列中的人体进行精确的目标跟踪与行为检测。当前针对行为识别与检测的解决方法主要有背景减法，帧差法，光流法等等，这些方法大多通过特征匹配和像素的亮度变化来对目标进行跟踪识别。
[0003]近几年随着人工智能技术的高速发展，特别是对机器学习和深度学习领域的研究，通过使用各种智能软硬件来识别视频序列中人体行为行为的需求变得旺盛，这也催生各行各业对信息化，智能化更高的要求。视频理解与分类是计算机视觉邻域的基础任务之一，随着各种视频传感器的快速发展和无人检测设备的大量普及，采用机器学习或深度学习以人机交互的模式来实现技术迭代，对视频信息的高级处理。这类方法通过学习和训练人类行为特征，生成易被神经网络识别的特征表示来实现行为分类，因其杰出的表现与高效的性能越来越受到广大研究者的关注。由于背景杂波、部分遮挡、尺度、视角、光照和外观变化等原因，从视频序列中识别人类行为是一项极具挑战性的任务。智能化...

【技术保护点】

【技术特征摘要】
1.一种人体骨骼关节点检测的方法，其特征在于，包括：根据光线变化结合维度信息从复杂背景中捕捉人体行为图像，通过识别像素点的方式将被测者的身体区域与其所处背景进行分离；根据解刨特征和运动检测解刨人体骨骼结构，获取骨骼时空序列特征图的骨骼关节特征提取器，将骨骼时空序列图的关节按照不同的关节节点，相同关节节点在不同时间帧中的索引以及空间坐标向量进行样本标记；根据所述骨骼数据原始样本进行数据增强操作，将数据增强后的样本输入到有监督对比学习表征网络，以此获得行为特征表征；通过共享网络共享时空对比学习表征网络编码器参数，联合全连接层对所述视频序列进行行为识别。2.一种人体骨骼时空序列数据预处理方法，其特征在于，包括：根据每个输入骨骼序列，数据预处理阶段应用两次数据增强，以获得两个输入样本副本，生成两个随机增广骨骼序列，每个序列表示数据的不同视图；对同一输入骨骼序列样本的随机变换保留了相似的行为模式，并隐含了原始骨骼序列中的信息子集。3.一种时空语义信息图卷积网络模型架构，其特征在于，获取行为特征表示的具体步骤，包括：根据所述数据预处理模块，经数据增强操作后，输入样本变为原始样本的两倍，将两份增强样本沿批次维度串联；根据所述线性回归函数构建输入样本骨骼信息在高维空间的特征映射，将映射到高维空间的特征表示经过时空特征提取器后，学习行为特征归一化后的单位超球面向量，获得特征投影网络所需的关键信息；将经过所述的时空特征提取器模块训练后的表示向量投影到较低维空间，同时将所学习到的特征送入到投影器网络，投影网络是一个带有ReLU多层感知器。4.如权利要求2所述的样本数据预处理模型的构建方法，其特征在于，包括：根据骨...

【专利技术属性】
技术研发人员：邓泽林，周浩，
申请(专利权)人：长沙理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人