一种时序动作定位方法、装置、设备及存储介质制造方法及图纸

技术编号：38105423 阅读：8 留言：0更新日期：2023-07-06 09:27

本发明专利技术公开了一种时序动作定位方法、装置、设备及存储介质，通过对获取的视频序列进行人体姿态估计，获取视频序列中的关键点序列；提取关键点序列中的时空特征，将提取的时空特征送入浅层神经网络进行投影，变换到嵌入空间；通过若干个编码层组成的编码器使用自注意力机制分别提取时空特征变换后的特征表示，并输出多尺度特征；采用由三层轻量级一维深度可分离卷积网络构成的分类预测头和回归预测头对多尺度特征进行解码，输出动作预测的标签序列。能够提高时序动作定位的准确性。能够提高时序动作定位的准确性。能够提高时序动作定位的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种时序动作定位方法、装置、设备及存储介质

[0001]本专利技术涉及计算机视觉
，尤其涉及一种时序动作定位方法、装置、设备及存储介质。

技术介绍

[0002]近年来随着深度学习的不断发展，相较于传统的由研究者对不同任务针对性地设计样本的特征的方法逐渐被淘汰，使基于深度学习的全监督时序动作定位的研究工作获得了快速发展并获得了优异的性能。
[0003]现有的时序动作定位模型大多还是基于卷积神经网络，但是卷积操作具有很强的归纳偏见，包括局部连接性和平移不变性，当数据集达到一定规模时，这种归纳偏见会限制模型的表达能力，导致模型对于不同尺度的动作识别精度降低。

技术实现思路

[0004]为解决上述技术问题，本专利技术提供一种时序动作定位方法、装置、设备及存储介质，能够提高时序动作定位的准确性。
[0005]本专利技术实施例提供一种时序动作定位方法，所述方法包括：
[0006]对获取的视频序列进行人体姿态估计，获取视频序列中的关键点序列；
[0007]提取关键点序列中的时空特征，将提取的时空特征送入浅层神经网络进行投影，变换到嵌入空间；
[0008]通过若干个编码层组成的编码器使用自注意力机制分别提取时空特征变换后的特征表示，并输出多尺度特征；
[0009]采用由三层轻量级一维深度可分离卷积网络构成的分类预测头和回归预测头对多尺度特征进行解码，输出动作预测的标签序列。
[0010]优选地，在获取视频序列中的关键点序列后，所述方法还包括：
[0...

【技术保护点】

【技术特征摘要】
1.一种时序动作定位方法，其特征在于，所述方法包括：对获取的视频序列进行人体姿态估计，获取视频序列中的关键点序列；提取关键点序列中的时空特征，将提取的时空特征送入浅层神经网络进行投影，变换到嵌入空间；通过若干个编码层组成的编码器使用自注意力机制分别提取时空特征变换后的特征表示，并输出多尺度特征；采用由三层轻量级一维深度可分离卷积网络构成的分类预测头和回归预测头对多尺度特征进行解码，输出动作预测的标签序列。2.如权利要求1所述的时序动作定位方法，其特征在于，在获取视频序列中的关键点序列后，所述方法还包括：使用关键点序列生成每一帧的热力图；根据每一帧的热力图，得到滤除背景噪声后的关键点序列。3.如权利要求1所述的时序动作定位方法，其特征在于，所述对获取的视频序列进行人体姿态估计，获取视频序列中的关键点序列，具体包括：采用人体姿态估计算法提取所述视频序列中的每一帧的关键点集合，所述关键点集合中的关键点包括头部、左手、右手、左肘、右肘、左肩和右肩；对于每一当前帧，计算当前帧的关键点集合和前一帧的关键点集合之间的当前距离；当计算的当前距离大于预设距离阈值时，采用前一帧的关键点集合更新当前帧的关键点集合；当计算的当前距离不大于所述距离阈值时，不更新当前帧的关键点集合；完成每一当前帧的关键点集合的前后帧关联匹配，得到所述关键点序列；其中，当前距离K
c
为当前帧的关键点集合，K
p
为前一帧的关键点集合，x
p
为前一帧关键点的x轴坐标，x
a
为当前帧关键点的x轴坐标，y
p
为前一帧关键点的y轴坐标，y
a
为当前帧关键点的y轴坐标。4.如权利要求2所述的时序动作定位方法，其特征在于，滤除背景噪声后的关键点序列中每一当前帧关键点集合P
a
＝P
h
·
P
c
；其中，P
c
为当前帧，P
h
为当前帧的人体热力图；当前帧的人体热力图的生成过程具体包括：计算关键点序列中每一对相邻关键点之间的距离，并在两点之间均匀采样，得到若干采样点；对每个采样点以预设半径建立高斯概率分布，将每一个关键点的中心灰度值，半径和色带均设为相同，得到了当前帧的人体热力图。5.如权利要求1所述的时序动作定位方法，其特征在于，所述提取关键点序列中的时空特征，将提取的时空特征送入浅层神经网络进行投影，变换到嵌入空间，具体包括：使用i3d网络提取关键点序列中的时空特征X＝{X1,X2,...,X
T
}，将提取的时空特征送入浅层神经网络进行投影，变换到D维的嵌入空间，得到特征序列Z0；其中，X
...

【专利技术属性】
技术研发人员：谢雪梅，要苏雨，
申请(专利权)人：琶洲实验室黄埔，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人