一种基于视频序列的人体动作识别方法技术

技术编号：39494499 阅读：9 留言：0更新日期：2023-11-24 11:20

本发明专利技术公开了一种基于视频序列的人体动作识别方法

全部详细技术资料下载

【技术实现步骤摘要】
一种基于视频序列的人体动作识别方法、系统及存储介质

[0001]本专利技术属于计算机视觉领域，具体涉及一种基于视频序列的人体动作识别方法
、
系统及存储介质
。

技术介绍

[0002]随着科技的发展和人工智能的普遍，多媒体信息呈现出爆炸式增长的特点，其中视频作为重要的信息载体，发挥的作用越来越大
。
其中大量视频内容涉及到人体的动作和活动，因此，对于基于视频序列的人体动作识别是非常重要的一个研究方向，在许多场合都具有非常重要的作用
。
[0003]但是现有的人体动作识别算法或系统大多至针对单一特征进行采集和识别
。
其数据源十分单一，且无法适用于不同场景，十分影响后续识别结果的准确性
。

技术实现思路

[0004]针对现有技术的以上缺陷或改进需求中的一种或者多种，本专利技术提供了一种基于视频序列的人体动作识别方法
、
系统及存储介质，其利用运动分支和空间分支以及两分支的融合实现运动信息，外观信息，多频域信息的特征融合，并在融合过程中加入自适应多频域自注意力交叉融合模块，以更佳灵活的方式提高频率适应性，增强模型对通道信息建模的能力，使运动信息和时空信息同时与多频域信息进行交流融合，促进多方面特征关系的建立，增强模型特征建模能力，提高识别效果
。
[0005]为实现上述目的，本专利技术提供一种基于视频序列的人体动作识别方法，其包括以下步骤：
S100
：获取的视频数据，并按固定的...

【技术保护点】

【技术特征摘要】
1.
一种基于视频序列的人体动作识别方法，其特征在于，其包括以下步骤：
S100
：获取的视频数据，并按固定的时间间隔进行取帧操作，并确定分段数目和每段图的数量；
S200
：提取处理后视频中的运动信息和时空信息，并对运动信息和时空信息进行训练，使运动信息和时空信息同时与多频域信息进行交流融合；
S300
：采用基于
SSIM
的动态选择运动信息进行建模或采用基于熵的动态选择运动信息建模进行建模，然后再构建多域自适应架构；
S400
：输入图像数据，并获取模型中运动信息和时空信息的结果的平均值作为最终的识别结果；
S500
：将识别结果输出
。2.
根据权利要求1所述的基于视频序列的人体动作识别方法，其特征在于，在步骤
S200
中，具体包括以下步骤：利用自注意力机制，计算每个
token
的注意力得分，选择得分高的赋予多频域通道
。3.
根据权利要求2所述的基于视频序列的人体动作识别方法，其特征在于，将通道的注意力机制运用至多域自适应架构中，用于提取不同的通道信息
。4.
根据权利要求3所述的基于视频序列的人体动作识别方法，其特征在于，将所述通道的注意力机制运用至多域自适应架构中，具体包括以下步骤，以来自运动分支和空间分支的特征为输入，每次对其进行频率选择时，都根据两条分支的特征流进行选择，使得运动特征，空间特征和自适应多频域信息的融合更佳高效，根据注意力得分选出合适的频率后赋予各个通道部分，进行特征提取
。5.
根据权利要求
1~4
中任一项所述的基于视频序列的人体动作识别方法，其特征在于，在步骤
S300
中，构建多域自适应架构包括以下步骤：通过对连续帧建立关系，获得视频序列中运动信息比较强烈的动作区域，...

【专利技术属性】
技术研发人员：郑艳伟，梁会，于东晓，陈锋，
申请(专利权)人：山东大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人