一种动作识别方法技术

技术编号：31588549 阅读：13 留言：0更新日期：2021-12-25 11:34

本发明专利技术公开了一种动作识别方法，包括：步骤1）：通过设备获取图片序列集；步骤2）：构建深度学习目标检测网络，将图片序列集输入到检测网络中，获得检测框集；步骤3）：将检测框集转化为时空图；步骤4）：获取图片、设备ID号、图像时间戳，并结合时空图，进行轨迹生成和轨迹数组对比；步骤5）：通过时空图和轨迹数组的信息对轨迹数组进行更新，确认动作；步骤6）：根据时间戳对轨迹数组进行接力更新，让轨迹数组保持动态性；该动作识别方法智能、高效、准确,可嵌入到任何场景和神经网络中，具有高度的模块化。具有高度的模块化。具有高度的模块化。

全部详细技术资料下载

【技术实现步骤摘要】
一种动作识别方法

[0001]本专利技术涉及一种动作识别方法。

技术介绍

[0002]视频的理解与识别是计算机视觉的基础任务之一，相比图像来说，视频内容和背景更加复杂多变，不同的动作类别之间具有相似性，而相同的类别在不同环境下又有着不同的特点。此外，由于拍摄造成的遮挡、抖动、视角变化等也为动作识别进一步带来了困难。在实际应用中，精确的动作识别有助于舆情监控，广告投放，以及很多其他视频理解相关的任务。。而随着深度神经网络技术在计算机视觉各个领域的飞速发展，使用人工智能进行基于视频的动作识别任务已然十分普遍。具体的应用方式大体上分为以下三种：第一种是基于人工特征的视频动作识别。采用传统的机器学习算法，比如梯度直方图、时空兴趣点检测、光流直方图等提取图像和时序的特征表示，编码后进行分类。然而，当面临大规模数据集时，这些特征缺乏一定的灵活性和可扩展性。
[0003]第二种是使用三维卷积层进行基于视频的动作识别。三维卷积神经网络可以共同学习时间和空间特征，将一般的二维神经网络，如VGG、Inception、ResNet等扩展为三维卷积层，从而去学习视频帧序列的时空特征。但使用三维卷积神经网络会导致计算量大、部署困难以及容易过拟合的问题，总体来说，这种方式的特点是精度高但时间复杂度高。
[0004]第三种是基于双流的神经网络和时序结构集合。双流二维卷积采用分别对时间和空间建模的动作识别，来提取时空特征，然后通过平均池化或时序结构如LSTM、RNN把各种特征加权融合或进行注意力机制的加成，从而得到最终的结果，这个方...

【技术保护点】

【技术特征摘要】
1.一种动作识别方法，其特征在于，包括：步骤1）：通过设备获取图片序列集；步骤2）：构建深度学习目标检测网络，将图片序列集输入到检测网络中，获得检测框集；步骤3）：将检测框集转化为时空图；步骤4）：获取图片、设备ID号、图像时间戳，并结合时空图，进行轨迹生成和轨迹数组对比；步骤5）：通过时空图和轨迹数组的信息对轨迹数组进行更新，确认动作；步骤6）：根据时间戳对轨迹数组进行接力更新，让轨迹数组保持动态性。2.如权利要求1所述的动作识别方法，其特征在于，在步骤1）中，获取图片序列集的方法为：通过设备采集视频，对视频进行抽帧处理，得到多个图像帧序列。3.如权利要求1所述的动作识别方法，其特征在于，在步骤2）中，获得的检测框集为：图像经过检测网络获得物体检测框集和人体检测框集。4.如权利要求3所述的动作识别方法，其特征在于，在步骤3）中，把检测框集转化成时空图的方法为：排序、过滤和对比，该时空图为多目标时空图，该多目标时空图包括物体时空图和人体时空图。5.如权利要求4所述的动作识别方法，其特征在于，在步骤3）中，将物体时空图和人体时空图进行人体关联处理，将人体时空图的面积和物体时空图的面积进行交并集比，过滤不符合需求条件的物体时空图。6.如权利要求1所述的动作识别方法，其特征在于，在步骤4）中，将时空图、图片、设备ID号、图像时间戳和该设备的轨迹数组进行交叉比对，以获得在该设备中属于该类别的轨迹，在比...

【专利技术属性】
技术研发人员：张元本，陈名国，
申请(专利权)人：广州微林软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人