采样方法、模型生成方法、视频行为识别方法及装置制造方法及图纸

技术编号：23984970 阅读：23 留言：0更新日期：2020-04-29 13:05

本发明专利技术提供了一种视频行为数据采样方法、视频行为识别模型生成方法、视频行为识别方法、电子设备及计算机可读存储介质，其中，该采样方法包括：从视频的编码数据中提取所述视频的第一中间帧的编码信息；所述编码信息包括运动向量；根据所述第一中间帧的不同编码单元的编码信息之间的差异情况确定所述第一中间帧的特征区域；在确定的所述第一中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值的情况下，根据所述第一中间帧的特征区域确定第一取样单元；根据所述第一取样单元确定对所述视频采样的数据。通过上述方案本发明专利技术能够对视频进行有效采样，从而提高视频行为识别的效果。

Sampling method, model generation method, video behavior recognition method and device

全部详细技术资料下载

【技术实现步骤摘要】
采样方法、模型生成方法、视频行为识别方法及装置
本专利技术涉及视频分析
，尤其涉及一种采样方法、模型生成方法、视频行为识别方法及装置。
技术介绍
行为识别是视频分析的重要一环，在安防、行为分析等领域有众多应用，近些年来面向视频的行为识别算法受到了很大关注。视频行为识别可以分为基于光流的传统算法和基于深度学习的智能算法。基于光流的行为识别算法，以像素为计算单位，对视频中的某几帧进行处理，计算量大但稳定性较好。以提升的密集轨迹算法(IDT，ImprovedDenseTrajectories)为代表，包括密集采样特征点、特征点轨迹跟踪和基于轨迹的特征提取几个部分。基于深度学习的智能行为识别算法以图像智能识别算法为基础，近几年取得了超过传统算法的精度。智能行为识别主要分为双流算法以及3d卷积网络两类。双流算法使用两个神经网络分别提取视频的时间空间信息，并将两股信息融合最终得到识别结果。C3D网络通过3d卷积核直接提取视频数据的时间和空间特征，此种方法速度较快，能达到上百FPS。然而，基于光流的行为识别算法以像素为计算单位，每处理一个帧，需要对图像中所有的像素进行计算。这种方法计算量大，且随着视频清晰度上升、像素数量增加，这种算法的计算速度将受到严重影响，因此不适用于高清视频的行为分析。基于深度学习的双流神经网在计算时域信息时使用光流信息。此光流信息由像素获取，因此在分析高清视频的行为时计算速度较慢。同样基于深度学习的3D卷积神经网络(C3D)虽然速度较快，但是精度相较于双流神经网络偏低。...

【技术保护点】
1.一种视频行为数据采样方法，其特征在于，包括：/n从视频的编码数据中提取所述视频的第一中间帧的编码信息；所述编码信息包括运动向量；/n根据所述第一中间帧的不同编码单元的编码信息之间的差异情况确定所述第一中间帧的特征区域；/n在确定的所述第一中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值的情况下，根据所述第一中间帧的特征区域确定第一取样单元；/n根据所述第一取样单元确定对所述视频采样的数据。/n

【技术特征摘要】
1.一种视频行为数据采样方法，其特征在于，包括：
从视频的编码数据中提取所述视频的第一中间帧的编码信息；所述编码信息包括运动向量；
根据所述第一中间帧的不同编码单元的编码信息之间的差异情况确定所述第一中间帧的特征区域；
在确定的所述第一中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值的情况下，根据所述第一中间帧的特征区域确定第一取样单元；
根据所述第一取样单元确定对所述视频采样的数据。

2.如权利要求1所述的视频行为数据采样方法，其特征在于，根据所述第一中间帧的不同编码单元的编码信息之间的差异情况确定所述第一中间帧的特征区域，包括：
在所述第一中间帧的不同编码单元的编码信息中的运动向量两两之间的差异小于或等于设定运动差异阈值的情况下，根据所述第一中间帧的所述编码单元对应的区域确定所述第一中间帧的特征区域。

3.如权利要求2所述的视频行为数据采样方法，其特征在于，所述编码信息还包括预测残差；
在所述第一中间帧的不同编码单元的编码信息中的运动向量两两之间的差异小于或等于设定运动差异阈值的情况下，根据所述第一中间帧的所述编码单元对应的区域确定所述第一中间帧的特征区域，包括：
在所述第一中间帧的不同编码单元的编码信息中的运动向量两两之间的差异小于或等于设定运动差异阈值，且所述第一中间帧的各所述编码单元的编码信息中的预测残差均小于或等于设定残差阈值的情况下，根据所述第一中间帧的所述编码单元对应的区域确定所述第一中间帧的特征区域。

4.如权利要求3所述的视频行为数据采样方法，其特征在于，在所述第一中间帧的不同编码单元的编码信息中的运动向量两两之间的差异小于或等于设定运动差异阈值的情况下，根据所述第一中间帧的所述编码单元对应的区域确定所述第一中间帧的特征区域，包括：
在所述第一中间帧的不同编码单元的编码信息中的运动向量两两之间的差异小于或等于设定运动差异阈值，但所述第一中间帧的各所述编码单元的编码信息中的预测残差大于设定残差阈值的情况下，若所述第一中间帧的所述不同编码单元的编码信息中的预测残差两两之间的差异小于或等于设定残差差异阈值，则根据所述第一中间帧的所述编码单元对应的区域确定所述第一中间帧的特征区域。

5.如权利要求2所述的视频行为数据采样方法，其特征在于，根据所述第一中间帧的所述编码单元对应的区域确定所述第一中间帧的特征区域，包括：
将所述第一中间帧的所有所述编码单元对应的区域确定为所述第一中间帧的特征区域。

6.如权利要求1所述的视频行为数据采样方法，其特征在于，所述编码信息还包括帧间预测方式；
根据所述第一中间帧的不同编码单元的编码信息之间的差异情况确定所述第一中间帧的特征区域，包括：
在所述第一中间帧的部分编码单元的编码信息中的帧间预测方式不同于所述第一中间帧的其余编码单元的编码信息中的帧间预测方式的情况下，根据所述第一中间帧的所述部分编码单元对应的区域确定所述第一中间帧的特征区域。

7.如权利要求1至6任一项所述的视频行为数据采样方法，其特征在于，
根据所述第一取样单元确定对所述视频采样的数据之前，所述方法还包括：
从所述视频的编码数据中提取所述视频的第二中间帧的包括运动向量的编码信息；
根据所述第二中间帧的不同编码单元的编码信息之间的差异情况确定所述第二中间帧的特征区域；
在所述第二中间帧的特征区域相对于所述第一中间帧的特征区域的范围变化小于或等于设定范围变化阈值的情况下，若确定的所述第二中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值，则根据所述第二中间帧的特征区域更新所述第一取样单元；
根据所述第一取样单元确定对所述视频采样的数据，包括：
根据更新后的所述第一取样单元确定对所述视频采样的数据。

8.如权利要求7所述的视频行为数据采样方法，其特征在于，在所述第二中间帧的特征区域相对于所述第一中间帧的特征区域的范围变化小于或等于设定范围变化阈值的情况下，若确定的所述第二中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值，则根据所述第二中间帧的特征区域更新所述第一取样单元，包括：
在所述第二中间帧的特征区域相对于所述第一中间帧的特征区域的范围变化小于或等于设定范围变化阈值的情况下，若确定的所述第二中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值，且所述第一取样单元中的帧间隔范围小于设定帧间隔阈值范围，则根据所述第二中间帧的特征区域更新所述第一取样单元。

9.如权利要求8所述的视频行为数据采样方法，其特征在于，在所述第二中间帧的特征区域相对于所述第一中间帧的特征区域的范围变化小于或等于设定范围变化阈值的情况下，若确定的所述第二中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值，则根据所述第二中间帧的特征区域更新所述第一取样单元之前，所述方法还包括：
在所述第二中间帧的特征区域相对于所述第一中间帧的特征区域的范围变化小于或等于设定范围变化阈值的情况下，若确定的所述第二中间帧的特征区域对应的编码单元的编码信息中的运动向量大于或等于设定运动阈值，但所述第一取样单元中的帧间隔范围等于设定帧间隔阈值范围，则根据所述第二中间帧的特征区域确定所述视频的第二取样单元；
根据所述第一取样单元确定对所述视频采样的数据，包括：
根据所述第一取样单元和所述第二取样单元确定对所述视频采样的数据。

10.如权利要求7所述的视频行为数据采样方法，其特征在于，
根据所述第一中间帧的特征区域确定第一取样单元，包括：
为所述第一中间帧的特征区域设置第一取样标志，以标记所述视频的第一取样单元的内容；
根据所述第二中间帧的特征区域更新所述第一取样单元，包括：
为所述第二中间帧的特征区域设...

【专利技术属性】
技术研发人员：鄢贵海，赵巍岳，
申请(专利权)人：中科驭数北京科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人