一种视频帧检测方法及装置制造方法及图纸

技术编号：20118737 阅读：38 留言：0更新日期：2019-01-16 12:14

本申请实施例公开了一种视频帧检测方法及装置。所述方法包括：获取目标视频帧序列；利用卷积神经网络模型提取所述目标视频帧序列的视频特征数据，所述卷积神经网络模型被设置为根据多个基准历史视频帧序列进行学习得到；根据所述视频特征数据进行视频重建，生成重建视频帧序列；基于所述目标视频帧序列和所述重建视频帧序列之间的差异值，确定所述目标视频帧序列中存在异常事件。利用本申请实施例，可以提高视频帧检测的检测准确率和检测效率。

A Video Frame Detection Method and Device

The embodiment of this application discloses a video frame detection method and device. The method includes: acquiring the target video frame sequence; extracting the video feature data of the target video frame sequence by using the convolution neural network model, which is set up to learn from multiple reference historical video frame sequences; reconstructing video frame sequence according to the video feature data; and reconstructing video frame sequence based on the target video frame. The difference value between the sequence and the reconstructed video frame sequence determines that there are abnormal events in the target video frame sequence. With the application embodiment, the detection accuracy and efficiency of video frame detection can be improved.

全部详细技术资料下载

【技术实现步骤摘要】
一种视频帧检测方法及装置
本申请涉及视频图像处理
，特别涉及一种视频帧检测方法及装置。
技术介绍
随着世界城市化的进展和汽车的普及，无论是在发展中国家还是发达国家，交通拥挤加剧、交通事故频繁、交通环境恶化等问题变得日趋严重。智能交通系统可以将先进的计算机处理技术、信息技术、数据通讯传输技术及电子自动控制技术等综合运用于交通运输管理体系中，通过对交通信息的实时采集、传输和处理，借助各种科技手段和设备，对各种交通状况进行协调和处理。交通监控视频中的异常事件检测属于智能交通系统中的重要环节。随着人工智能技术的快速发展，现有技术中，可以利用深度学习对历史交通监控视频进行学习，具体的做法是，获取大量的训练视频数据，其中包括正样本和负样本，正样本是指训练视频数据中包括交通异常事件，负样本是指训练视频数据中不包括交通异常事件。利用深度学习方式对所述正样本和负样本进行训练学习，生成视频分类模型。在训练生成视频分类模型之后，可以将具有一定时长的视频片段输入至所述视频分类模型中，所述视频分类模型可以识别出输入视频片段中是否包括交通异常事件。现有技术中利用深度学习方式生成视频分类模型的方法在实施时具有以下缺点：(1)在深度学习的训练过程，需要对正样本和负样本进行人工标注，即标注训练视频数据中是否包含交通异常事件，由于参与训练的视频数据数量较多，因此人工成本较高；(2)在真实的应用场景中，交通异常事件占日常交通中的比例很小。这样，不仅增加获取包含交通异常事件视频数据的难度，并且，由于正样本和负样本的分布不平衡，对于视频分类模型的训练具有较大的影响；(3)交通异常事件的分类较...

【技术保护点】
1.一种视频帧检测方法，其特征在于，所述方法包括：获取目标视频帧序列；利用卷积神经网络模型提取所述目标视频帧序列的视频特征数据，所述卷积神经网络模型被设置为根据多个基准历史视频帧序列进行学习得到；根据所述视频特征数据进行视频重建，生成重建视频帧序列；基于所述目标视频帧序列和所述重建视频帧序列之间的差异值，确定所述目标视频帧序列中存在异常事件。

【技术特征摘要】
1.一种视频帧检测方法，其特征在于，所述方法包括：获取目标视频帧序列；利用卷积神经网络模型提取所述目标视频帧序列的视频特征数据，所述卷积神经网络模型被设置为根据多个基准历史视频帧序列进行学习得到；根据所述视频特征数据进行视频重建，生成重建视频帧序列；基于所述目标视频帧序列和所述重建视频帧序列之间的差异值，确定所述目标视频帧序列中存在异常事件。2.根据权利要求1所述的方法，其特征在于，所述卷积神经网络模型被设置为根据多个基准历史视频帧序列进行学习得到包括：1)利用卷积神经网络模型分别提取多个基准历史视频帧序列的视频特征数据，并根据所述视频特征数据进行视频重建，生成重建视频帧序列；2)计算所述基准历史视频帧序列和所述重建视频帧序列之间的重建差异值；3)重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值不大于预设阈值。3.根据权利要求2所述的方法，其特征在于，所述重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值不大于预设阈值包括：判断所述重建差异值是否大于预设阈值；若判断结果为是，则调整所述卷积神经网络模型的模型参数；重复步骤1)和2)，直至所述重建差异值不大于所述预设阈值。4.根据权利要求1所述的方法，其特征在于，所述卷积神经网络模型被设置为根据多个基准历史视频帧序列进行学习得到包括：1)利用卷积神经网络模型分别提取多个基准历史视频帧序列的视频特征数据，并根据所述视频特征数据进行视频重建，生成重建视频帧序列；2)计算所述基准历史视频帧序列和所述重建视频帧序列之间的重建差异值；3)利用所述卷积神经网络模型分别预测所述多个基准历史视频帧序列的预测视频帧序列；4)计算所述基准历史视频帧序列的下一组基准历史视频帧序列与所述预测视频帧序列之间的预测差异值；5)重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值与所述预测差异值的和值不大于预设阈值。5.根据权利要求4所述的方法，其特征在于，所述重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值与所述预测差异值的和值不大于预设阈值包括：判断所述重建差异值与所述预测差异值的和值是否大于预设阈值；若判断结果为是，则调整所述卷积神经网络模型的模型参数；重复步骤1)至4)，直至所述重建差异值与所述预测差异值的和值不大于预设阈值。6.根据权利要求2或4所述的方法，其特征在于，所述计算所述基准历史视频帧序列和所述重建视频帧序列之间的重建差异值包括：分别计算所述基准历史视频帧序列和所述重建视频帧序列对应视频帧之间的欧式距离；根据所述欧式距离确定所述历史视频序列和所述重建视频帧序列之间的重建差异值。7.根据权利要求4所述的方法，其特征在于，所述计算所述基准历史视频帧序列的下一组基准历史视频帧序列与所述预测视频帧序列之间的预测差异值包括：分别计算所述基准历史视频帧序列的下一组基准历史视频帧序列和所述预测视频帧序列对应视频帧之间的欧式距离；设置所述欧式距离的权重值，所述权重值的大小被设置为按照视频帧时间上由先至后的顺序依次递减；根据所述欧式距离和所述欧式距离的权重值确定所述下一组基准历史视频帧序列和所述预测视频帧序列之间的预测差异值。8.根据权利要求1所述的方法，其特征在于，在确定所述目标视频帧序列中存在异常事件之后，所述方法包括：发送警报消息，所述警报消息中包括所述异常事件的发生地点和发生时间。9.一种卷积神经网络模型构建方法，其特征在于，所述方法包括：1)利用卷积神经网络模型分别提取多个基准历史视频帧序列的视频特征数据，并根据所述视频特征数据进行视频重建，生成重建视频帧序列；2)计算所述基准历史视频帧序列和所述重建视频帧序列之间的重建差异值；3)重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值不大于预设阈值。10.根据权利要求9所述的方法，其特征在于，所述重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值不大于预设阈值包括：判断所述重建差异值是否大于预设阈值；若判断结果为是，则调整所述卷积神经网络模型的模型参数；重复步骤1)和2)，直至所述重建差异值不大于预设阈值。11.根据权利要求9所述的方法，其特征在于，所述计算所述基准历史视频帧序列和所述重建视频帧序列之间的重建差异值包括：分别计算所述基准历史视频帧序列和所述重建视频帧序列对应视频帧之间的欧式距离；根据所述欧式距离确定所述历史视频序列和所述重建视频帧序列之间的重建差异值。12.一种卷积神经网络模型构建方法，其特征在于，所述方法包括：1)利用卷积神经网络模型分别提取多个基准历史视频帧序列的视频特征数据，并根据所述视频特征数据进行视频重建，生成重建视频帧序列；2)计算所述基准历史视频帧序列和所述重建视频帧序列之间的重建差异值；3)利用所述卷积神经网络模型分别预测所述多个基准历史视频帧序列的预测视频帧序列4)计算所述基准历史视频帧序列的下一组基准历史视频帧序列与所述预测视频帧序列之间的预测差异值；5)重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值与所述预测差异值的和值不大于预设阈值。13.根据权利要求12所述的方法，其特征在于，所述重复调整所述卷积神经网络模型的模型参数，直至所述重建差异值与所述预测差异值的和值不大于预设阈值包括：判断所述重建差异值与所述预测差异值的和值是否大于预设阈值；若判断结果为是，则调整所述卷积神经网络模型的模型参数；重复步骤1)至4)，直至所述重建差异值与所述预测差异值的和值不大于预设阈值。14.根据权利要求12所述的方法，其特征在于，所述计算所述基准历史视频帧序列和所述重建...

【专利技术属性】
技术研发人员：赵一儒，刘垚，邓兵，黄建强，华先胜，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：开曼群岛,KY

全部详细技术资料下载我是这个专利的主人