一种基于深度学习技术的视频摘要生成方法技术

技术编号：10824377 阅读：288 留言：0更新日期：2014-12-26 12:53

一种基于深度学习技术的视频摘要生成方法，包括：对视频流逐帧进行背景建模，获取运动前景作为候选运动目标；使用多目标跟踪算法对每一帧的候选运动目标跟踪，更新形成运动轨迹的候选目标；使用卷积神经网络训练目标分类器，对候选目标进行确认，在确认真实运动目标后，使用分类器对目标类别进行判定；将所有真实运动目标和相关信息贴合在少量图像上，形成视频快照显示给用户。本发明专利技术利用深度学习技术对真实目标和噪声进行准确区分；且利用准确的多目标追踪技术来避免逐帧进行目标确认，大幅减少了计算量，有效降低了弱小目标的漏检率及噪声的虚警率，提升了视频处理速度，能够运用于各种复杂的场景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理
，更具体地，涉及。
技术介绍
现代社会中，视频监控系统在各行各业中都扮演着重要的角色，在维护社会治安，加强社会管理以及安全保障方面发挥着重要的作用；但是伴随着摄像头数目的飞速增长，海量的监控视频数据的存储以及了解这些视频中记录的事件会耗费大量的人力、物力。根据IteportLinker公司统计，在2011年，全世界拥有超过1.65亿个监控摄像机，产生1.4万亿个小时的监控数据，假如有20 %的重要监控视频数据需要人工观看，则需要雇佣超过I亿的劳动力(每天工作8小时，每年工作300天)。因此，将大量的视频进行浓缩，帮助用户快速了解视频中发生的事件，迅速锁定检索对象，能够有效地提高海量监控视频的利用效率。在图像处理领域，为了提高视频的浏览效率，可采用视频摘要技术，将视频中用户感兴趣的内容提取出来，然后将它们以紧凑的方式重新安排，以视频快照的形式将视频的内容展示出来。为了能够自动的提取视频中用户感兴趣的内容，最简单的方法是提取原始视频中的关键帧，来构成视频摘要(例如参考文献:查德威克凯姆等，“一种基于目标的视频摘要整体方案”，《第八届计算机协会多媒体国际会议汇刊》，2000年，第303-311页(Kim, C., Hwang, J.N.:An integrated scheme for object-based video abstract1n.1n:Proceedings of the eighth ACM internat1nal conference on Multimedia.(2000) ...
一种<a href="http://www.xjishu.com/zhuanli/62/201410525704.html" title="一种基于深度学习技术的视频摘要生成方法原文来自X技术">基于深度学习技术的视频摘要生成方法</a>

【技术保护点】
一种基于深度学习技术的视频摘要生成方法，包括以下步骤：步骤1，对输入的原始视频的图像序列进行背景建模，提取运动目标对应的前景区域；步骤2，将获得的所述前景区域作为运动候选目标，使用多目标跟踪技术对所述运动候选目标进行跟踪，计算每一帧中所述运动候选目标的运动轨迹；步骤3，对确定所述运动轨迹为活跃轨迹的运动候选目标使用基于深度学习技术的目标分类器进行进一步确认，判定所述运动候选目标是否是真实的目标，以及确认目标后，再使用分类器判断所述运动候选目标的类别；步骤4，将多个检测到的所述运动目标贴合在同一幅图像中，生成视频快照，以所述视频快照展示视频中检测到的所述运动目标。

【技术特征摘要】
1.一种基于深度学习技术的视频摘要生成方法，包括以下步骤: 步骤1，对输入的原始视频的图像序列进行背景建模，提取运动目标对应的前景区域；步骤2，将获得的所述前景区域作为运动候选目标，使用多目标跟踪技术对所述运动候选目标进行跟踪，计算每一帧中所述运动候选目标的运动轨迹；步骤3，对确定所述运动轨迹为活跃轨迹的运动候选目标使用基于深度学习技术的目标分类器进行进一步确认，判定所述运动候选目标是否是真实的目标，以及确认目标后，再使用分类器判断所述运动候选目标的类别；步骤4，将多个检测到的所述运动目标贴合在同一幅图像中，生成视频快照，以所述视频快照展示视频中检测到的所述运动目标。2.如权利要求1所述的基于深度学习技术的视频摘要生成方法，其中在步骤I中对输入的原始视频的图像序列进行背景建模的步骤之前还包括将输入的所述原始视频的图像序列缩放至相同大小的步骤。3.如权利要求1所述的基于深度学习技术的视频摘要生成方法，其中在步骤I所述提取运动目标对应的前景区域的步骤中还包括对获得的所述运动前景进行后处理的步骤，具体包括: 步骤11，用形态学结构元素，对所述前景区域进行形态学开运算和形态学闭运算，获得轮廓光滑的前景区域，并且消除面积较小的噪声块；步骤12，对所述前景区域进行面积计算，若所述前景区域像素点数目小于T1 = 5时，则滤除所述前景区域，否则，保留所述前景区域，确定所述前景区域是候选目标。4.如权利要求1所述的基于深度学习技术的视频摘要生成方法，其中在步骤2中所述的多目标跟踪技术是基于匈牙利算法构建的，具体包括: 步骤21，计算当前帧的所述运动候选目标的颜色直方图特征，以及所述颜色直方图特征与上一帧中运动候选目标的相似性；步骤22，利用卡尔曼滤波预测上一帧中的所述运动候选目标在当前帧的位置信息，计算所述运动候选目标的预测位置与当前帧所述运动候选目标位置之间的欧氏距离；步骤23，根据上述计算结果，使用匈牙利算法，对当前帧中的所述运动候选目标与上一帧中所述运动候选目标的轨迹进行匹配，获得匹配结果，并根据所述匹配结果更新所述运动候选目标的轨迹。5.如权利要求1所述的基于深度学习技术的视频摘要生成方法，其中在步骤3中所述的目标分类器是预先使用深度学习技术中的卷积神经网络进行离线训练得到的，用于判定所述运动候选目标是否是真实目标，...

【专利技术属性】
技术研发人员：袁飞，唐矗，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人