The embodiment of the invention discloses a device and a method for generating video abstraction, the method includes: the establishment of the state of the handle to save the video, using the method of drawing frames to obtain output results, analysis of selected frames of the video recognition target region feature information and regional feature information quantity; judging whether the output is true; when the output is true, according to the target feature information of noise threshold, filtering on the regional characteristics of the target information, update the output results, according to the robustness of the threshold value of the target is to appear in the output results of filtration; judging whether the handle in the history of the abstract and the output results are really; according to the judgment result update processing to the target area characteristic information, regional characteristic information quantity and the handle, generating function return value When the return value of the function is true, the extracted frame is encoded as a video summary.
【技术实现步骤摘要】
一种视频摘要生成方法及装置
本专利技术涉及视频识别
,尤其涉及一种视频摘要生成方法及装置。
技术介绍
随着人们对安全的需求越来越高,视频监控作为安全防范领域的有效解决方案,应用范围越来越广,需求在不断提高。但视频监控产生了海量信息,导致存储的数据量越来越大,冗余的视频信息量越来越多,获取视频有效的信息花费时间越来越长。视频识别技术能够对感兴趣物体进行结构化分析,但是并未对结构化分析的结果进行很好的挖掘和利用。视频摘要作为一种降低视频信息冗余、快速获取有价值信息、减少存储空间的新技术方案运用而生。视频摘要的目的是降低码流和存储空间,用尽可能短的时间获取尽可能多的用户感兴趣的信息。视频摘要是通过对视频结构和内容分析,从原始视频中提取有意义的部分,并将它们以某种方式进行组合而成的紧凑的、能充分表达视频语义的内容,它是对视频的简单概括,观众可以通过观看视频摘要而准确的获取视频内容。视频摘要可分为静态视频摘要和动态视频摘要两类,静态视频摘要一般是提取关键帧序列,通过多个关键帧组合成视频得到视频摘要。动态视频摘要也称为缩略视频,相比关键帧序列,它由原始视频中提取运动信息组成视频,从而在语义方面增加视频的表达力。在实现本专利技术的过程中,专利技术人发现现有技术中至少存在如下技术问题:通过提取关键帧序列获取静态视频摘要,并不能覆盖尽可能多的镜头从而得到最完备的视频摘要,会因此造成大量信息的丢失,无法充分满足用户获取全面信息的需求;动态视频摘要基本都是以单一的视频分析信息组成视频,无法满足用户想同时获取多个感兴趣方面的需求。现有的视频摘要生成方法无法根据多样性的用户需 ...
【技术保护点】
一种视频摘要生成方法,其特征在于,包括:建立保存整个视频摘要状态的摘要句柄,采用抽帧的方法获取抽取帧视频识别分析的输出结果、目标区域特征信息和区域特征信息数量;判断所述输出结果是否为真;当所述输出结果为真时,根据目标区域特征信息噪音阈值,对目标区域特征信息进行过滤,更新所述输出结果,并根据各目标是否出现的鲁棒性阈值对所述输出结果进行过滤;判断所述摘要句柄中的历史结果和所述输出结果是否为真;根据判断结果对所述目标区域特征信息、区域特征信息数量和摘要句柄进行更新处理,生成函数返回值;当所述函数返回值为真时,对所抽取的帧作为视频摘要进行编码。
【技术特征摘要】
1.一种视频摘要生成方法,其特征在于,包括:建立保存整个视频摘要状态的摘要句柄,采用抽帧的方法获取抽取帧视频识别分析的输出结果、目标区域特征信息和区域特征信息数量;判断所述输出结果是否为真;当所述输出结果为真时,根据目标区域特征信息噪音阈值,对目标区域特征信息进行过滤,更新所述输出结果,并根据各目标是否出现的鲁棒性阈值对所述输出结果进行过滤;判断所述摘要句柄中的历史结果和所述输出结果是否为真;根据判断结果对所述目标区域特征信息、区域特征信息数量和摘要句柄进行更新处理,生成函数返回值;当所述函数返回值为真时,对所抽取的帧作为视频摘要进行编码。2.根据权利要求1所述的方法,其特征在于,所述根据目标区域特征信息噪音阈值,对目标区域特征信息进行过滤,更新所述输出结果包括:若目标区域特征信息全为噪音,则将所述输出结果置为假,否则,保持所述输出结果为真,并过滤掉噪音区域特征信息。3.根据权利要求2所述的方法,其特征在于,根据所述判断结果对所述目标区域特征信息、区域特征信息数量和摘要句柄进行更新处理,生成函数返回值包括:若所述历史结果和所述输出结果分别为假和真,则将所述目标区域特征信息和区域特征信息数量填充到所述摘要句柄中,并将所述摘要句柄中的历史结果置为真,生成函数返回值为假;若所述历史结果和所述输出结果分别为真和假,则将所述摘要句柄中的历史区域特征信息数量置为0,历史结果置为假,生成函数返回值为假;若所述历史结果和所述输出结果分别为假和假,则生成函数返回值为假;若所述历史结果和所述输出结果分别为真和真,则将目标区域特征信息和摘要句柄中的历史区域特征信息进行拟合扫描,所述历史结果保持为真,若拟合扫描结果为真,则生成函数返回值为真,否则生成函数返回值为假。4.根据权利要求3所述的方法,其特征在于,所述将目标区域特征信息和摘要句柄中的历史区域特征信息进行拟合扫描包括:扫描当前目标区域特征信息和历史目标区域特征信息,对每一次扫描输入为:无效拟合历史矩阵特征信息、无效拟合当前矩阵特征信息、位置阈值、大小阈值;对历史区域特征信息和当前区域特征信息从位置角度对目标区域进行判定,分别得出抖动、变化、无效三个中的一个结果;对历史区域特征信息和当前区域特征信息从大小角度对目标区域进行拟合判定,分别得出抖动、变化、无效三个中的一个结果;以位置判定结果和大小判定结果组合判断是否为踪迹;当没有未扫描的历史目标区域特征信息或当前目标区域特征信息时,若判断结果为有踪迹,则扫描结果为真,否则判断结果为无踪迹,则扫描结果为假。5.根据权利要求4所述的方法,其特征在于,所述对历史区域特征信息和当前区域特征信息从位置角度对目标区域进行判定,包括:计算当前目标区域特征信息与历史目标区域特征信息的中心位置移动距离,当中心位置移动距离小于位置抖动阈值时,判定为抖动;否则当中心位置移动距离小于位置变化阈值时判定为变化,否则,判定为无效。6.根据权利要求4所述的方法,其特征在于,所述对历史区域特征信息和当前区域特征信息从大小角度对目标区域进行拟合判定包括:计算当前目标区域特征信息与历史目标区域特征信息的面积大小差异值,当面积大小差异值小于面积抖动阈值时,判定为抖动;否则当面积大小差异值小于面积变化阈值时判定为变化,否则...
【专利技术属性】
技术研发人员:康鹏涛,
申请(专利权)人:合肥君正科技有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。