The invention discloses a video summarization method and a system for self-made video, which can solve the problems of time-consuming and manpower-consuming for generating video summarization of self-made video. The method includes: using dense nearest neighbor clustering method to segment the original video to generate multiple video clips; evaluating the importance level of the video clips; sampling the important level video clips in the preset range by greedy selection strategy to generate video summary. The method evaluates the importance of video clips by unsupervised learning method, ensures the use of coherent and detailed video summary generated by video frames, and does not need manual annotation of video summary to assist in analyzing the inherent structure of video, thus saving a lot of manpower and time.
【技术实现步骤摘要】
一种用于自制视频的视频摘要方法及系统
本专利技术涉及视频摘要
,尤其涉及一种用于自制视频的视频摘要方法及系统。
技术介绍
随着智能手机与摄像头设备的发展和普及,视频可以更加容易地被获取和存储。从而也随之产生了大量的用户自制视频数据。因此,视频检索的需求也随之而升,并耗费大量的时间、人力和物力资源。然而,用户在录制视频时通常很少考虑其时长、内容以及视角选择,从而导致自制视频包括冗长、劣质以及未经编辑的内容(例如光照、晃动、动态背景等)。在此背景下,视频摘要技术在辅助用户快速浏览重要事件方面起着重要的作用。视频摘要技术旨在从原始视频中取样来缩短其长度,但仍能传达重要内容。近年来,视频摘要技术已经引起人们的广泛关注,尤其针对用户录制的自制视频。针对用户自制视频摘要技术的关键在于如何确定原始视频中重要的内容和事件。然而,目前还没有明确的标准来衡量视频片段内容的重要性,即使用户本身也无法给出一个普适的准则来获取视频摘要。人们使用了很多监督学习方法来预测视频的内在结构,然而,监督学习方法的主要难点在于收集用户标注的摘要非常费时。此外,由于用户自制视频的主观性,每个视频都需要多个不同人工标注的摘要。目前只有很少的数据集包括足够的人工标注的视频摘要。
技术实现思路
本专利技术要解决的技术问题目的在于提供一种用于自制视频的视频摘要方法及系统,用以解决现有的生成自制视频的视频摘要费时并且耗费人力的问题。为了实现上述目的,本专利技术采用的技术方案为:一种用于自制视频的视频摘要方法,包括步骤:使用密集近邻聚类方法对原始视频进行分段以生成多个视频片段;对所述视频片段的重要级别进行 ...
【技术保护点】
1.一种用于自制视频的视频摘要方法,其特征在于,包括步骤:使用密集近邻聚类方法对原始视频进行分段以生成多个视频片段;对所述视频片段的重要级别进行评估;通过贪婪选择策略对重要级别在预设范围内的视频片段进行采样以生成视频摘要。
【技术特征摘要】
1.一种用于自制视频的视频摘要方法,其特征在于,包括步骤:使用密集近邻聚类方法对原始视频进行分段以生成多个视频片段;对所述视频片段的重要级别进行评估;通过贪婪选择策略对重要级别在预设范围内的视频片段进行采样以生成视频摘要。2.根据权利要求1所述的一种用于自制视频的视频摘要方法,其特征在于,所述使用密集近邻聚类方法对原始视频进行分段以生成视频片段的步骤具体包括:将视频帧输入深度卷积神经网络以计算标签类别分布的概率;基于所述视频帧的特征构建深度语义图模型;通过密集近邻聚类法找出图模型的捆绑中心簇并根据所述捆绑中心簇生成多个视频片段。3.根据权利要求2所述的一种用于自制视频的视频摘要方法,其特征在于,所述基于所述视频帧特征构建深度语义图模型的步骤具体包括:构造一个图模型G(V,W),其中,V={Fi}是所述的基于视频帧的图模型的顶点;W={wij}是所述的基于视频帧的图模型的顶点Fi和Fj之间的边;所述的基于视频帧的图模型的顶点Fi和Fj之间的相对熵计算如下:其中,i和j是帧序列,是视频帧Fi的标签k的概率;是视频帧Fj的标签k的概率。4.根据权利要求3所述的一种用于自制视频的视频摘要方法,其特征在于,所述对所述视频片段的重要级别进行评估的步骤具体包括:根据所述图模型G(V,W)计算顶点Fi的重要性;其中,d是阻尼因子且范围在0到1之间;计算视频片段的重要级别平均值:其中,tend和tstart是视频片段Sn的末位视频帧和起始视频帧。5.根据权利要求4所述的一种用于自制视频的视频摘要方法,其特征在于,所述通过贪婪选择策略对预设范围内的视频片段进行采样以生成视频摘要的步骤具体包括:在限定时间长度以下,选择重要级别之和最大的视频片段进行采样以生成视频摘要:其中,xn属于{0,1},当值为1时则标识该视频片...
【专利技术属性】
技术研发人员:雷卓,张茜,邱国平,
申请(专利权)人:宁波诺丁汉大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。