一种高满意度视频摘要生成方法技术

技术编号:8801170 阅读:152 留言:0更新日期:2013-06-13 05:50
本发明专利技术涉及一种高满意度视频摘要生成方法。本发明专利技术基于视频数据结构的特点,设计、实现了一种基于镜头聚类的视频摘要系统,该系统主要功能包括:多类型视频文件的编解码和播放,镜头边界检测,关键帧提取,镜头聚类,静态视频摘要,用户输入时间动态摘要的生成等。本发明专利技术适合多媒体文件管理、视频检索、影视库建设等应用场合。

【技术实现步骤摘要】

本专利技术涉及,属于多媒体信息处理领域,具体来说,属于视频信息处理领域。
技术介绍
随着数字视频资源数量的迅速增加,表示、理解和提取视频结构来提供视频内容浏览和检索服务变得十分重要。其中,基于内容的视频分析技术就是其主要任务。基于内容的视频分析是指使用计算机对包含图像和声音的视频数据进行语义上的分析和理解。它的快速发展产生了很多新的相关技术研究成果和应用。在这些新兴的研究领域中,有一些应用和研究针对的问题是如何利用对视频内容的分析来减小视频存储、分类和索引的代价,以及如何提高视频的使用效率,可用性和可访问性。这就是视频摘要技术。视频摘要技术是以自动或半自动的方式对视频的结构和内容进行分析,从原视频中提取出有意义的部分,并将它们以某种方式进行组合,形成简洁的能够充分表现视频语义内容的概要。它是对长视频内容的简短总结,通常用一段静态或者动态的图像序列来表示,并对原始信息予以保留[2]。因此它可以提供给人们一个有关原始视频基本内容的较为精练的信息,其内容可以概括原始视频的主要内容,但其长度却要比原始视频短得多。目前视频摘要的生成方法大致可以分为四类:1.简单的生成方法。主要有两种。一是基于时间对视频进行采样,即每隔一段时间抽取一个代表帧或者一个片段;二是快速回放的方法,通过加快帧率达到缩短播放时间的目的。这两种方法比较简单,但完全没有基于视频的内容,效果很不可靠。2.基于视觉信息的生成方法。根据视频中颜色、纹理、形状、运动方向和强度等视觉信息,应用各种视频和图像处理技术,进行镜头探测、关键帧提取、场景聚类、运动特征提取等一系列操作,最终生成具有代表性的关键帧序列或缩略视频。这种算法完全基于视觉特征,而忽略了音频、字幕等信息对表现视频所起的作用。美国Palo Alto实验室生成的故事板(漫画书)的研究是其中的典型代表。3.融合多特征的生成方法。该方法在基于视觉方法的基础上融入其它媒体提供的信息,来更准确的判断视频片段的重要程度。例如,采用人脸识别技术来探测新闻中重要人物的出现,采用音频处理技术来探测体育视频中的精彩片段等等。这种算法是目前研究的热点,当前大多数视频摘要方法都是基于这种思想的。4.基于视频句法语义的生成方法。该方法不追求用模式识别技术获取视频中的数据语义,而是从视频的句法结构分析入手,探寻镜头与镜头之间、场景与场景之间的结构规贝U,从中分析出编导人员试图借此表现的情感和氛围,并以此为基础,将视频的句法语义尽可能完整地保存到摘要当中。这种方法的典型代表是Columbia大学Harri等人提出的基于句法语义的效用模型。这是一种新的思路,在视频模式识别技术还远远不够完善的今天,这种方法不失为生成视频摘要的一个新途径。总的来说,视频摘要生成问题是十分复杂的,如果真正做到对环境不加任何限制,要想实现既实时快速又稳定高效的摘要生成系统是非常困难的。摘要生成技术研究比较早,从现有资料来看,还存在许多问题,没有一个实现稳定实时的实际系统,特别是从用户满意度的角度来看,满意度不足,仍是各种方法普遍存在的问题。
技术实现思路
本专利技术的目标是:实现一种基于镜头聚类的视频摘要系统,该系统主要功能包括:多类型视频文件的编解码和播放,镜头边界检测,关键帧提取,镜头聚类,静态视频摘要,用户输入时间动态摘要的生成等。本专利技术的技术方案是通过如下步骤实现的:(I)检测镜头;⑵提取每个镜头的关键帧;(3)将所有镜头按照视觉相似性分组;(4)从镜头组中提取代表帧作为静态摘要;(5)在前3步基础上,首先确定各镜头组的重要程度,再为重要程度高的镜头组分配更多的帧数,最终使用从个镜头组选取的视频帧生成摘要视频,整体过程如附图说明图1所示。上述处理流程的具体步骤为:步骤I,检测镜头,整体流程如图2所示,具体步骤为:步骤1.1图像预处理。即对图像进行中值滤波预处理,提高检测的准确度。步骤1.2闪光检测。采用基于亮度帧差的方法,整体过程如图2所示,具体方法如下:(I)在一个窗口中取16帧图像,计算得到15个相邻帧间的亮度帧间差;(2)计算这15个帧间亮度差值的平均值,记为VDiff_avl5 ;(3)获取闪光检测的阈值,T_flush= O XVDiff_avl5,选取 o =5.5 ;(4)依次比较帧间差与T_flush的大小;定义当前帧差为第n帧和第n+1帧的帧间差,若当前帧差大于T_f lush,且下一相邻帧差也大于T_f lush,则判定第n+1帧处有闪光发生;否则,没有闪光发生。步骤1.3切变检测。采用亮度帧差作为切变检测特征,具体过程描述如下:(I)在一个窗口中计算得到15个相邻帧间的亮度帧间差;(2)计算这15个帧间亮度差值的平均值VDiff_15av ;(3)计算15个亮度帧差到该视频段亮度帧差均值VDiff_15av的距离VDist⑴;(4)计算切变检测的高阈值(Th_shot)和低阈值(Tl_shot);(5)依次比较当前相邻帧差与该视频段亮度帧差均值VDiff_15av,同时比较各VDist (i)与切变的高阈值Th_shot和低阈值Tl_shot,若满足判定条件,则发生切变,否则,移窗,转(I)。所述切变的判别条件为:(I)视频段中第j个亮度帧差大于该视频段亮度帧差均值,且第j_l和第j + 1个亮度帧差小于均值;(2)视频段中第j个亮度帧差到该视频段亮度帧差均值距离大于高阈值,且第j_l和第j+1个亮度帧差到均值距离小于低阈值。同时满足上述两个条件,则认为第j_l与第j帧之间发生了切变。步骤1.4渐变检测渐变检测以步骤1.3切变检测的结果为基础,对连续两次切变之间的视频帧序列进行渐变检测。具体过程描述如下:(I)取两个切变镜头之间的所有帧,计算相邻帧间的颜色帧差;(2)统计该视频段中颜色帧差的数量级直方图,以直方图最大的颜色帧差数量级为基准值,对颜色帧差进行O、I量化;(3)对量化结果进行平滑,剔除毛刺;(4)根据判定依据确定渐变段、渐变起始帧号和终止帧号。渐变检测是在完成切变检测后,依据切变检测结果,依次读取相邻两次切变之间的视频帧序列进行渐变检测,直到源视频帧序列的末尾。步骤2,在步骤I的基础上,提取每个镜头的关键帧。整体流程如图3所示,具体过程如下:步骤2.1按时间将镜头分为子镜头,具体描述如下:(I)计算镜头内所有相邻帧间的颜色直方图距离的均值av_CDiff,公式如下。本文档来自技高网
...

【技术保护点】
一种基于镜头聚类的高理解度视频摘要系统,其特征在于,所述方法包括以下步骤:步骤1,镜头检测。步骤2,提取每个镜头的关键帧。步骤3,将所有镜头按照视觉相似性分组。步骤4,从镜头组中提取代表帧作为静态摘要。步骤5,动态摘要生成。

【技术特征摘要】
1.一种基于镜头聚类的高理解度视频摘要系统,其特征在于,所述方法包括以下步骤: 步骤I,镜头检测。步骤2,提取每个镜头的关键帧。步骤3,将所有镜头按照视觉相似性分组。步骤4,从镜头组中提取代表帧作为静态摘要。步骤5,动态摘要生成。2.根据权利要求1所述的方法,其特征在于,所述镜头检测方法的具体步骤为: 步骤I图像预处理。即对图像进行中值滤波预处理,提高检测的准确度。步骤2闪光检测。采用基于亮度帧差的方法,整体过程如图2所示,具体方法如下: (1)在一个窗口中取16帧图像,计算得到15个相邻帧间的亮度帧间差; (2)计算这15个帧间亮度差值的平均值,记为VDiff_avl5; (3)获取闪光检测的阈值,T_fIush=σ XVDiff_avl5,选取σ =5.5 ; (4)依次比 较帧间差与T_flush的大小;定义当前帧差为第η帧和第η+1帧的帧间差,若当前帧差大于T_f lush,且下一相邻帧差也大于T_f lush,则判定第η+1帧处有闪光发生;否则,没有闪光发生。步骤3切变检测。采用亮度帧差作为切变检测特征,具体过程描述如下: (1)在一个窗口中计算得到15个相邻帧间的亮度帧间差; (2)计算这15个帧间亮度差值的平均值VDiff_15av;(3)计算15个亮度帧差到该视频段亮度帧差均值VDiff_15av的距离VDist(i); (4)计算切变检测的高阈值(Th_shot)和低阈值(Tl_shot); (5)依次比较当前相邻帧差与该视频段亮度帧差均值VDiff_15av,同时比较各VDist (i)与切变的高阈值Th_shot和低阈值Tl_shot,若满足判定条件,则发生切变,否则,移窗,转(I) O 所述切变的判别条件为: (1)视频段中第j个亮度帧差大于该视频段亮度帧差均值,且第j-Ι和第j+ι个亮度帧差小于均值; (2)视频段中第j个亮度...

【专利技术属性】
技术研发人员:罗森林谢尔曼潘丽敏马舒洁高晓芳吕英
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1