一种高满意度视频摘要生成方法技术

技术编号：8801170 阅读：152 留言：0更新日期：2013-06-13 05:50

本发明专利技术涉及一种高满意度视频摘要生成方法。本发明专利技术基于视频数据结构的特点，设计、实现了一种基于镜头聚类的视频摘要系统，该系统主要功能包括：多类型视频文件的编解码和播放，镜头边界检测，关键帧提取，镜头聚类，静态视频摘要，用户输入时间动态摘要的生成等。本发明专利技术适合多媒体文件管理、视频检索、影视库建设等应用场合。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及，属于多媒体信息处理领域，具体来说，属于视频信息处理领域。
技术介绍
随着数字视频资源数量的迅速增加，表示、理解和提取视频结构来提供视频内容浏览和检索服务变得十分重要。其中，基于内容的视频分析技术就是其主要任务。基于内容的视频分析是指使用计算机对包含图像和声音的视频数据进行语义上的分析和理解。它的快速发展产生了很多新的相关技术研究成果和应用。在这些新兴的研究领域中，有一些应用和研究针对的问题是如何利用对视频内容的分析来减小视频存储、分类和索引的代价，以及如何提高视频的使用效率，可用性和可访问性。这就是视频摘要技术。视频摘要技术是以自动或半自动的方式对视频的结构和内容进行分析，从原视频中提取出有意义的部分，并将它们以某种方式进行组合，形成简洁的能够充分表现视频语义内容的概要。它是对长视频内容的简短总结，通常用一段静态或者动态的图像序列来表示，并对原始信息予以保留[2]。因此它可以提供给人们一个有关原始视频基本内容的较为精练的信息，其内容可以概括原始视频的主要内容，但其长度却要比原始视频短得多。目前视频摘要的生成方法大致可以分为四类:1.简单的生成方法。主要有两种。一是基于时间对视频进行采样，即每隔一段时间抽取一个代表帧或者一个片段；二是快速回放的方法，通过加快帧率达到缩短播放时间的目的。这两种方法比较简单，但完全没有基于视频的内容，效果很不可靠。2.基于视觉信息的生成方法。根据视频中颜色、纹理、形状、运动方向和强度等视觉信息，应用各种视频和图像处理技术，进行镜头探测、关键帧提取、场景聚类、运动特征提取等一系列操作，最终生成具有代表性的关键帧序...

【技术保护点】
一种基于镜头聚类的高理解度视频摘要系统，其特征在于，所述方法包括以下步骤：步骤1，镜头检测。步骤2，提取每个镜头的关键帧。步骤3，将所有镜头按照视觉相似性分组。步骤4，从镜头组中提取代表帧作为静态摘要。步骤5，动态摘要生成。

【技术特征摘要】
1.一种基于镜头聚类的高理解度视频摘要系统，其特征在于，所述方法包括以下步骤: 步骤I，镜头检测。步骤2，提取每个镜头的关键帧。步骤3，将所有镜头按照视觉相似性分组。步骤4，从镜头组中提取代表帧作为静态摘要。步骤5，动态摘要生成。2.根据权利要求1所述的方法，其特征在于，所述镜头检测方法的具体步骤为: 步骤I图像预处理。即对图像进行中值滤波预处理，提高检测的准确度。步骤2闪光检测。采用基于亮度帧差的方法，整体过程如图2所示，具体方法如下: (1)在一个窗口中取16帧图像，计算得到15个相邻帧间的亮度帧间差； (2)计算这15个帧间亮度差值的平均值，记为VDiff_avl5； (3)获取闪光检测的阈值，T_fIush=σ XVDiff_avl5，选取σ =5.5 ； (4)依次比较帧间差与T_flush的大小；定义当前帧差为第η帧和第η+1帧的帧间差，若当前帧差大于T_f lush，且下一相邻帧差也大于T_f lush，则判定第η+1帧处有闪光发生；否则，没有闪光发生。步骤3切变检测。采用亮度帧差作为切变检测特征，具体过程描述如下: (1)在一个窗口中计算得到15个相邻帧间的亮度帧间差； (2)计算这15个帧间亮度差值的平均值VDiff_15av；(3)计算15个亮度帧差到该视频段亮度帧差均值VDiff_15av的距离VDist(i)； (4)计算切变检测的高阈值(Th_shot)和低阈值(Tl_shot)； (5)依次比较当前相邻帧差与该视频段亮度帧差均值VDiff_15av，同时比较各VDist (i)与切变的高阈值Th_shot和低阈值Tl_shot，若满足判定条件，则发生切变，否则，移窗，转(I) O 所述切变的判别条件为: (1)视频段中第j个亮度帧差大于该视频段亮度帧差均值，且第j-Ι和第j+ι个亮度帧差小于均值； (2)视频段中第j个亮度...

【专利技术属性】
技术研发人员：罗森林，谢尔曼，潘丽敏，马舒洁，高晓芳，吕英，
申请(专利权)人：北京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人