一种镜头边界检测方法技术

技术编号:8453492 阅读:197 留言:0更新日期:2013-03-21 19:14
本发明专利技术提供了一种镜头边界检测方法,属于视频检索领域。所述方法基于上下文特征向量和禁忌搜索算法优化支持向量机实现镜头边界检测,包括以下步骤:(1)提取视频数据的底层特征;(2)计算几种特定间隔下视频序列帧的帧间差,将其组成几种滑动窗口下的上下文特征向量;(3)使用禁忌搜索算法优化支持向量机分类模型;(4)利用得到的近似最优参数训练得到最优分类模型,并以此为基础对视频序列帧进行分类,最终完成镜头分割。本发明专利技术方法避免了传统支持向量机选取参数时的盲目性和低效率,能够一次性准确地得到近似最优参数,而且能够保证不陷入局部最优的麻烦。

【技术实现步骤摘要】

本专利技术属于视频检索领域,具体涉及。
技术介绍
在视频检索的过程中,镜头边界检测是整个系统的第一步,镜头边界检测的准确度和效率的高低,关系到整个视频检索系统的成败,是视频检索系统中至关重要的一步。镜头边界检测的任务就是通过比较视频序列帧的差异来寻找镜头边界,确定镜头变化类型和位置。目前,该领域内解决镜头边界检测的方法主要是基于阈值和基于机器学习的。基于阈值的方法由于阈值选取的好坏对检测效果有较大的影响;而且不同的视频阈值差异很大。这些都限制了阈值方法更进一步提高效果。近年来,基于机器学习的镜头边界检测方法得到了深入研究。文献《Temporal videosegmentation using unsupervisedclustering and semantic object tracking》(作者Bilge Gunsel, A. Mufit Ferman,A. Murat Tekalp, J. Electron.1maging 7 (3), 1998, 592-604)中,提取颜色直方图特征并计算相邻帧的帧间差异,接着采用K均值聚类算法对视频的序列帧进行分类。文献《Supervisedclassification for video shot segmentation 》(作者Y Qi, HauptmannAT Liu, IEEE ICME03。Baltimore, MD, USA, 2003, vol. 2,689-692)中,采用 k 最近邻域分类、Naive Bayes可能性分类法和支持向量机将视频序列帧分成切变帧和非切变帧;对非切变帧,又采用小波光滑去噪的方法来检测渐变帧,从而完成镜头边界的分割。文献((Algorithm for Shot Boundary Detection basedon Support Vector Machine inCompressed Domain》(作者Jian-Rong Caoand An-Ni Cai,在 Tien Tzu Hsueh Pao/ActaElectronica Sinica,36(l) =203-208,2008)中提出,利用滑动窗口的方法将提取到的压缩域特征组成一个多维的特征向量,对SVM进行训练,使用训练好的SVM模型对视频帧进行分类,从而得到镜头的边界。但是,支持向量机参数的选取至今仍然没有一个统一的标准,参数选取大多依靠经验采取试凑的方法,这样不仅费时而且很难得到满意的结果;此外,对于镜头边界检测中对于长渐变镜头的检测一直明显存在的漏检问题也没有很好的方法。。
技术实现思路
本专利技术的目的在于解决上述现有技术中存在的难题,提供,使用禁忌搜索算法对支持向量机的参数进行优化,综合使用上下文特征向量和基于禁忌搜索优化的支持向量机分类模型,降低参数选择的盲目性和不准确,而且对于检测各类镜头突变和渐变十分稳定和准确。本专利技术是通过以下技术方案实现的—种镜头边界检测方法,基于上下文特征向量和禁忌搜索算法优化支持向量机实现镜头边界检测。所述方法包括以下步骤(I),提取视频数据的底层特征提取全局颜色直方图和小波纹理特征;(2),计算几种特定间隔下视频序列帧的帧间差,将其组成几种滑动窗口下的上下文特征向量;(3),使用禁忌搜索算法优化支持向量机分类模型;(4),利用得到的近似最优参数训练得到最优分类模型,并以此为基础对视频序列帧进行分类,最终完成镜头分割;所述近似最优参数包括惩罚因子C和核函数参数Y。所述步骤(I)中的提取全局颜色直方图是这样实现的通过计算每个颜色区间的像素值个数来统计得到;对于原始的视频序列帧,需要提取并计算每一个通道下的颜色直方图区间值,采用X 2距离来计算帧间差异值,根据下式进行权利要求1.,其特征在于所述方法基于上下文特征向量和禁忌搜索算法优化支持向量机实现镜头边界检测。2.根据权利要求I所述的镜头边界检测方法,其特征在于 所述方法包括以下步骤 (1),提取视频数据的底层特征提取全局颜色直方图和小波纹理特征; (2),计算几种特定间隔下视频序列帧的帧间差,将其组成几种滑动窗口下的上下文特征向量; (3),使用禁忌搜索算法优化支持向量机分类模型; (4),利用得到的近似最优参数训练得到最优分类模型,并以此为基础对视频序列帧进行分类,最终完成镜头分割;所述近似最优参数包括惩罚因子C和核函数参数Y。3.根据权利要求2所述的镜头边界检测方法,其特征在于所述步骤(I)中的提取全局颜色直方图是这样实现的通过计算每个颜色区间的像素值个数来统计得到;对于原始的视频序列帧,需要提取并计算每一个通道下的颜色直方图区间值,采用X2距离来计算帧间差异值,根据下式进行4.根据权利要求2所述的镜头边界检测方法,其特征在于所述步骤(I)中的提取小波纹理特征是这样实现的 首先,使用三层小波变换对原始帧进行分解,分解得到的结果如下5.根据权利要求2所述的镜头边界检测方法,其特征在于所述步骤(3)具体如下 (3.A),初始解和适应度函数(C(I,Ytl)代表随机产生的一个初始解,采用f(c,y)=accuracy作为适应度函数来计算适应度值,式中的c和、分别是支持向量机中的惩罚因子和核函数参数; (3. B),邻域解和禁忌对象在初始解(C(l,Y0)周围能够得到很多组邻域解(C,Y),通过初始预测每组解都会得到一个相应的适应度值;邻域解的生成策略是以初始解为中心,根据划定的一个预定范围在其中随机生成一定变化步长的解;适应度值的计算应用了支持向量机的交叉验证策略; (3. C),候选集生成每一代根据适应度值的情况从邻域解中选取; (3. D),禁忌表的生成每代中最好的解都放入到禁忌表中,在接下来若干代的迭代中所述最好的解被禁忌使用; (3. E),对禁忌表中的解的特赦如果禁忌解对应的适应度值比到现在为止最好的适应度值更大,那么允许其从禁忌表中逃逸;另外,每隔若干代的迭代,之前放入到禁忌表中的最优解也会被释放出来; (3. F),如果达到最大迭代次数或者得到了足够好的适应度解,则停止迭代)。6.根据权利要求2所述的镜头边界检测方法,其特征在于所述步骤(4)是这样实现的 使用支持向量机的分类函数svmpredict,将测试集的所有数据划分为三类,分别对应突变帧、渐变帧和普通帧,这样也就完成了镜头分割。全文摘要本专利技术提供了,属于视频检索领域。所述方法基于上下文特征向量和禁忌搜索算法优化支持向量机实现镜头边界检测,包括以下步骤(1)提取视频数据的底层特征;(2)计算几种特定间隔下视频序列帧的帧间差,将其组成几种滑动窗口下的上下文特征向量;(3)使用禁忌搜索算法优化支持向量机分类模型;(4)利用得到的近似最优参数训练得到最优分类模型,并以此为基础对视频序列帧进行分类,最终完成镜头分割。本专利技术方法避免了传统支持向量机选取参数时的盲目性和低效率,能够一次性准确地得到近似最优参数,而且能够保证不陷入局部最优的麻烦。文档编号G06K9/62GK102982553SQ201210574509公开日2013年3月20日 申请日期2012年12月21日 优先权日2012年12月21日专利技术者孙学梅, 赵龙 申请人:天津工业大学本文档来自技高网
...

【技术保护点】
一种镜头边界检测方法,其特征在于:所述方法基于上下文特征向量和禁忌搜索算法优化支持向量机实现镜头边界检测。

【技术特征摘要】

【专利技术属性】
技术研发人员:孙学梅赵龙
申请(专利权)人:天津工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1