一种广告视频检测方法技术

技术编号:8022436 阅读:138 留言:0更新日期:2012-11-29 04:40
本发明专利技术公开了一种广告视频检测方法,首先,提取不少于一个的广告视频和不少于一个的非广告视频,建立视频训练集,提取每个视频的不少于一个的音频特征,将所有所述音频特征作为输入样本进行支持向量机训练;输入待检测视频,提取待检测视频的不少于一个的音频特征;输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果;根据所述计算结果判断视频检测结果,将所述检测结果输出。本发明专利技术能够有效克服现有技术的不足,为快速的检测和过滤广告视频段提供方法和依据。

【技术实现步骤摘要】

本专利技术涉及视频检测与视频检测
,尤其涉及。
技术介绍
随着信息时代的发展,作为商业信息的主要载体和传播媒介,广告视频在人们的日常生活的信息交互中占据着越来越重要的作用。对于普通的视频浏览人员来说,他们对广告视频没有兴趣。因此他们可以借助广告检测系统,可以迅速的定位到广告视频部分,从而可以进行相关的操作,比如删除一段视频节目中对于他们毫无意义的广告视频部分,从而保留电视节目内容。这样一方面可以节省他们观看视频的时间,另一方面也可以节省存储视频数据的空间。但是面对如此浩瀚的视频数据,如何快速的检测和过滤相关的广告视频段的问题亟需解决。因此人们提出了广告视频检测系统,利用它可以自动的快速定位广 告视频段。经过近些年的研究,广告视频检测从最初的简单的基于black/silent (黑色/无声)帧发展到现今的基于镜头特征的检测,从最初的仅仅考虑视觉方面的特征检测发展到如今的音频和视频特征相结合的检测。针对广告视频和普通节目视频之间的特征区别,人们提出了很多的广告检测算法。根据检测算法基于的特征不同,现在的比较实用的广告视频系统的检测算法大体上可以分成以下两类(I)基于标识的方法(Logo-based methods)此方法是最早的广告视频检测方法。该方法主要利用电视台的台标进行检测。电视台在播放普通电视节目时会将自己的台标显示出来,而播放广告时一般就会隐去台标,这使得我们可以通过检测台标的存在与否来区分广告视频和普通电视节目视频。台标一般分为三种静态台标、半透明台标和动态台标。针对不同形态的台标,都有相应的检测方法,从而实现对广告视频的检测。其中对于静态台标的研究是比较深入的,而且应用得很广泛。但是对于半透明台标和动态台标,检测起来比较困难,所以还没有比较成熟的检测方法。另夕卜,现在很多电台在播放广告视频的时候也会将台标显示出来,这时基于标识的检测方法就会失效。(2)基于规则的方法(Rule-based methods)基于规则的方法大多是利用广告镜头的信息来进行检测的,它是通过一组特征和规则来区分广告和普通电视节目视频。由于广告视频和普通电视节目视频在某些特征方面存在着比较明显的差异,因此利用这些区分性比较强的特征,就可以实现对广告视频的检测。在视频方面可以通过提取一段视频帧的平均边缘变化率A-ECR(AVerage ofEdge Change Ratio)和边缘变化方差 V-ECR(Variance of Change Ratio)以及平均巾贞差A-FD (Average of Frame Difference)和中贞方差 V-FD (Variance of Frame Difference)来实现检测。在音频方面,广告视频的音频内容和普通电视节目的音频内容也存在一些明显的特征上的区别,比如可以利用音频多维频率普系数(Mel-frequency CepstralCoefficient)和音频信息熵来实现对广告视频的分割检测。但是在以往的研究中音频方面的特征一般都用于辅助视频特征检测方面,通过两者的结合才能实现对广告段更加精确的分割检测。
技术实现思路
本专利技术的目的是在于提出,能够大量减少视频检测和编辑领域的工作人员的工作量,提高视频检测速度和检测的精确度。本专利技术提供了,包括以下步骤步骤A、提取不少于一个的广告视频和不少于一个的非广告视频,建立视频训练集,提取每个视频的不少于一个的音频特征,将所有所述音频特征作为输入样本进行支持向量机训练; 步骤B、输入待检测视频,提取待检测视频的不少于一个的音频特征;步骤C、输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果;步骤D、根据所述计算结果判断视频检测结果,将所述检测结果输出。进一步地,步骤A和步骤B中,提取视频的不少于一个的音频特征,还包括以下步骤使用解码工具对视频进行解码,得到视频图像集合和音频信息,将所述音频信息以数组形式保存;将所述视频图像集合分割为不少于一个的镜头,提取每个镜头的音频特征;进一步地,所述将所述视频图像集合分割成不少于一个的镜头,还包括以下步骤提取所有视频图像的颜色直方图,计算两个相邻视频图像的颜色直方图的相似值,作为帧间相似值;根据所述视频的帧间相似值、预设的第一阈值、预设的第二阈值和预设的渐变镜头长度第三阈值,确定镜头边界序列。进一步地,所述提取所有视频图像的颜色直方图,计算帧间相似值,还包括以下步骤对视频图像进行分块,共分为MXN块,其中M是列数,N是行数;对图像的每一个图像块在HSV颜色空间上提取颜色直方图,其中把亮度量化为I个区间,把色调量化为16个区间,把色饱和度量化为8个区间,每一帧图像得到MXN个有16X8X I = 128个bin的颜色直方图,并对得到的颜色直方图进行归一化;采用下面的公式计算两个相邻视频图像的颜色直方图的相似值 权利要求1.,其特征在于,包括以下步骤 A、提取不少于一个的广告视频和不少于一个的非广告视频,建立视频训练集,提取每个视频的不少于一个的音频特征,将所有所述音频特征作为输入样本进行支持向量机训练; B、输入待检测视频,提取待检测视频的不少于一个的音频特征; C、输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果; D、根据所述计算结果判断视频检测结果,将所述检测结果输出。2.根据权利要求I所述,其特征在于,步骤A和步骤B中,提取视频的不少于一个的音频特征,进一步包括以下步骤 使用解码工具对视频进行解码,得到视频图像集合和音频信息,将所述音频信息以数组形式保存; 将所述视频图像集合分割为不少于一个的镜头,提取每个镜头的音频特征。3.根据权利要求2所述,其特征在于,将所述视频图像集合分割成不少于一个的镜头,进一步包括以下步骤 提取所有视频图像的颜色直方图,计算两个相邻视频图像的颜色直方图的相似值,作为视频的帧间相似值; 根据所述视频的帧间相似值、预设的第一阈值、预设的第二阈值和预设的渐变镜头长度第三阈值,确定镜头边界序列。4.根据权利要求3所述,其特征在于,提取所有视频图像的颜色直方图,计算帧间相似值,进一步包括以下步骤 对视频图像进行分块,共分为MXN块,其中M是列数,N是行数; 对图像的每一个图像块在HSV颜色空间上提取颜色直方图,其中把亮度量化为I个区间,把色调量化为16个区间,把色饱和度量化为8个区间,每一帧图像得到MXN个有16X8X I = 128个bin的颜色直方图,并对得到的颜色直方图进行归一化; 采用下面的公式计算两个相邻视频图像的颜色直方图的相似值 M M 128tmn(Hu(p,qJX Hb (p, q,i)), M Np=I q=l i=l 其中^^&二匕^为处于第口列第^行的块的权重七⑦乂丨)是第a帧的第pXq ^j=I ^=I _____个块的颜色直方图的第i个bin的值,a和b为视频图像帧的序号,min函数是求取两个值中较小的值。5.根据权利要求3所述,其特征在于,根据整个视频的帧间相似值、预设的第一阈值、预设的第二阈值和预设的渐变镜头长度第三阈值,确定镜头边界序列,进一步包括以下步骤 输入整个视频序列的帧间相似值序列S=Is1, S2, , sj ,预设高阈值Th,预设低阈值本文档来自技高网
...

【技术保护点】
一种广告视频检测方法,其特征在于,包括以下步骤:A、提取不少于一个的广告视频和不少于一个的非广告视频,建立视频训练集,提取每个视频的不少于一个的音频特征,将所有所述音频特征作为输入样本进行支持向量机训练;B、输入待检测视频,提取待检测视频的不少于一个的音频特征;C、输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果;D、根据所述计算结果判断视频检测结果,将所述检测结果输出。

【技术特征摘要】

【专利技术属性】
技术研发人员:王建超
申请(专利权)人:天脉聚源北京传媒科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1