视频高层特征检索系统及其实现技术方案

技术编号：3854963 阅读：295 留言：0更新日期：2012-04-11 18:40

本发明专利技术提出了一个基于颜色、边缘、纹理、特征点等多种底层特征和支持向量机（ＳＶＭ）的视频高层特征检索系统。首先对视频片段进行镜头边界检测，然后等间隔抽取镜头中有代表性的几帧作为关键帧。对于抽取出的关键帧，我们提取了基于颜色、边缘、纹理、以及特征点的多种鲁棒性底层特征。多类底层特征的采用为视频的高层语义特征提供了多方面的描述，由于它们具有很强的互补性，对于不同的语义概念能够分别显示出很强的区分力，这就使得系统对于各中不同概念的检测性能都能得到有效的保证。然后所提取特征被分别送到支持向量机（ＳＶＭ）中进行分类，形成多支子系统。在概念分类阶段我们选择了支持向量机（ＳＶＭ）作为分类器，并且首次使用了基于稠密最近邻（Ｃｏｎｄｅｎｓｅｄ　Ｎｅａｒｅｓｔ　Ｎｅｉｇｈｂｏｒ）的方法选取训练参数，有效解决了训练过程中普遍存在的正负样本不均衡问题。为了充分利用多个子系统提供的描述信息，对于多支系统的分类得分，我们采用了两级融合策略，并引入了逻辑回归（Ｌｏｇｉｓｔｉｃ　Ｒｅｇｒｅｓｓｉｏｎ）的方法来学习到最佳的融合策略，使得融合系统的准确率与召回率大大提高。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于视频检索
，具体涉及一种基于内容的视频镜头检索方法。其实质是抽取镜头中的关键帧信息，对其进行多类特征提取，并分别用支撑向量机(SVM)计算所查询内容的匹配度，形成多个子系统。本专利技术提出了一种基于逻辑回归(Logistic Regression) 的得分融合方式，在此基础上得到了统一的高准确率的视频高层特征检索系统。
技术介绍
多媒体技术和互联网的发展给人们带来巨大的多媒体信息海洋，而IPTV、视频网站的的迅速崛起进一步导致了视频图片等多媒体信息的爆炸性增长，传统的基于文本关键词的检索方式已经无法满足多媒体信息描述和信息库整理的需要。如何找到一种新的检索方式，有效的帮助人们快速、准确地找到所需要的多媒体信息，成了多媒体信息库所要解决的核心问题。基于内容的视频信息检索(Content-Based Retrieval)是一种新的检索技术，是当前多媒体数据库发展的一个重要研究领域，它通过对非结构化的视频数据进行结构化分析和处理，采用视频分割技术，将连续的视频流划分为具有特定语义的镜头，作为检索的基本单元，在此基础上进行关键帧(keyframe)的抽取，形成描述镜头的特征索引，对图像中的颜色、形状、纹理，或视频中的场景、片断进行分析和特征提取，并基于这些特征进行相似性匹配。在基于内容的视频图像检索中，之前主要研究的是图像的视觉和形象特征，我们称之为底层特征，包括颜色、纹理、形状以及在此基础上形成的空间关系等方面，以图像的底层视觉和形象特征为索引对图像进行检索具有计算简单、性能稳定的特点，但目前这些特征都有一定的局限...

【技术保护点】
一个基于视频高层特征检索系统的实现方法，其特征在于包括以下步骤：　第一步，对体育视频进行镜头切割，关键帧提取；　第二步，对于关键帧的颜色、边缘、纹理和特征点等多种低层图像特征的提取；　第三步，对低层特征采用ＳＶＭ分类器进行打分；　第四步，融合各种低层特征得到的多个子系统，形成最终系统。

【技术特征摘要】

【专利技术属性】
技术研发人员：董远，刘继晴，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：11[]

全部详细技术资料下载我是这个专利的主人