当前位置: 首页 > 专利查询>天津大学专利>正文

面向网络查询基于多图融合视频主题分类与描述方法技术

技术编号:14882354 阅读:117 留言:0更新日期:2017-03-24 04:46
本发明专利技术属于视频处理技术领域,为根据多视频数据的特点,实现视频的事件检测,形成对事件的文本描述,实现面向网络查询的基于内容的视频主题分类与描述。本发明专利技术采用的技术方案是,面向网络查询基于多图融合视频主题分类与描述方法,步骤是,1)结合视频的文本信息和视觉信息,通过构建多图模型,利用图切方法实现事件的分类。2)利用tf‑idf或者word vector技术提取视频事件的关键词,并对关键词利用来自维基百科等网站关于该话题的先验信息进行修改,使之完善,实现对事件的文本描述。本发明专利技术主要应用于视频分类场合。

【技术实现步骤摘要】

本专利技术属于视频处理
本专利技术针对多媒体领域存在大量的视频数据,不易于用户获取所需的信息等特点,提供了一种实现同一查询结果中多个视频的主题分类方法,并在此基础上对事件下的主题提取相应的关键词进行描述,实现面向网络查询的视频主题的分类与描述。
技术介绍
随着信息技术的快速发展,视频数据大量涌现,成为人们获取信息的重要途径之一。然而,由于视频数量的剧增,大量视频数据中出现冗余和重复的信息。面对大量的网页视频,用户想要获取正确的信息变得极其困难。当搜索相关事件的话题时,大部分用户感兴趣的是该话题的主要话题事件以及它们的发展。然而从大量的视频搜索结果中追踪事件的进展是非常难的。因此,在这种情况下,迫切需要一种能对同一主题下的海量视频数据进行整合、分析的技术,来满足人们想要快捷、准确地浏览视频主要信息的需求,提高人们获取信息的能力。一般地,一个新闻话题是由发生在特定的时间、特定的地方、具有共同的关注点的一系列相关事件组成。而事件是由一些具有判别性、代表性的词所描述。在过去的几十年中,为了提高视频数据的管理效率,使用户能够快速、准确地获取他们想要的信息,相关研究者针对视频数据信息的性质,提出了一些对网络视频进行分类和描述的方法,但该技术仍处于初步阶段。这主要是由于以下原因:1)由于视觉特征存在语义鸿沟,较难从视觉上对事件进行分类,这就需要结合视频的文本信息实现视频事件的分类。然而由于用户上传的文本信息是有限的,而且通常有噪音的、模糊的、不完全的甚至是具有误导性的,因此利用文本信息对事件分类和描述时具有一定的误差。2)另外,tag信息只是针对整个视频进行描述,并不是对某一具体的视频场景或镜头进行描述,且对于较长的视频存在主题多样性的特点,这给视频的分类带来一定的困难。近年来,随着多媒体技术的发展,相关研究者针对多视频主题分类与描述问题提出了一些应对方法。其中,探索网络视频的事件结构是一类经典方法。该方法首先利用共现分析(co-occurrence)模型分析视频的文本特征探索事件的文本模式。然后通过转移闭包分类事件,并且从文本的角度,给予事件描述。最后利用视频的近似重复帧检测检测视频的主要事件。并将具有相似的视觉和文本性质的事件融合,实现事件的探索和描述。尽管该方法在事件探索的效果上有了一定的提升,但该方法分别从视觉和文本的角度探索事件,没有同时利用多种模态检测事件的结构,在检测的过程中未利用视频的多模态信息相互补充的优势。本专利技术提出了多图模型,通过多图融合,利用图割的方法实现视频分类。并利用tf-idf提取每类事件的关键词,对事件进行描述。在该方案中充分利用了视频多模态信息互补的优势,较好地实现面向网络查询的基于多图融合的视频主题分类与描述。
技术实现思路
为克服现有技术的不足,本专利技术旨在提出一种面向网络查询的基于内容的视频主题分类与描述。根据多视频数据的特点,实现视频的事件检测,形成对事件的文本描述,实现面向网络查询的基于内容的视频主题分类与描述。本专利技术采用的技术方案是,面向网络查询基于多图融合视频主题分类与描述方法,步骤是,1)结合视频的文本信息和视觉信息,通过构建多图模型,利用图切方法实现事件的分类。2)利用词频tf-逆向文件频率idf或者文本深度表示模型word2vector提取视频事件的关键词,并对关键词利用来自维基百科等网站关于该话题的先验信息进行修改,使之完善,实现对事件的文本描述。一个实例中的具体步骤是,首先给定一个话题查询,然后从维基百科等相关网站上搜索相关内容,获取与该话题有关的先验信息:给定同一事件下的M个视频,用T={t1,t2,...,tM本文档来自技高网
...
面向网络查询基于多图融合视频主题分类与描述方法

【技术保护点】
一种面向网络查询基于多图融合视频主题分类与描述方法,其特征是,步骤是,1)结合视频的文本信息和视觉信息,通过构建多图模型,利用图切方法实现事件的分类;2)利用词频tf‑逆向文件频率idf或者文本深度表示模型word2vector提取视频事件的关键词,并对关键词利用来自维基百科等网站关于该话题的先验信息进行修改,使之完善,实现对事件的文本描述。

【技术特征摘要】
1.一种面向网络查询基于多图融合视频主题分类与描述方法,其特征是,步骤是,1)结合视频的文本信息和视觉信息,通过构建多图模型,利用图切方法实现事件的分类;2)利用词频tf-逆向文件频率idf或者文本深度表示模型word2vector提取视频事件的关键词,并对关键词利用来自维基百科等网站关于该话题的先...

【专利技术属性】
技术研发人员:冀中马亚茹
申请(专利权)人:天津大学
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1