基于多模态信息融合分析的跨媒体检索方法技术

技术编号：2844834 阅读：411 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于多模态信息融合分析的跨媒体检索方法。利用该方法可以对多模态信息融合分析进行多媒体语义理解，从而实现基于内容的多媒体文档检索、图像检索、声音检索和文本检索。用户可以通过提交任意的模态的检索例子去检索任意模态的媒体对象或者多媒体文档。比如为了检索图像，用户既可以提交图像作为检索例子进行检索，也可以提交声音或者文本或者它们的组合作为检索例子进行检索。由于该方法在进行多媒体语义理解的时候，不仅仅依靠关键字，而是将多媒体文档内全体媒体对象进行融合分析后综合各种模态媒体对象所携带的信息进行语义理解，因此检索效果更好；由于检索例子和返回结果可以是不同模态的，因此功能更强大，适用更广泛。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多媒体检索，尤其涉及一种。
技术介绍
多媒体文档是当前非常常见的文件类型，它由多个不同模态的媒体对象(包括音频、图像和文本等)组成，并具有一定的语义，如多媒体百科全书、网页和Microsoft PowerPoint格式的幻灯片等都属于多媒体文档。一般来说，多媒体文档具有两个特点。第一，组成结构复杂，多种模态的媒体对象同时存在于多媒体文档内部；第二，同一多媒体文档内部不同模态的媒体对象在语义上是互补的，多媒体文档的语义是由其内部所有媒体对象共同表达的。因此当某一种媒体对象具有二义性的时候，作为一个整体，多媒体文档的语义往往是明确的。由于传统的检索方法往往是针对单一模态媒体对象设计的，没有综合考虑多媒体文档内部各个模态媒体对象所蕴涵的互补信息，因此不能很好地综合分析多媒体文档内不同模态的各个媒体对象以理解多媒体语义，从而无法很好适应用户需求。目前，随着存储技术和网络技术的发展，包括文本，图片，声音片段以及多媒体文档等在内的可以被用户访问到的多媒体文件越来越多。检索技术可以帮助用户在海量的数据中快速找到自己需要的内容，成为计算机应用技术中越来越重要的领域。传统的检索技术可以分为基于关键字的检索和基于内容的检索。在基于关键字的检索系统中，需要事先对多媒体对象进行标注。但是由于目前存在的媒体对象数量巨大，因此标注过程工作量浩繁；而由于标注内容不可避免地受到标注者主观因素的影响，针对同一个多媒体对象，不同的标注者可能会标注不同的关键字，因此关键字往往不能完全客观地反映多媒体对象所蕴涵的全部语义。基于内容的检索系统则不需要对多媒体对象进行标注，用户可以...

【技术保护点】
一种基于多模态信息融合分析的跨媒体检索方法，其特征在于包括如下步骤：１）对多模态信息融合分析，进行多媒体语义理解；２）用户提交数据库内已有的或数据库以外的媒体对象作为查询例子进行检索；３）根据用户的相关反馈，进行二次检索；４）根据用户的相关反馈，对多媒体语义空间进行维护。

【技术特征摘要】
1.一种基于多模态信息融合分析的跨媒体检索方法，其特征在于包括如下步骤1)对多模态信息融合分析，进行多媒体语义理解；2)用户提交数据库内已有的或数据库以外的媒体对象作为查询例子进行检索；3)根据用户的相关反馈，进行二次检索；4)根据用户的相关反馈，对多媒体语义空间进行维护。2.根据权利要求1所述的一种基于多模态信息融合分析的跨媒体检索方法，其特征在于，所述的对多模态信息融合分析，进行多媒体语义理解，其步骤如下1)对数据库内所有音频片段提取均方根、截止频率、过零率和质心四个特征，利用动态时间伸缩算法计算所有音频片段两两之间的距离，并将所有的距离归一化；2)对数据库内所有的图像对象提取颜色和纹理特征，计算所有图像对象两两之间的欧氏距离，并将所有的距离归一化；3)对数据库内所有的文本媒体对象采用单文本词汇频率/逆文本频率方法进行矢量化，计算所有文本媒体对象两两之间的距离，并将所有的距离归一化；4)通过非线性的方法对每个多媒体文档内的声音对象，文本对象和图像对象所携带的信息进行融合分析，从而得到多媒体文档两两之间的距离；5)建立一个多媒体文档关联图。每个多媒体文档是该图上的一个顶点，任意两点之间有一条加权边，权重为步骤4所得到的这两个顶点所对应的多媒体文档之间的距离；6)重构多媒体文档关联图，方法是首先设定一个阈值，然后将权重大于这一阈值的边的权全部设为无穷大，然后对所有的边，用两点之间的最短路径作为该边的新权重；7)采用多向度量尺法将多媒体文档关联图投影到多媒体语义空间，该空间可以保持多媒体文档关联图的拓扑关系，所有的多媒体文档都在该空间内有唯一的坐标并被该坐标所指向；所有的媒体对象都被它们所属多媒体文档的坐标所指向。3.根据权利要求1所述的一种基于多模态信息融...

【专利技术属性】
技术研发人员：潘云鹤，庄越挺，吴飞，杨易，
申请(专利权)人：浙江大学，
类型：发明
国别省市：86[中国|杭州]

全部详细技术资料下载我是这个专利的主人