基于判别相关分析的跨媒体检索方法技术

技术编号：7759622 阅读：238 留言：0更新日期：2012-09-14 02:13

本发明专利技术公开了一种基于判别相关分析的跨媒体检索方法，该方法包括以下步骤：建立跨媒体训练数据库，依次对其中不同模态样本进行特征提取、均值预处理和线性投影变换，并根据投影空间设定一目标函数；求解目标函数得到线性投影向量；建立跨媒体测试数据库；对待检索对象依次进行特征提取和均值预处理；使用所述线性投影向量对经均值预处理的特征数据进行线性投影变换；计算两模态数据投影变量之间的欧式距离，并进行升序排序，从而得到跨媒体检索结果。本发明专利技术方法能够对特征数据进行有效地降维，从而广泛地应用在其他很多多模态工作中，比如多模态生物特征识别。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别和机器学习领域，尤其是一种。
技术介绍
近年来，大量出现的多媒体数据呈现两个明显的特点高维度性和多源性，例如同一个语义概念可以由网络上的文字、图片、视频等多种内容来表示。此外，互联网用户还主要通过文本关键字搜索所需要的信息，这主要是因为搜索引擎无法理解不同模态媒体之间的相互关系，从而限制了搜索引擎的发展。特征降维揭示了高维数据在低维空间中的流形结构以及不同模态数据之间的相关性，在信息检索、模式分类，信息可视化等领域发挥了重大的作用。单模态数据的特征降维方法有很多，主成份分析(Principal ComponentAnalysis)把原始数据投影到具有最大方差的主方向上；线性判别分析(LinearDiscriminant Analysis, LDA)是一种有监督降维方法,在充分利用类别信息的条件下找到一个投影子空间，使得不同类别的特征具有最优的判别性；局部线性嵌入(LocallyLinear Embedding)是最早的非线性局部保留方法，每个数据点与其最近邻数据点的线性关系在投影空间中得以保留；LE(Laplacian Eigenmaps)在投影空间中保留了局部两个数据点的距离，LPP(Locality Preserving Projection)是其线性近似算法；多层自编码网络(Multilayer Autoencoder Network)是主成份分析方法的非线性扩展。有研究工作指出，虽然非线性方法处理模拟数据性能很好，但是对于现实数据却不一定比传统的主成份分析方法好，而且以上提到的这些方法均不能直接应用于多模态跨媒体检索。多模...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：谭铁牛，王亮，王威，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人