【技术实现步骤摘要】
本专利技术涉及多媒体检索,尤其涉及一种。
技术介绍
基于内容的多媒体检索是计算机视觉和信息检索领域的研究热点,根据视觉、听觉或者几何等底层特征进行相似度匹配而实现检索。早在1976年,麦格克就已经揭示了人脑对外界信息的认知需要跨越和综合不同的感官信息,以形成整体性的理解。近期认知神经心理学方面的研究也进一步验证了人脑认知过程呈现出跨媒体的特性,来自视觉、听觉等不同感官的信息相互刺激、共同作用而产生认知结果。因此,目前迫切需要研究一种支持不同模态的跨媒体检索方法,突破传统基于内容的多媒体检索只作用于单模态数据的限制。基于内容的跨媒体检索技术是指通过对多媒体对象的底层特征进行分析,实现在检索过程中从一种模态到另一种模态的跨越,即用户提交一种模态的查询例子,系统返回与之相似的其他不同模态的多媒体对象,突破了单模态的图像检索、音频检索、三维图形检索等对单模态的限制。跨媒体检索是基于内容的多媒体分析与检索中一个新的研究领域,目前国际上还没有比较成熟的跨媒体检索算法和技术。90年代初期人们提出了基于内容的图像检索技术,从图像中提取底层的视觉特征,比如颜色、纹理、形状等底层 ...
【技术保护点】
一种基于内容相关性的跨媒体检索方法,其特征在于包括以下步骤:(1)从多媒体数据库采集不同模态的对象,即图像和音频数据;(2)提取图像数据的视觉特征,以及音频数据的听觉特征,采用典型相关性分析提取得到的视觉和听觉特征之间的典型 相关性;(3)采用同构子空间映射算法,将图像数据的视觉特征向量和音频数据的听觉特征向量同时映射到一个低维的同构子空间中,实现不同模态媒体数据的统一表达;(4)采用极坐标的方式定义通用距离函数,度量不同模态媒体数据间的相关性大 小,并以此为依据进行跨媒体检索;(5)基于增量学习的相关反馈机制,用 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:潘云鹤,庄越挺,吴飞,张鸿,
申请(专利权)人:浙江大学,
类型:发明
国别省市:86[中国|杭州]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。