基于语义关联的内容检索制造技术

技术编号:2856427 阅读:188 留言:0更新日期:2012-04-11 18:40
一种多媒体系统,包括:    查询模块,能够生成多种媒体形态的查询;    数据库,能够存储表示多种媒体形态的数据;    对象检测模块,能够从该查询中提取第一组对象特征并且从该数据库中提取第二组对象特征,其中第一组对象特征和第二组对象特征是从表示不同形态的媒体中提取的;    处理器,耦合至该对象检测模块,    其中该处理器被设置来确定第一组对象特征和第二组对象特征之间的相关性,以及从该数据库中检索那些相关性至少等于预定的最大相关度的项目。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术致力于多媒体数据检索领域。尤其是致力于这样一种方法和系统,其使用户查询一种媒体形态(modality)的多媒体档案(archive)并且自动检索另一种媒体形态的相关数据,而不需要人工地通过数据结构来关联数据项。本申请引入了受让人的在2002年2月14日提交的,专利技术人为M.Li、D.Li以及N.Dimitrova,序号为10/076,194,并且题目为“Speaking Face Detection in TV Domain”的申请,以供参考。这Li的申请为本专利技术提供了
技术介绍
。在过去的十年中,多媒体应用的数目已经按指数规律增长,并且多媒体内容量也在继续剧增。增强的计算能力、万维网的发展以及更紧凑和廉价的存储介质的可用性都加速了此增长。自然而然地,也导致了在基于多媒体内容的检索方面增长的兴趣,反映出了这些现象。然而,现有的检索多媒体内容的方式是有限的。例如,为了查询多媒体数据库以便检索图像,所述查询必须结合图像的形式。例如将瀑布的声音用作查询来检索瀑布的图像就是是不可能的。除了通过关键字进行基本的交叉媒体检索以外,检索仍然是被限制在单个多媒体域。序列号为10/0本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种多媒体系统,包括查询模块,能够生成多种媒体形态的查询;数据库,能够存储表示多种媒体形态的数据;对象检测模块,能够从该查询中提取第一组对象特征并且从该数据库中提取第二组对象特征,其中第一组对象特征和第二组对象特征是从表示不同形态的媒体中提取的;处理器,耦合至该对象检测模块,其中该处理器被设置来确定第一组对象特征和第二组对象特征之间的相关性,以及从该数据库中检索那些相关性至少等于预定的最大相关度的项目。2.如权利要求1所述的系统,其中在检索之前,该系统被使用采样数据来加以训练以使交叉形态媒体相关。3.如权利要求1所述的系统,其中该相关性是使用正则相关方法来计算的。4.如权利要求1所述的系统,其中该相关性是使用潜在语义索引方法来计算的。5.如权利要求2所述的系统,其中该训练产生正交矩阵A=Cxx-1/2U和B=Cyy-1/2V其中,det(A)=det(B)=1,Cxx=E{(X-mx)(X-mx)T},Cyy=E{(Y-my)(Y-my)T},Cxy=E(X-mx)(Y-my)T},K=Cxx-1/2·Cxy·Cyy-1/2=U·S·VT,并且表示第一形态中第一特征集的AX和表示第二形态中第二特征集的BY之间的相关性最大,由此使特征能够从该第一形态转换到第二形态。6.如权利要求5所述的系统,其中,由于BY与AX之间具有最大相关性,所以表示第一特征集的查询-AX可以仅仅用给定的、表示第二特征集的查询结果-BY来标识。7.一种从多媒体档案检索用户感兴趣的至少一项目的方法,包括如下步骤生成查询;从该查询中提取第一组对象特征,该对象特征表示第一形态;从所述多媒体档案中的项目中提取第二组对象特征,该对象特征表示第二形态;确定该第一组对象特征和第二组对象特征之间的相关性;从该档案中检索那些与在所述查询中的对象特征之间的相关性至少等于预定的最大相关度的项目。8.如权利要求7所述的方法,还包括使用采样数据来生成相关矩阵的步骤,该相关矩阵用于使交叉形态媒体相关。9.如权利要求7所述的方法,其中该相关方法是正则相关。10.如权利要求7所述的方法,其中该相关方法是潜在语义索引。11.如权利要求7所述的方法,其中所生成的矩阵表示为A=Cxx-1/2U并且B=Cyy-1/2V,其中,det(A)=det(B)=1,Cxx=E{(X-mx)(X-mx)T},Cyy=E{(Y-my)(Y-my)T},Cxy=E(X-mx)(Y-my)T},K=Cxx-1/2·Cxy·Cyy-1/2=U·S·VT,并且表示第一形态中第一特征集的AX和表示第二形态中第二特征集的BY之间的相关性最大,由此使特征能够从第一形态转换到第二形态。12.如权利要求11所述的方法,其中由于BY与AX之间具有最大相关性,所以表示第一特征集的查询-AX可以仅仅用给定的、表示第二特征集的查询结果-BY来标识。13.计算机可执行的处理步骤,该计算机可执行处理步骤被存储在计算机可读介质上,以使用户能够从多媒体数据库中检索感兴趣的媒体,包括查询生成步骤,用于获得来自于用户的查询,该查询采用第一媒体形态;第一提取步骤,用于从该查询中提取第一组对象特征;第二提取步骤,用于从所述多媒体档案的项目中提取第二组对象特征,该对象特征表示第二媒体形态;相关性计算步骤,用于确定该第一组对象特征和第二组对象特征之间的相关性;检索步骤,用于从该数据库中检索那些与在所述查询中的对象特征之间的相关性至少等于预定的...

【专利技术属性】
技术研发人员:D·李N·迪米特罗瓦
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1