关联内容检索制造技术

技术编号:2836805 阅读:147 留言:0更新日期:2012-04-11 18:40
提供了一种检索系统。提取包括第一已标识内容项目的维度数据的第一说明数据。此处理可以对添加的可用已标识内容项目重复进行。提取备选说明数据。然后,可以生成每个备选内容项目的一组矢量值,每个矢量值表示第一说明数据的维度(例如,元数据、使用历史、流派、内容类型)的维度数据与备选说明数据的对应维度数据之间的相似度。可以基于由生成的这组矢量值所表示的相似度,从备选内容项目中选择相似的备选内容项目,并提供所述的相似备选内容项目。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及内容检索、管理和呈现的领域。
技术介绍
存储设备和数据库的存储容量,包括个人计算机上和其他类型存储介质上的硬盘,近年来已经快速地增大。存储容量估计大约每12个月增大一倍,同时网络带宽也在非常快速地增大。结果,存储设备存储了较大量的内容,而用户访问这些内容必须变得更为方便。没有按照对用户透明的方式编索引或组织的内容可能被“丢失”,这与用户所关心的需求相去甚远,并且这些内容不太可能被检索。另一方面,用户可以由于存储在存储设备或数据库上的内容而负担过重,并且不能检索网络(例如,因特网)上可用的内容,除非内容以某种方式进行管理或组织,以便为用户提供便利的访问。存在各种数据检索的方案。Platt的公开号为2003/0221541的美国专利公开了一种自动播放表发生器,其中,包括“不需要的种子”歌曲的多个种子歌曲被用于产生播放表上的歌曲。Cluts的第5,618,876号美国专利公开了基于编辑预先为每首歌曲编写的“风格标签”来选择类似第一组歌曲的额外歌曲。然而,这些参考文献没有公开向用户提供不同于用户指定的已标识内容项目的内容类型的内容。当然用户也可以检索内容项目,然而试图确定相似的项目却可以是费时且费力的工作,尤其如果用户不知道或未指定需要的项目的内容类型。而且,因为内容项目在用户控制的存储设备或数据库中持续堆积,所以检索内容项目的工作曾经变得更加困难。
技术实现思路
提供实施或实现检索系统功能的方法、系统、设备、引擎、装置、以及计算机可读介质。提取包括用户选择的第一内容项目的维度数据的第一说明数据。然后,提取包括备选内容项目的对应维度数据的备选说明数据,每个备选内容项目的内容类型不同于用户选择的内容项目的内容类型。可以生成每个备选内容项目的第一组矢量值,每个矢量值表示第一说明数据的维度的维度数据与备选说明数据的相应维度数据之间的相似度。然后可以基于生成的第一组矢量值所表示的相似度,从多个备选内容项目中选择一备选内容项目。选择的备选内容项目或多个备选内容项目然后通过检索系统来提供,例如经由用户接口。维度数据的维度表示项目的内容类型、项目的内容风格、项目的流派、项目的元数据、项目的使用历史、项目中表演的表演者、与项目有关的导演、与项目有关的创建者、或项目的再现(rendering)要求。正如在此使用的,元数据可以包括项目的创建时间、项目的创建地点、项目的获取时间、和/或项目的获取地点。可以只是在第一组矢量值所表示的总相似度超过最小阈值时才选择备选内容项目。可以选择正如第一组矢量值所表示的具有最高总相似度的备选内容项目。可以标识添加的内容项目。提取包括第二已标识内容的维度数据的说明数据,所述第二已标识内容项目与第一已标识内容项目集合在一起。然后还基于第二组矢量值,选择备选内容项目,所述第二组矢量值表示第二已标识内容项目的维度数据与相似备选内容项目的维度数据之间的相似度。因此,可以选择备选内容项目,以便第一组矢量值和第二组矢量值被求平均值、求加权平均值、或相加。还可以挑选公共矢量用于加权的结果。选择公共矢量,即表示第一已标识内容项目的维度数据最接近第二已标识内容项目的维度的矢量,并且在选择备选内容项目中,可以加权公共矢量的值,使其大于第一组矢量值和第二组矢量值的其余矢量值。可以构造有效内容(virtual content)项目。提取包括用户选择的第一和第二内容项目的维度数据的说明数据。提取包括备选内容项目的对应维度数据的备选说明数据,每个备选内容项目的内容类型不同于用户选择的内容项目的内容类型。然后通过平均或加权平均矢量值的有效项目组来构造有效项目,矢量值的有效项目组中的每个矢量值表示第一说明数据的维度数据的维度与第二说明数据的维度数据的对应维度之间的相似度。可以生成每个备选内容项目的第一组矢量值,每个矢量值表示有效内容项目的维度的维度数据与备选内容项目的相应维度数据之间的相似度。因此可以通过如下方式从这些备选内容项目中选择一个备选内容项目,即通过计算这些备选内容项目的每组矢量值的平均值或加权平均值或总和作为测试值,以及确定其测试值超过阈值的备选内容项目作为被选择的备选内容项目。提供选择的备选内容项目或多个备选内容项目。附图说明图1是根据本专利技术实施例的检索系统的总示意图。图2A-2C是根据本专利技术的系统的工作流程图。图3示出了根据本专利技术实施例的矢量值的数据图表。具体实施例方式以下讨论和前述附图描述了专利技术人目前认为最易理解的申请人专利技术的实施例,然而将要理解的是,在不脱离本专利技术精神的前提下,本专利技术的许多修改是可能的,并且本专利技术可以体现为其他的形式,并可以用其他的方法来实现。而且,所述实施例的特征在不脱离本专利技术精神的前提下,可以被省略、有选择地或整体上与其他实施例进行组合,或者用于代替其他实施例的特征或其部分特征。附图和详细说明因此被认为是对本专利技术各个方面的说明性解释,而不应被认为限制本专利技术的范围。如图1所示,检索系统1-1包括多个模块,这些模块将在下面进行说明。检索系统1-1的模块,或者它的部分、和/或整个检索系统,可以由硬件、软件、固件、或前述项目的组合组成,然而,一些模块例如可以由硬件组成,而其他模块可以由软件、固件或其组合组成。应该理解,检索系统的模块不必都与相同的设备布置在一起或集成为一体。还打算将分布式体系结构用于检索系统,其可以“背载(piggy-back)”由现有设备提供的适宜模块。下面的说明将参照检索系统1-1,而所述检索系统1-1在物理上与数据库1-2集成为一体,或经由有线或无线连接与数据库1-2连接。数据库1-2可以体现在存储设备上,例如个人计算机、个人录像机、娱乐系统、电子管理器、个人手持设备、Jaz驱动器的硬盘,或可以体现为商用存储设备,例如磁盘驱动器。应该理解,数据库1-2可以包括多个连接的存储设备,从而可以在两个或更多这种设备上管理或集合内容项目。还应理解的是,可以认为数据库包括一个或多个存储介质,例如盘,包括CD、DVD、zip盘、软盘、盒式数据磁带、或相似的东西,它们可以被加载到数据库1-2上,并可以由数据库1-2进行检索。然而应该理解,检索系统1-1还能够经由网络1-9检索内容,例如LAN、WAN、因特网等。如图1所示,检索系统1-1包括说明数据提取器1-11,其是从内容项目中收集某些类型数据的模块。该内容项目可以是视频、或视频片段、电影、照片、文本文件、音乐数据、音频文件或其他类型的多媒体数据、JPEG文件、或XML数据。例如,视频可以是数字录像机拍摄的家庭录像,电影可以是商业分配的影片数据,例如编码为MPEG(包括MPEG-2、MPEG-3等)的影片,照片可以是数字照片数据、或系列的照片或影集,文本文件可以是文字处理软件形成的文件、电子表格、或计算机代码文件,音乐数据可以是MP3文件等,以及其他等等。说明数据提取器1-11提取的说明数据包括关于内容项目的信息。这种说明数据描述内容项目的维度。这种维度可以包括下列内容中的任何一项或多项内容内容类型,包括介质,例如视频、音频、照片、文本文件等;内容风格或流派,例如假期电影、个人风景摄影、爵士乐等;项目的元数据,例如项目的创建时间和/或地点,项目的获取时间和/或地点;项目的使用历史(例如,播放和/或编辑的最后一次/第一次本文档来自技高网...

【技术保护点】
一种内容检索方法,包括:提取(S1)第一说明数据,所述第一说明数据包括第一用户选择的内容项目的维度数据;提取(S5)备选说明数据,所述备选说明数据包括备选内容项目的对应维度数据,每个备选内容项目的内容类型不同于用户选择的内容 项目的内容类型;生成(S11)每个备选内容项目的第一组矢量值,每个矢量值表示第一说明数据的维度的维度数据与备选说明数据的对应维度数据之间的相似度;基于由生成的第一组矢量值所表示的相似度,从备选内容项目中选择(S15)备选内容 项目;以及提供(S16)选择的备选内容项目。

【技术特征摘要】
【国外来华专利技术】US 2004-12-1 60/632,1351.一种内容检索方法,包括提取(S1)第一说明数据,所述第一说明数据包括第一用户选择的内容项目的维度数据;提取(S5)备选说明数据,所述备选说明数据包括备选内容项目的对应维度数据,每个备选内容项目的内容类型不同于用户选择的内容项目的内容类型;生成(S11)每个备选内容项目的第一组矢量值,每个矢量值表示第一说明数据的维度的维度数据与备选说明数据的对应维度数据之间的相似度;基于由生成的第一组矢量值所表示的相似度,从备选内容项目中选择(S15)备选内容项目;以及提供(S16)选择的备选内容项目。2.权利要求1的方法,其中,维度数据的维度表示以下之一项目的内容类型、项目的内容风格、项目的流派、项目的使用历史、项目中表演的表演者、与项目有关的导演、与项目有关的创建者、项目的再现要求、以及项目的任何元数据。3.权利要求2的方法,其中,元数据表示以下之一项目的创建时间、最后一次使用的时间、大多数使用的时间周期、项目的获取时间、项目的创建地点、项目的获取地点、最后一次使用的地点、以及大部分使用的地点。4.权利要求1的方法,其中,只有在由第一组矢量值所表示的总相似度超过最小阈值时才选择备选内容项目。5.权利要求1的方法,其中,选择具有如第一组矢量值所表示的最高总相似度的备选内容项目。6.权利要求1的方法,还包括提取(S3)说明数据,所述说明数据包括第N个已标识内容项目的维度数据,所述第N个已标识内容项目与第一已标识内容项目集合在一起,N是大于1的任何正整数;以及还基于第N组矢量值自动选择(S15)备选内容项目,所述第N组矢量值表示第N个已标识内容项目的维度数据与相似备选内容项目的维度数据之间的相似度。7.权利要求6的方法,其中,选择备选内容项目,以便第一组矢量值和第N组矢量值被执行以下之一的操作求平均值、求加权平均值、和相加。8.权利要求6的方法,包括选择表示第一已标识内容项目的维度数据最接近第N个已标识内容项目的维度的矢量作为公共矢量,并且在选择备选内容项目中,加权公共矢量的值,使其大于第一组矢量值和第N组矢量值的其余矢量值。9.一种内容检索方法,包括提取(S1)第一说明数据,所述第一说明数据包括第一用户选择的内容项目的维度数据;提取(S3)第N个说明数据,所述第N个说明数据包括第N个用户选择的内容项目的维度数据,N是大于1的正整数;提取(S5)备选说明数据,所述备选说明数据包括备选内容项目的对应维度数据,每个备选内容项目的内容类型不同于用户选择的内容项目的内容类型;通过对矢量值的有效项目组执行求平均值和求加权平均值其中之一,构造(S22)有效项目,矢量值的有效项目组中的每个矢量值表示第一说明数据的维度数据的维度与第N个说明数据的维度数据的对应维度之间的相似度;生成(S23)每个备选内容项目的一组矢量值,每个矢量值...

【专利技术属性】
技术研发人员:EMA迪德里克斯BM范德斯卢伊斯
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1