在信息检索系统中使用层级评分以进行消歧技术方案

技术编号:12514011 阅读:72 留言:0更新日期:2015-12-16 11:50
用于检索信息的方法可以包括在非万维网库即非WWW库中接收针对媒体作者的搜索查询。可以在非WWW库内识别针对搜索查询的搜索结果。可以生成针对在搜索结果中所识别出的多个媒体作者各自的得分。针对多个媒体作者中的相应媒体作者的得分可以基于针对多个媒体作者中的相应媒体作者所创作的多个媒体项目的综合媒体流行度得分。可以基于所生成的针对多个媒体作者各自的得分来对搜索结果进行排名。

【技术实现步骤摘要】
【国外来华专利技术】
本申请的方面通常涉及数据搜索领域。更具体地,本专利技术的特定实现涉及在信息检索系统中使用层级评分以进行消歧
技术介绍
信息检索系统使用术语和短语来对文档进行编索引、检索、组织和描述。在用户输入搜索查询的情况下,识别并使用该查询中的术语以从信息检索系统中检索文档,然后对这些文档进行排名。然而,在诸如音乐搜索引擎等的稀疏信息检索系统中,针对各文档经常不存在足够的数据以将这些文档彼此区分开。结果,在这种稀疏信息检索系统中的搜索可能会导致对与搜索术语和短语相关联的文档的模糊评分,这导致对搜索结果的排名变差。通过如参考附图在本专利技术的其余部分中所述、将这些方法与本方法和系统的一些方面进行比较,常规和传统方法的其它限制和缺点对于本领域技术人员而言将变得明白。
技术实现思路
如在权利要求书中更全面地所述,大致如与附图中的至少一个附图有关地所示和/或所述,提供一种用于在信息检索系统中使用层级评分以进行消歧的系统和/或方法。通过以下的说明和附图,将更加充分地理解本专利技术的这些和其它优点、方面和特征及其例示实施例的详细内容。根据本专利技术的示例实施例,用于检索信息的方法可以包括在非万维网(WWW)库中接收针对媒体作者的搜索查询。媒体例如可以是印刷媒体(例如,书)、音乐、电影和其它媒体项目。可以在所述非WWW库内识别针对所述搜索查询的搜索结果。可以针对在所述搜索结果中所识别出的多个媒体作者各自生成得分。针对所述多个媒体作者中的相应媒体作者的得分可以是基于针对所述多个媒体作者中的相应媒体作者所创作的多个媒体项目的综合媒体流行度得分。可以基于所生成的针对所述多个媒体作者各自的得分来对所述搜索结果进行排名。根据本专利技术的示例实施例,用于检索信息的方法可以包括接收针对音乐艺术家的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐艺术家各自的得分。针对所述多个音乐艺术家中的相应音乐艺术家的得分可以是基于针对所述多个音乐艺术家中的相应音乐艺术家的多个音乐专辑的综合音乐专辑流行度得分。可以基于所生成的针对所述多个音乐艺术家各自的得分来对所述搜索结果进行排名。可以接收针对所述多个音乐专辑的识别信息和针对所述多个音乐专辑各自内的多个音乐曲目的识别信息。可以确定针对所述多个音乐曲目各自的流行度得分。针对给定音乐曲目的流行度得分可以基于针对该音乐曲目的搜索查询的总数和来自所述搜索查询的网络结果的点进率(CTR)中的一个或这两者。可以在基于万维网(WWW)的搜索库内进行针对该音乐曲目的搜索查询的总数中的至少一部分。可以确定针对所述多个音乐专辑各自的流行度得分。音乐专辑的流行度得分可以基于针对音乐专辑内的所述多个音乐曲目各自的流行度得分的加权平均。可以生成所述综合音乐专辑流行度得分作为针对所述多个音乐专辑各自的流行度得分的加权平均。针对所述多个音乐艺术家中的相应音乐艺术家的得分还可以基于独立于所述搜索查询的至少一个得分。独立于所述搜索查询的至少一个得分可以基于以下内容中的一个或多个:接收到的所述搜索查询所来自的地理位置;所述多个音乐专辑中的至少一个音乐专辑的发行日期;所述多个音乐专辑中的至少一个音乐专辑的播放计数;以及所述多个音乐专辑中的至少一个音乐专辑的销售计数。根据本专利技术的另一示例实施例,用于检索信息的系统可以包括网络装置。所述网络装置可用于接收针对音乐艺术家的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐艺术家各自的得分。针对所述多个音乐艺术家中的相应音乐艺术家的得分可以基于针对所述多个音乐艺术家中的相应音乐艺术家的多个音乐专辑的综合音乐专辑流行度得分。可以基于所生成的针对所述多个音乐艺术家各自的得分来对所述搜索结果进行排名。所述网络装置可用于接收针对所述多个音乐专辑的识别信息和针对所述多个音乐专辑各自内的多个音乐曲目的识别信息。所述网络装置可用于确定针对所述多个音乐曲目各自的流行度得分。针对音乐曲目的流行度得分可以基于针对该音乐曲目的搜索查询的总数和来自所述搜索查询的网络结果的点进率(CTR)中的一个或这两者。可以在基于万维网(WWW)的搜索库内进行针对该音乐曲目的搜索查询的总数中的至少一部分。所述网络装置可用于确定针对所述多个音乐专辑各自的流行度得分。针对音乐专辑的流行度得分可以基于针对该音乐专辑内的多个音乐曲目各自的流行度得分的加权平均。所述网络装置可用于生成所述综合音乐专辑流行度得分作为针对所述多个音乐专辑各自的流行度得分的加权平均。针对所述多个音乐艺术家中的相应音乐艺术家的得分还可以基于独立于所述搜索查询的至少一个得分。独立于所述搜索查询的至少一个得分可以基于以下内容中的一个或多个:接收到的所述搜索查询来自的地理位置;所述多个音乐专辑中的至少一个音乐专辑的发行日期;所述多个音乐专辑中的至少一个音乐专辑的播放计数;以及所述多个音乐专辑中的至少一个音乐专辑的销售计数。根据本专利技术的又一示例实施例,用于检索信息的方法可以包括接收针对音乐专辑的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐专辑各自的得分。针对所述多个音乐专辑中的相应音乐专辑的得分可以基于以下内容中的一个或这两者:针对来自所述多个音乐专辑中的相应音乐专辑的至少一个音乐曲目的音乐曲目流行度得分、以及针对与所述多个音乐专辑中的相应音乐专辑相关联的音乐艺术家的音乐艺术家流行度得分。可以基于所生成的针对所述多个音乐专辑各自的得分来对所述搜索结果进行排名。根据本专利技术的还一示例实施例,用于检索信息的方法可以包括接收针对音乐曲目的搜索查询并且识别针对所述搜索查询的搜索结果。可以生成针对在所述搜索结果中所识别出的多个音乐曲目各自的得分。针对所述多个音乐曲目中的相应音乐曲目的得分可以基于以下内容中的一个或这两者:针对与所述多个音乐曲目中的相应音乐曲目相关联的至少一个音乐专辑的音乐专辑流行度得分、以及针对与所述多个音乐曲目中的相应音乐曲目相关联的音乐艺术家的音乐艺术家流行度得分。可以基于所生成的针对所述多个音乐曲目各自的得分来对所述搜索结果进行排名。【附图说明】图1A是示出根据本专利技术的实施例的示例信息检索系统的框图。图1B是根据本专利技术的示例实施例的查询独立得分模块的示例实现的框图。图2是示出根据本专利技术的示例实施例的、用于响应于针对音乐艺术家的搜索查询来检索信息的方法的示例步骤的流程图。图3是示出根据本专利技术的示例实施例的、用于响应于针对音乐专辑的搜索查询来检索信息的方法的示例步骤的流程图。图4是示出根据本专利技术的示例实施例的、用于响应于针对音乐曲目的搜索查询来检索信息的方法的示例步骤的流程图。【具体实施方式】如这里所使用的,术语“电路”和“电路系统”是指物理电子组件(即,硬件)以及可构成该硬件、可由硬件执行和/或与该硬件相关联的任何软件和/或固件(“代码”)。作为示例,“X和/或y”表示三要素集合{(X),(y), (X, y)}中的任何元素。作为另一示例,“x、y 和 / 或 z”表示七要素集合{(X),(y), (Z), (x, y), (x, z),(y, z),(x, y, z)}中的任何元素。如这里所使用的,术语“例如”引出一个或多个非限制性示例、实例或本文档来自技高网...

【技术保护点】
一种用于检索信息的方法,包括以下步骤:接收在非万维网库即非WWW库中针对媒体作者的搜索查询;在所述非WWW库内识别针对所述搜索查询的搜索结果;生成针对在所述搜索结果中识别出的多个媒体作者各自的得分,其中针对所述多个媒体作者中的相应媒体作者的得分是基于针对所述多个媒体作者中的相应媒体作者所创作的多个媒体项目的综合媒体流行度得分的;以及基于所生成的针对所述多个媒体作者各自的得分来对所述搜索结果进行排名。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:A·詹A·坎德沃尔
申请(专利权)人:谷歌股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1