当前位置: 首页 > 专利查询>雅虎公司专利>正文

聚类的搜索处理制造技术

技术编号:5505182 阅读:206 留言:0更新日期:2012-04-11 18:40
用于搜索数据并且将搜索结果分组成根据搜索相关性来排序的聚类的方法和装置。每个聚类包括一个或多个数据类型,诸如图像、web页面、本地信息、新闻、广告等。在一个实施例中,针对指示搜索的数据源的分类的相关概念来评价搜索项。还可通过诸如客户端设备的位置、当前运行的应用等上下文信息来识别数据源。每个聚类中的搜索结果通过相关性来排序,并且每个聚类都基于该聚类之内的相关性的聚集而被给予分数。每个聚类分数可基于一个或多个相应概念和/或上下文信息来修改。基于经修改的分数来排序聚类。包括广告的内容还可被增加到经排序的列表以表现为另一聚类。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般地涉及搜索数据,并且更具体地但非排他性地涉及将搜索 结果分组成根据搜索相关性来排序的聚类。
技术介绍
在因特网中已发生了巨大的改变,它们影响了我们的日常生活。例 如,在今天的社会中,移动计算设备正越来越变得更加普遍。很多移动计 算设备,诸如个人数字助理、蜂窝电话等,可用来通信话音消息、电子邮 件、文本消息等,以及通过因特网搜索信息。看到有人在公共汽车、火车 或者甚至船上使用他们的移动设备来搜索商家、餐馆、音乐、商务等并非 罕见。然而,执行对用户相关信息的搜索査询仍是繁琐的。经常,用户可能 不得不执行几次搜索査询以获得相关的搜索结果。无关的搜索结果意味着 当用户正在寻找时他们找到的可能性降低,这又可理解为对商家而言失去 了从用户受益的商机或其他的生意。因此,很多商业机构正在寻找新的方 式以使搜索结果与用户更相关。 一种技术是对匹配所提交的搜索项的搜索 结果进行分组。 一些搜索系统提供了用于搜索结果的数据类型的预定义分 组,诸如web页面、图像、视频、本地结果、购物有关的结果、工作、新 闻、广告等。分组通常以相同顺序布置,并且每个分组通常仅包括一个数 据类型。另一种技术是基于搜索结果的文本相似性来确定分组。然而,文本类似的分组一般不考虑关于搜索者的任何信息。因此,通过文本相似性来确 定的分组可能不是与搜索者最相关的分组。类似地,文本类似的分组的排 位可能不是处于与搜索者最相关的的顺序。当前的分组系统也一般仅提供 到搜索结果的链接以及简要的概括信息。返回的搜索结果页面一般不包括 没有基于搜索项的链接的任何实质内容。因此,就这些考虑及其他事物而 言提出了本专利技术。附图说明下面的附图描述了本专利技术的非限制性的和非穷尽性的实施例。在整个 附图中,类似的标号表示类似的部分,除非以另外的方式指定。为了更好地理解本专利技术,将结合附图参考下面的详细描述,附图中 图1是可实践本专利技术的环境的一个实施例的系统图; 图2示出可包括在实现本专利技术的系统中的移动设备的一个实施例; 图3示出可包括在实现本专利技术的系统中的服务器设备的一个实施例; 图4示出与确定搜索结果的相对直观的概念有关的主题搜索项的搜索 结果页面的一个示例;图5示出与确定搜索结果的较不直观的概念有关的搜索项的搜索结果 页面的一个示例;图6例示了一般地示出用于搜索数据的总体处理的一个实施例的逻辑 流程图7例示了一般地示出用于确定概念特定的数据源的处理的一个实施 例的逻辑流程图;以及图8例示了一般地示出用于修改搜索结果的聚类的聚类分数的处理的 一个实施例的逻辑流程图。具体实施例方式现在将在下文中参考附图更充分地描述本专利技术,这些附图形成了本发 明的一部分,并且这些附图以例示的方式示出了可实践本专利技术的具体示例 性实施例。然而,本专利技术可以以很多不同的形式来实施,并且不应理解为限于这里所陈述的实施例;相反,提供这些实施例是为了使本公开透彻且 完整,并且将充分地向本领域的技术人员表达本专利技术的范围。本专利技术可实 施为方法或装置,等等。因此,本专利技术可采取完全硬件实施例、完全软件 实施例或者组合了软件和硬件方面的实施例的形式。因此,下面的详细描 述将不具有限制性意义。在整个说明书和权利要求书中,下面的术语具有这里所清楚关联的意 思,除非上下文以另外的方式明确规定。这里所用的词组"在一个实施例 中"未必指同一实施例,虽然它可以是同一实施例。此外,这里所用的词 组"在另一实施例中"未必指不同实施例,虽然它可以是不同实施例。因 此,如下所述,在不脱离本专利技术的范围或精神的情况下,本专利技术的各种实 施例可容易地组合。此外,这里所使用的术语"或"是包括性的"或"操作符(operator),并且等同于术语"和/或",除非上下文以另外的方式明确 规定。术语"基于"是非排他性的,并且允许基于未被描述的额外因素, 除非上下文以另外的方式明确规定。此外,在整个说明书中,"一个"("a" , "an")和"该"("the")的意思包括复数指称。"在… 中"的意思包括"在...中"和"在…上"。 例示的操作环境图1示出其中可实践本专利技术的环境的一个实施例的组件。不是所有的 组件都被需要以实践本专利技术,并且在不脱离本专利技术的精神或范围的情况下 可进行组件的布置和类型上的变化。如所示出的,图1的系统100包括实 现客户端和服务器设备之间的通信的网络。网络105可以包括一个或多个 局域网("LAN" ) /广域网("WAN")。无线网络110可包括LAN、 WAN、电话网络等。系统100还包括通用客户端设备101、移动客户端设 备102-104、搜索服务器106和内容服务器107。下面结合图2更详细地描述移动设备102_103的一个实施例。然 而, 一般地,移动设备102—104实际上可包括能够通过诸如网络105、无 线网络110等网络来接收和发送消息的任何便携式计算设备。移动设备 102—104还可被一般地描述为配置成便携式的客户端设备。因此,移动设备102 — 104实际上可包括能够连接至另一计算设备以及接收信息的任何 便携式计算设备。这样的设备包括便携式设备,诸如蜂窝电话、智能电 话、显示寻呼机、射频(RF)设备、红外(IR)设备、个人数字助理 (PDA)、手持计算机、膝上计算机、可佩戴计算机、平板(tablet)计算 机、组合了一个或多个前述设备的集成设备等等。这样,就能力和特征而 言移动设备102_104通常在很宽范围内变化。例如,蜂窝电话可具有数 字键盘以及其上仅可显示文本的若干行单色LCD显示器。在另一示例 中,具有web能力的移动设备可具有触摸敏感屏、触笔(stylus)以及其 中文本和图形都可显示的若干行彩色LCD显示器。具有web能力的移动设备可包括被配置为接收和发送web页面、基于 web的消息等的浏览器应用。浏览器应用可被配置为接收和显示图形、文 本、多媒体等,浏览器应用实际上使用任何基于web的语言,包括无线应 用协议消息(WAP)等等。在一个实施例中,浏览器应用能使用手持设备 标记语言(HDML)、无线标记语言(WML) 、 WMLScript、 JavaScript、 标准通用标记语言(SMGL)、超文本标记语言(HTML)、可扩展标记 语言(XML)等来显示和发送消息。在一个实施例中,移动设备的用户可 使用浏览器应用来通过网络执行搜索。然而,也可使用另一应用来通过网 络执行搜索。移动设备102—104还可包括被配置为从另一计算设备接收内容的至 少一个其他的客户端应用。客户端应用可包括提供和接收文本内容、图形 内容、音频内容等的能力。客户端应用还可提供标识自身的信息,包括类 型、能力、名称等。在一个实施例中,移动设备102_104可通过多种机 制中的任何一种来唯一地标识它们自身,这些机制包括电话号码、移动标 识号(MIN)、电子序列号(ESN)或其他移动设备标识符。该信息还可 指示移动设备能使用的内容格式。可在发送至搜索服务器106、客户端设 备101或其他计算设备的消息等中提供这样的信息。在一个实施例中,移动设备102—104还可向另一计算设备提供物理 位置。然而,在一个实施例中,移动设备102—104可提供纬度和经度等 方面的物理位置信息。然而,移动设备102 — 10本文档来自技高网...

【技术保护点】
一种用于搜索数据的方法,包括: 接收搜索项; 基于所述搜索项来搜索多个数据源以产生搜索结果的多个聚类,其中每个聚类包括来自至少一个相应数据源的搜索结果,并且其中每个数据源包括与另一数据源不同的数据类型的数据; 为所述多个聚 类中的每一个确定分数;以及 对所述多个聚类进行排序。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:爱德华斯坦利欧特基思大卫萨福特麦克波尔里斯梅荷尔坦德州凯恩保罗伊佑
申请(专利权)人:雅虎公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1