当前位置: 首页 > 专利查询>咕果公司专利>正文

用于提供搜索结果的偏好语言排序的系统和方法技术方案

技术编号:2853731 阅读:254 留言:0更新日期:2012-04-11 18:40
本发明专利技术描述一种用于提供搜索结果(38)的偏好语言(39)排序(85)的系统和方法。接收一描述以复数种搜索结果语言(37)提供的潜在地可检索的信息(22)的搜索查询(36)。通过根据保留于一可搜索数据存储库中的信息特征评估所述搜索查询(36)来执行一搜索(36)。动态地判定可应用于响应于所述执行的搜索(36)而产生的搜索结果(38)的至少一种偏好语言(39)。考虑所述至少一种偏好语言(39)来排序所述搜索结果(38)中的至少一些搜索结果。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术大体涉及信息定位,且具体来说本专利技术涉及一种提供搜索结果的偏好语言排序的系统和方法。
技术介绍
虽然互联网可追溯到二十世纪六十年代末,但个人计算和互联网络的普遍可用性和接受度已经导致在信息共享技术方面的爆炸式增长和无法预料的进步。具体来说,万维网(“环球网”)革命性地让全世界范围内的受众可访问到无法计算的以存储电子形式的信息量,包括以档案形式和以实时形式的声音(音频)和视觉(图像和视频)信息。简而言之,环球网向每个联网的用户提供了对实际上无限量的全世界范围内几乎所有语言的信息库的桌面访问。在环球网上的信息交换以客户机-服务器模式运行。独立的客户机通常以环球网浏览器的形式执行环球网内容检索和表示层应用。所述环球网浏览器发送环球网内容的请求消息给中央环球网服务器,所述中央环球网服务器用作数据存储器和检索存储库。所述环球网服务器分析请求消息且在响应消息中返回所请求的环球网内容。搜索引擎已经随着增加的环球网使用率而进化,以使用户可以有效而省时地查找和检索相关的环球网内容。随着环球网内容的数量和类型的增加,搜索引擎的完善度和精确度也同样需要改进。一般来说,搜索引擎为响应一搜索查询而努力提供最高质量的结果。然而,判定质量是困难的,因为所检索的环球网内容的相关性本质上是主观的且取决于使用者的兴趣、知识和态度。搜索引擎使用的现有方法是基于将搜索查询词语与从环球网页面中索引出的词语相匹配。更高级的方法使用诸如在S.Brin和L.Page的“TheAnatomy of a Large-Scale Hypertextual Search Engine”(1998)中描述的和在2001年9月4日颁发给Page的第6,285,999号美国专利中所描述的基于超级链接结构分析来判定所检索的环球网内容的重要性,该等文献的揭示内容以引用的形式并入本文。一个典型的搜索查询情景开始于向搜索引擎提交一个自然语言问题或者单独关键字。搜索引擎对描述具有潜在可检索环球网内容的信息特征的数据存储库执行搜索并识别候选的搜索结果。搜索经常可返回成千或甚至上百万的结果,所以多数搜索引擎通常仅排名或计分最有希望的结果的一个子集。也可引入目标搜索结果,例如广告或专题信息内容。然后,靠前的搜索结果呈献给用户,通常为环球网内容标题、超级链接和其它描述性信息(诸如从搜索结果中提取的文本摘录)的形式。搜索引擎通常可为世界各处的用户所用。因此,提供高质量搜索结果的部分能够以请求用户可接受的语言提供那些搜索结果。可接受的语言包括用户指定的语言以及其它可接受的语言。例如,一个法语偏好的用户也可接收英语的搜索结果。可接受的语言也可包括相关语言和方言。例如,葡萄牙语的搜索结果对于通常偏好西班牙语的用户是可接受的。最后,可接受的语言可包括死语言,如古希腊语或者古英语;或伪语言,如克林贡语(Klingon)。死语言和伪语言通常不被搜索引擎所支持,但是可反映请求用户的学术、历史或个人兴趣。现在,多数环球网浏览器、环球网服务器和相关的环球网应用使用超文本传输协议(HTTP)来处理环球网信息交换。HTTP是一种无会话协议且通常不保留任何识别用户偏好的状态,包括语言。唯一可用于表示用户可接受的语言的信息为独立于每一HTTP事务而保留的偏好或在搜索查询本身中的偏好。首先,用户提供的偏好或者在环球网客户机或者环球网服务器上指定。客户端偏好,如被环球网浏览器接受的语言,是通过请求消息头进行通信。服务器端偏好通过搜索引擎选项指定且独立于使用cookie(其必须在执行搜索之前从环球网客户机被检索)或通过登录程序的每个HTTP事务而保留。虽然在指定可被接受的语言方面有效,但是用户在实践中很少明确地设置语言偏好。另外,语言偏好通常太具限制性,呈现″全部或没有″(all-or-nothing)范式。语言偏好功能充当搜索结果过滤器,仅提供那些在偏好语言下的搜索结果,并过滤掉那些在相关或者替代语言下的搜索结果。类似地,指定可被接受的语言的默认设置,不论在客户机端或者在服务器端都可使提供合适的搜索结果进一步复杂化。通常,默认设置可为错误的。例如,可根据环球网浏览器选项而指定英语为默认语言偏好,但是对于不精通英语的用户来说这可能不适合于呈现搜索结果。其次,基于查询的偏好派生于在一给定搜索查询中的词语。然而,搜索查询词语因若干原因并不能可靠地用于判定语言偏好。第一,诸如人名、地名或物名的专有名词经常与语言无关且不能很好地指示呈现搜索结果所需的理想语言。例如,一搜索引擎将不能判定由专有名字“Elvis”组成的搜索查询可接受的语言。第二,搜索查询经常仅由几个单独字组成,尤其是当指定关键字时,这通常不能提供可用于判定语言偏好的足够上下文。类似于专有名字,个别字可与语言无关或者引起语言误解。例如,由字“WaldorfAstoria”组成的搜索查询可误导搜索引擎。因此,需要提供一种动态判定用于向用户呈现搜索结果的语言偏好的方法。优选是,这一方法将容纳使用者可接受的偏好和不太偏好的语言,且包括在所述语言偏好内的相关和替代语言。还需要一种根据用户偏好语言以有序方式呈现搜索结果的方法。优选是,这一方法可排序或计分搜索结果以偏好那些偏好语言的搜索结果,同时也容纳那些其它语言的搜索结果。
技术实现思路
本专利技术提供一种响应于一搜索查询而动态地判定偏好语言和对搜索结果排序的系统和方法。基于搜索查询、用户接口和搜索结果特征的评估来判定用户偏好和不太偏好的语言。从描述所述搜索查询的元数据来判定搜索查询特征。也使用搜索查询元数据、以及客户机端与服务器端偏好和客户机的互联网协议(IP)地址来判定用户接口特征。基于每一搜索结果的评估来判定搜索结果特征。基于该搜索引擎利用来考虑偏好语言和(如果选择)不太偏好的语言而组织搜索结果的方法,对响应于搜索查询而检索到的搜索结果进行排序。所述搜索结果的排序是利用一预定的移位因数(shiftingfactor)实现或通过调整一由一加权因数指派给每一搜索结果的数值分数并重新分类这些搜索结果而实现的。一实施例提供一种用于对搜索结果排序的系统和方法。动态地判定可应用于响应于对潜在地可检索信息执行的搜索而产生且提供于以复数种搜索结果语言提供的搜索结果的至少一偏好语言。考虑所述至少一偏好语言来排序这些搜索结果的至少一些搜索结果。另一实施例提供一种。接收以复数种搜索结果语言提供的用于描述潜在可检索信息的搜索查询。搜索通过对保留在一可搜索数据存储库中的信息特征的评估来执行。动态地判定可应用于响应于所执行的搜索而产生的搜索结果的至少一偏好语言。考虑所述至少一偏好语言来排序所述搜索结果的至少一些搜索结果。另一实施例提供一种用于动态判定语言偏好及搜索结果的排序的系统和方法。接收一搜索查询请求消息,并从所述搜索查询请求消息中分析词语和属性中的至少一,以识别以复数种搜索结果语言提供的潜在可检索的环球网内容。通过对保留于可搜索数据存储库中的信息特征评估词语与属性中的至少一来执行搜索,且搜索结果响应于所执行的搜索而产生。判定至少一偏好语言。评估以下至少一个的特征搜索查询请求消息、发送搜索查询请求消息的用户接口和搜索结果。基于所评估的特征来选择所述至少一偏好语言。考虑所述至少一偏好语言对搜索结果的至少一些搜索结果排序。搜索本文档来自技高网
...

【技术保护点】
一种用于排序搜索结果(38)的系统(10),其包含:一语言选择器(21),其动态地判定(84)可应用于响应于对潜在可检索的信息(22)执行的一搜索(36)而产生的且以复数种搜索结果语言(37)提供(86)的搜索结果(38)的至少一种 偏好语言(39):和一搜索结果排序器(34),其考虑所述至少一种偏好语言(39)而排序所述搜索结果(38)中的至少一些搜索结果。

【技术特征摘要】
【国外来华专利技术】US 2003-3-31 60/459,339;US 2003-4-3 10/407,4761.一种用于排序搜索结果(38)的系统(10),其包含一语言选择器(21),其动态地判定(84)可应用于响应于对潜在可检索的信息(22)执行的一搜索(36)而产生的且以复数种搜索结果语言(37)提供(86)的搜索结果(38)的至少一种偏好语言(39)和一搜索结果排序器(34),其考虑所述至少一种偏好语言(39)而排序所述搜索结果(38)中的至少一些搜索结果。2.根据权利要求1所述的系统(10),其进一步包含一搜索查询表征器(43),其使用指定所述搜索(36)的一搜索查询(36)而判定(84)所述至少一种偏好语言(39)。3.根据权利要求2所述的系统(10),其进一步包含所述搜索查询表征器(43),其用于评估用于所述搜索查询(36)的至少一种语言(42)与用于所述搜索查询(36)的至少一字符编码(36)中的至少一者。4.根据权利要求1所述的系统(10),其进一步包含一用户接口表征器(44),其使用用户接口特征(44)判定(84)所述至少一种偏好语言(39)。5.根据权利要求4所述的系统(10),其进一步包含所述用户接口表征器(44),其评估指定为一独立于一指定所述搜索(36)的搜索查询(36)的一存储偏好(39)的至少一种预定语言(42)、被所述用户接口(44)接受的至少一种语言(42)、被所述用户接口(44)接受的至少一字符编码(36)与一从其提交所述搜索查询(36)的客户应用程序(36)的一网络地址(36)中的至少一者。6.根据权利要求1所述的系统(10),其进一步包含一搜索结果表征器(45),其使用所述搜索结果(38)中的至少一些搜索结果来判定(84)所述至少一种偏好语言(39)。7.根据权利要求6所述的系统(10),其进一步包含所述搜索结果表征器(45),其评估用于一个或一个以上所述搜索结果(38)的至少一种语言(39)。8.根据权利要求1所述的系统(10),其进一步包含一索引器(32),其排名所述搜索结果(38);和所述搜索结果排序器(34),其相对于所述至少一种偏好语言(39)排序所述搜索结果(38)中的至少一些搜索结果。9.根据权利要求8所述的系统(10),其进一步包含以下至少一者所述搜索结果排序器(34),其将所述至少一种偏好语言(39)之外的一语言(40)的每一此类搜索结果(38)降级至少一个位置(39),并将所述至少一种偏好语言(39)的每一此类搜索结果(38)提前至少一个位置(39);和所述搜索结果排序器(34),其将所述至少一种偏好语言(39)之外的一语言(40)的每一此类搜索结果(38)提前至少一个位置(39),并将所述至少一种偏好语言(39)的每一此类搜索结果(38)降级至少一个位置(39)。10.根据权利要求1所述的系统(10),其进一步包含一计分器(33),其指派一数值分数(41)给所述搜索结果(38);和一搜索结果排序器(34),其调整所述至少一种偏好语言(39)的所述搜索结果(38)中的至少一些搜索结果的所述数值分数(41)。11.根据权利要求10所述的系统(10),其进一步包含以下至少一者所述搜索结果排序器(34),其增加指派给所述至少一种偏好语言(39)的所述搜索结果(38)的所述数值分数(41),且保留指派给所述至少一种偏好语言(39)之外的一语言(40)的所述搜索结果(38)的所述数值分数(41);和所述搜索结果排序器(34),其减少指派给所述至少一种偏好语言(39)的所述搜索结果(38)的所述数值分数(41),且保留指派给所述至少一种偏好语言(39)之外的一语言(40)的所述搜索结果(38)的所述数值分数(41)。12.根据权利要求1所述的系统(10),其进一步包含所述搜索结果排序器(34),其分类具有调整后的数值分数(41)的所述搜索结果(38)中的所述至少一些搜索结果。13.根据权利要求1所述的系统(10),其进一步包含所述语言选择器(21),其选择至少一种不太偏好的语言(40)。14.一种用于排序搜索结果(38)的方法(80),其包含动态地判定(84)可应用于响应于对潜在可检索的信息(22)执行的一搜索(36)而产生(82)的且以复数种搜索结果语言(37)提供(86)的搜索结果(38)的至少一种偏好语言(39);和考虑所述至少一种偏好语言(39)排序(83)所述搜索结果(37)中的至少一些搜索结果。15.根据权利要求14所述的方法(80),其进一步包含使用一指定所述搜索(36)的搜索查询(36)来判定(84)所述至少一种偏好语言(39)。16.根据权利要求15所述的方法(80),其进一步包含评估用于所述搜索查询(36)的至少一种语言(42)与用于所述搜索查询(36)的至少一字符编码(36)中的至少一者。17.根据权利要求14所述的方法(80),其进一步包含使用用户接口特征(44)判定(84)所述至少一种偏好语言(39)。18.根据权利要求17所述的方法(80),其进一步包含评估(84)指定为一独立于一指定所述搜索(36)的搜索查询(36)的一存储偏好(39)的至少一种预定语言(42)、被所述用户接口接受的至少一种语言(42)、被所述用户接口接受的至少一字符编码(36)与一从其提交所述搜索查询(36)的一客户应用程序(36)的网络地址(36)中的至少一者。19.根据权利要求14所述的方法(80),其进一步包含使用所述搜索结果(38)中的至少一些搜索结果判定(84)所述至少一种偏好语言(39)。20.根据权利要求19所述的方法(80),其进一步包含评估用于一个或一个以上所述搜索结果(38)的至少一种语言(42)。21.根据权利要求14所述的方法(80),其进一步包含排名(85)所述搜索结果(38);和相对于所述至少一种偏好语言(39)排序(85)所述搜索结果(36)中的至少一些搜索结果。22.根据权利要求21所述的方法(80),其进一步包含以下至少一者将所述至少一种偏好语言(39)之外的一语言(40)的每一此类搜索结果(38)降级(85)至少一个位置,且将所述至少一种偏好语言(39)的每一此类搜索结果(38)提前(85)至少一个位置;和将所述至少一种偏好语言(39)之外的一语言(40)的每一此类搜索结果(38)提前(85)至少一个位置,且将所述至少一种偏好语言(39)的每一此类搜索结果(38)降级至少一个位置。23.根据权利要求14所述的方法(80),其进一步包含指派(83)一数值分数(41)给所述搜索结果(38);和调整(83)所述至少一种偏好语言(39)的所述搜索结果(38)中的至少一些结果的所述数值分数(41)。24.根据权利要求23所述的方法(80),其进一步包含以下至少一者增加(83)指派给所述至少一种偏好语言(39)的所述搜索结果(38)的所述数值分数(41),且保留(83)指派给所述至少一种偏好语言(39)之外的一语言(42)的所述搜索结果(38)的所述数值分数(41);和减少(83)指派给所述至少一种偏好语言(39)的所述搜索结果(38)的所述数值分数(41),且保留(83)指派给所述至少一种偏好语言(39)之外的一语言(42)的所述搜索结果(38)的所述数值分数(41)。25.根据权利要求14所述的方法(80),其进一步包含分类(83)具有调整后的数值分数(41)的所述搜索结果(38)的所述至少一些搜索结果。26.根据权利要求14所述的方法(80),其进一步包含选择(84)至少一种不太偏好的语言(40)。27.一种计算机可读取的存储媒体(30),其保存用于执行根据权利要求14所述的方法(80)的代码。28.一种用于提供搜索结果(38)的偏好语言(39)排序的系统(10),其包含一分析器(31),其接受一描述以复数种搜索结果语言(37)提供的潜在可检索信息(22)的搜索查询(36);一索引器(32),其通过根据保留于一可搜索数据存储库(49)中的信息特征(49)评估所述搜索查询(36)来执行一搜索(36);和一语言提前器(language promoter)(34),其动态(84)判定可应用于响应于所执行的搜索(36)而产生的搜索结果(38)的至少一种偏好语言(39),且考虑所述至少一种偏好语言(39)排序所述搜索结果(38)的至少一些搜索结果。29.根据权利要求28所述的系统(10),其进一步包含一种搜索查询表征器(43),其判定(84)一字符编码(36)与用于所述搜索查询(36)的一语言(42)中的至少一者;和一语言选择器(21),其选择对应于一字符编码(36)与一语言(42)中的所述至少一者的至少一种语言(42)作为所述至少一种偏好语言(39)。30.根据权利要求28所述的系统(10),其进一步包含一用户接口表征器(44),其判定(84)一用户接口(44)所使用的至少一种语言(42)以处理所述搜索查询(36);和一语言选择器(21),其选择所述用户接口(44)所使用的所述至少一种语言(42)作为所述至少一种偏好语言(39)。31.根据权利要求30所述的系统(10),其进一步包含所述用户接口表征器(44),其基于以下至少一者来判定(84)所述用户接口(44)所使用的至少一种语言(42)从其提交所述搜索查询(36)的一客户应用程序(36)的所述网络地址(36)、一可接受语言(42)与所述客户应用程序(36)的一字符集(49)中的至少一者和一指定为独立于所述搜索查询(36)的一存储偏好(39)的预定语言(42)。32.根据权利要求28所述的系统(10),其进一步包含一用户接口表征器(44),其判定(84)一由一用户接口(44)用来处理所述搜索查询(36)的默认语言(42);和一语言选择器(21),其选择所述默认语言(39)之外的一语言(42)作为所述至少一种偏好语言(39),且选择所述默认语言(39)作为至少一种不太偏好的语言(40)。33.根据权利要求32所述的系统(10),其进一步包含一搜索结果表征器(21),其判定(84)至少一个搜索结果(...

【专利技术属性】
技术研发人员:约翰兰平本戈梅斯瑞树麦格拉斯阿米特辛哈厄
申请(专利权)人:咕果公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1