使用声誉度量来提高搜索相关度制造技术

技术编号:10567086 阅读:185 留言:0更新日期:2014-10-22 17:44
本申请涉及使用声誉度量来提高搜索相关度,公开了用于确定动态数据集的相关度的系统和方法。给出了用于互联网市场中的特定实施例,其中与一项目相关联的描述性因素的相关度在用户选择该项目时被增大。为了防止对相关度确定系统的滥用,各种实施例结合了滥用防止措施。在一个实施例中,用户对其自己的项目的选择不会影响相关度系统。在一个实施例中,只有用户对特定项目的第一次选择才会影响相关度系统,对该项目的任何另外选择将没有影响。在另一实施例中,由于特定用户的选择而对相关度系统做出的改变的大小与该用户的声誉得分相联系。

【技术实现步骤摘要】
【专利摘要】本申请涉及使用声誉度量来提高搜索相关度,公开了用于确定动态数据集的相关度的系统和方法。给出了用于互联网市场中的特定实施例,其中与一项目相关联的描述性因素的相关度在用户选择该项目时被增大。为了防止对相关度确定系统的滥用,各种实施例结合了滥用防止措施。在一个实施例中,用户对其自己的项目的选择不会影响相关度系统。在一个实施例中,只有用户对特定项目的第一次选择才会影响相关度系统,对该项目的任何另外选择将没有影响。在另一实施例中,由于特定用户的选择而对相关度系统做出的改变的大小与该用户的声誉得分相联系。【专利说明】使用声誉度量来提高搜索相关度 本申请是申请日为2008年11月25日、题为"使用声誉度量来提高搜索相关度"的 中国专利技术专利申请No. 200880118613. 8(PCT国际申请PCT/US2008/013118)的分案申请。 相关申请 本申请要求2007年11月30日提交的美国专利申请No. 11/948,788( "USING REPUTATION MEASURES TO MPROVE SEARCH RELEVANCE")的权益,这里通过引用将该申请 全部结合进来。
本专利技术涉及数据检索。具体地但并非限制性地,本专利技术公开了用于对在计算机搜 索中定位的项目的相关度(relevancy)记分的技术。
技术介绍
计算机现在被用于存储大量信息。为了定位感兴趣的特定信息,已经创建出了强 大且直观的搜索机制。 例如,因特网的万维网部分从二十世纪八十年代末期其首次被引入以来已经获得 了指数增长。在万维网的历史的早期,网站的目录被用于引导用户到感兴趣的网站。最著 名的早期网站目录之一是"Jerr^ s Guide to the World Wide Web",其后来被重命名为 "Yahoo!"。然而,因特网的快速实时增长迅速使得万维网目录不可管理且易于过时。诸 如Lycos、Alta Vista和Google之类的因特网搜索引擎成为了在因特网上找到网站的新方 法。因特网搜索引擎使得用户可以输入与感兴趣的主题有关的几个关键字并且返回包含用 户输入的这些关键字的一大组搜索结果。 因特网搜索引擎通过在万维网上"爬行"以获知新网页并随后创建访问过的所有 网页的可搜索索引来工作。当用户输入一组关键字时,搜索引擎返回包含着用户输入的关 键字的一组网页。然而,搜索引擎用户输入的查询大多会映射到包含匹配关键字的数千个 甚至数十万个结果。这种信息负荷不是用户希望的。从而,构建一个很好的搜索引擎的真 正关键在于按某种类型的相关度度量来整理结果。这样,互联网搜索引擎的用户可以迅速 找到期望的内容。 【专利附图】【附图说明】 在不一定按比例绘制的附图中,相似的数字在几幅图中始终描述基本类似的组 件。具有不同字母后缀的相似数字表示基本类似的组件的不同实例。附图以示例而非限制 方式概括地图示了本文献中论述的各种实施例。 图1示出了采取计算机系统的示例性形式的机器的图示,在该机器内可以执行用 于使得该机器执行这里论述的方法中的任何一个或多个的一组指令。 图2示出了描述一个实施例如何响应于用户选择而修改相关度调整因子的高层 流程图。 图3示出了可用于本专利技术的各种实施例中的一些数据库表。 图4示出了描述在图2的系统中创建的相关度调整因子如何可用于为搜索结果集 中的项目调整相关度得分的高层流程图。 图5示出了图2中公开的相关度调整因子系统,其中添加了防止点击其自己项目 的激进用户进行的滥用的步骤。 图6示出了图5的相关度得分调整系统,其中与每个用户相关联的声誉得分被用 于进行与该声誉得分相联系的调整。 【具体实施方式】 以下详细描述参考了附图,附图形成了详细描述的一部分。附图根据示例性实施 例示出了图示。这些实施例在这里也被称为"示例",它们被足够详细地描述以使得本领域 的技术人员能够实现本专利技术。对于本领域的技术人员来说将会很明显的是,实现本专利技术并 不必需示例性实施例中的具体细节。虽然示例性实施例主要是参考互联网市场系统来公开 的,但是教导也可用于其他类型的结合搜索引擎的系统。例如,社交网络网站或媒体呈现网 站可结合本专利技术的教导。可以组合示例性实施例,可以利用其他实施例,或者可以进行结 构、逻辑和电气变化,而不脱离所要求保护的范围。以下详细描述因此不应当被理解为限制 性的,并且范围由所附权利要求及其等同物来限定。 在本文献中,正如专利文献中常见的,术语"一"被用于包括一个或多个。在本文献 中,术语"或"用于指非排他性的或,例如"A或B"包括"有A但没有B"、"有B但没有A"以 及"A和B",除非另有指明。另外,本文献中引用的所有公布、专利和专利文献在这里通过引 用被完全结合进来,就好像分别通过引用结合进来一样。在本文献和通过引用这样结合进 来的那些文档之间存在不一致的用法的情况下,所结合的(一个或多个)参考文献中的用 法应当被认为是本文献中的用法的补充;对于不可调和的不一致,以本文献中的用法为准。 计算机系统 图1示出了采取计算机系统100的示例性形式的机器的图示,在该机器内可以执 行用于使得该机器执行这里论述的方法中的任何一个或多个的一组指令124。在替换实施 例中,该机器可以作为独立的设备操作或者可以连接到(例如联网到)其他机器。在联网部 署中,该机器在服务器-客户端网络环境中可以作为服务器或客户端机器,或者在对等(或 分布式)网络环境中可以作为对等体机器。该机器可以是个人计算机(PC)、平板PC、机顶 盒(STB)、个人数字助理(PDA)、蜂窝电话、web用具、网络服务器、网络路由器、网络交换机、 网桥或者能够执行规定该机器应采取的动作的一组指令(顺序的或者其他形式的)的任何 机器。另外,虽然在图1中只示出单个机器,但是术语"机器"应当也被理解为包括单独或 联合执行一组(或多组)指令以执行这里论述的方法中的任何一个或多个的机器的任何集 合。 图1所示的示例性计算机系统100包括处理器102 (例如,中央处理单元(CPU)、 图形处理单元(GPU)或两者)、主存储器104、静态存储器106,它们可经由总线108相互通 信。计算机系统1〇〇还可包括视频显示适配器110,其驱动诸如液晶显示器(LCD)或阴极 射线管(CRT)之类的视频显示系统115。示例性计算机系统100还包括字母数字输入设备 112 (例如,键盘)、光标控制设备114(例如,鼠标或轨迹球)、盘驱动单元116、信号生成设 备118 (例如,扬声器)以及网络接口设备120。注意,计算机系统的各种实施例不会始终包 括所有这些外围设备。 盘驱动单元116包括机器可读介质122,其上存储着体现这里描述的方法或功能 中的任何一个或多个或者被其所利用的一组或多组计算机指令和数据结构(例如,也称为 "软件"的指令124)。指令124在其被计算机系统100执行期间可以完全或至少部分地驻 留在主存储器104内和/或处理器102内,主存储器104和处理器102也构成机器可读介 质。 用于操作计算机系统100的指令124可以利用若干种公知的传输协议(例如,文 件传输协议(FTP)本文档来自技高网...

【技术保护点】
一种对搜索结果进行排名的计算机实现的方法,所述方法包括:接受来自搜索引擎的用户的搜索查询;响应于来自所述用户的所述搜索查询生成一组搜索结果项目;接受所述用户对所述一组搜索结果项目中的一个搜索结果项目的选择;自动地从所述一个搜索结果项目的描述字段中抽象出未包含在所述搜索查询中的一个或多个字词;通过增大或减小的方式修改所述搜索查询的针对每个抽象出的字词的相关度调整因子,以在用户选择了包括一个抽象出的字词的搜索结果项目时增大针对该抽象出的字词的相关度调整因子;接受附加搜索查询,所述附加搜索查询与来自所述用户的所述搜索查询完全相同;以及响应于所述附加搜索查询生成一组附加搜索结果项目,所述附加搜索结果项目具有相关度得分,并且所述生成包括使用基于所述搜索查询的针对所述附加搜索结果项目的描述字段中的每个字词的相关度调整因子调整后的、每个附加搜索结果项目的初始相关度得分,对所述附加搜索结果项目进行排名。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:尼拉科坦·萨达瑞森
申请(专利权)人:电子湾有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1