概念上组织和表述信息的方法和系统技术方案

技术编号:7123797 阅读:199 留言:0更新日期:2012-04-11 18:40
提供了一种对查询提供响应的方法和系统。相同搜索会话期间发出的多个选择被联系。从用户接收查询并且对应于所述查询提供搜索结果。响应于用户发出的选择,提供一个或者多个联系的选择。在本发明专利技术一个实施例中,搜索结果URL与一个或者多个查询相联系,其中所述URL的选择和所述查询包含在搜索会话中。响应于查询,提供包含一个或者多个URL和与各个URL联系的任何查询的搜索结果。

【技术实现步骤摘要】

本专利技术的实施例一般的涉及概念上的组织信息的领域,并且尤其涉及概念相关信息的使用分析以有效组织信息。
技术介绍
随着信息的迅速增长,组织信息的能力也在增长。在互联网相关的网络(例如万维网)或者其他互联网源上可以找到大量信息源。互联网是计算机网络的扩展网络,信息通过本领域技术人员公知的方法(例如TCP和IP协议的使用等等)而在互联网上交换。互联网允许用户在连接到该网络的计算机之间发送和接收数据。这些数据可以包括网站、主页、数据库、文本集合、音频、视频或者通过连接到互联网的计算机服务器在互联网上可用的任何其他类型的信息。这些信息可以被称为文件或者文档,并且可以包括网页、网页上的数据、网页附件或者存储设备(例如数据库)中包含的其他数据。理解如此大量文档集合的意义并且在这种环境中搜索信息,在没有专门的辅助手段时是很困难的。一种辅助定位信息的方法是使用关键词。也就是说,文档可以包括表示包含在文档中的信息的选定部分的关键词。这些关键词在互联网上对其他计算机是可用的并且允许其他计算机定位该文档。为了定位互联网上的文档,远程计算机的用户使用被称为搜索引擎的搜索程序而搜索关键词。搜索引擎是允许远程用户键入一个或多个搜索词的程序。然后搜索引擎将搜索查询与文档中的关键词相比较并且至少检索文档中具有与搜索查询匹配的关键词的部分。然后搜索引擎对用户显示部分文档,例如标题。用户可以在检索到的局部文档中滚动浏览并且选择所需文档。早期的关键词搜索引擎显示出严重缺陷。例如,为了增加特定文档的出现率,文档提供者可以使用与文档相关的尽可能多的搜索词。实际上,某些文档或者搜索引擎使用文档中的每个词作为关键词。因此,搜索引擎会检索到大量与用户需要通过搜索词组合寻找的主题无关或者仅边缘相关的文档。并且,这些搜索引擎的很多用户并不熟悉形成关键词搜索查询的技巧并且产生过于宽泛的搜索从而经常检索到数千个文档。那么用户必须检查关于各个文档的摘要信息以定位所需信息。这种缺陷通过搜索引擎的演变得以解决,即包括基于一个或多个用户的搜索活动的信息组织。这些方法基于用户偏好度多数意见而不是面向文档的参数(例如文本)而对结果排序。其中一种这样的方法根据基于所使用的关键词的演化得分而对文档排序。也就是说,文档接收与搜索查询的关键词相关的相关度分数。随着用户输入搜索查询并且在查询产生的文档列表中选择文档时,文档的相关度分数被调整。这些分数被用于组织文档的结果列表以进行后续搜索。这些方法典型的(至少在部分上)基于文档接收到的“点击”次数(即文档被选择的次数)而确定相关度。这些方法通常称为“人气排序方法”或者“点击人气方法”,提供了将最吸引并且满足最大多数先前用户的文档排列在最前面的搜索结果列表。而且,点击人气方法产生反映搜索上下文的结果。例如,先前的搜索方法会返回包含所有查询词的文档,但是不会自动排除不是查询部分的词。因此,对于“Mexico”的文本匹配搜索最有可能返回关于“New Mexico”的结果。点击人气方法可以减少这种错误结果,因为搜索“Mexico”的用户通常不会点击关于“New Mexico"的页面并且会倾向于点击他们认为与“Mexico”最相关的页面,从而增加了所需文档的相关度。由于与查询词相关的信息随着时间可能改变,基于点击次数确定相关度可能导致错误结果。例如,对于“民主先驱”的特定查询,涉及早期先驱Howard Dean的文档可能在 2003年12月被选择了很多次,但是2004年3月输入该查询的用户可能期望在此时作为领袖的John Kerry的结果。并且,排在最前面的结果通常会受到不成比例的更多的使用,这样导致了越来越歪曲的搜索结果,其中排在最前面的结果永远不会被替代。通过使用包括基于时间和基于使用的因素在内的大量因素对响应于查询提供的信息进行组织的搜索引擎已经解决了这些缺陷中的一部分。例如,这种方法可能使用先前用户响应于特定查询的活动而调整查询响应文档的相关度。这样的用户活动可以包括点击次数以及先前用户对特定信息的选择或者使用的时间。这些方法还可以将特定文档在先前用户对其选择时排列在先前结果列表中何处、文档的实际和期望使用频率的对比以及选定的文档如何被使用等考虑在内。然而,在当前方法中仍然存在大量缺陷。例如,当前方法并没有解决非常稀少的查询的问题,其中并没有汇集足够的用户活动数据。在此情况下,结果可能很少或者不存在。 并且,点击结果依赖于数据源的质量和完整性。当前方法不能解决数据源质量的巨大差异。 而且,当前方法受到欺骗影响,可能影响搜索结果的完整性。根据现有技术的一种示例方法试图通过在用户活动的基础上更新搜索引擎结果而解决某些问题。这种方法在名称为 "Search Engine”的美国专利No. 6,421,675中进行了描述,其内容作为引用而结合于此,从而提供了对现有技术的全面描述并且明确区分本专利技术各个实施例的特征。
技术实现思路
本专利技术提供了一种方法,该方法包括接收并记录查询,所述查询接收自多个用户;确定对应于所述查询的搜索结果;接收并记录所述多个用户的一个或多个搜索结果选择;将所述选择与所记录的查询相关联;从用户处接收包含所述查询的信号;以及响应于所述查询而将包含与所述查询关联的选择的一个或多个搜索结果提供给所述用户。本专利技术还提供了一种系统,该系统包括服务器数字处理系统(DPS),其中该DPS能够从多个用户接收查询、响应于所述查询而将一个或多个搜索结果提供给所述用户,其中每个用户能够选择所提供的搜索结果中的至少一个,所述DPS还能够接收并记录包含所述用户的一个或多个搜索结果选择的信号、将所记录的搜索结果选择与所记录的查询相关联、接收所述查询、以及响应于所述查询而提供一个或多个包含与所述查询关联的搜索结果的搜索结果;以及能够与所述服务器DPS通信的一个或多个客户端DPS,其中所述通信包括将查询以及搜索结果选择中的至少一者提供给所述服务器DPS以及接收一个或多个搜索结果。本专利技术还提供了一种系统,该系统包括服务器数字处理系统(DPS),其中该DPS 能够从多个用户接收第一查询、确定对应于所述第一查询的多个搜索结果,其中每个用户能够选择所提供的搜索结果中的至少一个,所述DPS还能够将所述多个搜索结果提供给所述用户、将所记录的搜索结果选择与所记录的特定选择相关联、接收查询、以及响应于所述查询而提供多个搜索结果,其中所述多个搜索结果包含了所述特定选择和关联的搜索结果选择;以及能够与所述服务器DPS通信的一个或多个客户端DPS,其中所述通信包括将查询以及特定选择和搜索结果选择中的至少一者提供给所述服务器DPS以及接收一个或多个搜索结果。附图说明通过参考下面的描述可以更好的理解本专利技术,并且利用附图表示本专利技术的实施例。在附图中图1为显示根据本专利技术一个实施例的基于来自多个用户的响应的关联而修改概念相关信息集合的组织和表述的程序的流程图;图2为显示根据本专利技术一个实施例的通过基于在其他用户的类似信息搜索会话期间获取的用户活动和/或用户信息的关联而影响用户查询与存储内容的联系的程序的流程图;图3为显示根据本专利技术一个实施例的用于组织并且表述概念相关信息以及用于联系特定存储内容和各个用户查询的系统的结构图;图4显示了根据本专利技术一个实施例的三个独立用户的搜索日志本文档来自技高网
...

【技术保护点】
1.一种方法,该方法包括:接收并记录查询,所述查询接收自多个用户;确定对应于所述查询的搜索结果;接收并记录所述多个用户的一个或多个搜索结果选择;将所述选择与所记录的查询相关联;从用户处接收包含所述查询的信号;以及响应于所述查询而将包含与所述查询关联的选择的一个或多个搜索结果提供给所述用户。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:A·柯蒂斯A·莱文A·杰拉索利斯
申请(专利权)人:IAC搜索和媒体公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1