概念上组织和表述信息的方法和系统技术方案

技术编号:2846671 阅读:232 留言:0更新日期:2012-04-11 18:40
一种概念上组织和表述信息的方法和系统(105)。使用多个用户对信息的组织和表述的响应的关联(115)以确定信息的最优组织和表述。在本发明专利技术一个实施例中,在搜索引擎结果最优化的情况下,搜索会话期间多个用户的用户活动和/或用户信息与查询进行关联以产生查询与文档的组织和表述之间的不断演化的联系。根据所述实施例的系统存储整个搜索会话期间用户的活动,从而可以对多种不同类型的用户活动和用户信息进行关联。使用关联后的用户输入允许所述系统提供相关的搜索结果而不受到现有技术中的基于关键词的系统的限制。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术的实施例一般的涉及概念上的组织信息的领域,并且尤其涉及概念相关信息的使用分析以有效组织信息。
技术介绍
随着信息的迅速增长,组织信息的能力也在增长。在互联网相关的网络(例如万维网)或者其他互联网源上可以找到大量信息源。互联网是计算机网络的扩展网络,信息通过本领域技术人员公知的方法(例如TCP和IP协议的使用等等)而在互联网上交换。互联网允许用户在连接到该网络的计算机之间发送和接收数据。这些数据可以包括网站、主页、数据库、文本集合、音频、视频或者通过连接到互联网的计算机服务器在互联网上可用的任何其他类型的信息。这些信息可以被称为文件或者文档,并且可以包括网页、网页上的数据、网页附件或者存储设备(例如数据库)中包含的其他数据。理解如此大量文档集合的意义并且在这种环境中搜索信息,在没有专门的辅助手段时是很困难的。一种辅助定位信息的方法是使用关键词。也就是说,文档可以包括表示包含在文档中的信息的选定部分的关键词。这些关键词在互联网上对其他计算机是可用的并且允许其他计算机定位该文档。为了定位互联网上的文档,远程计算机的用户使用被称为搜索引擎的搜索程序而搜索关键词。搜索引擎是允许远程用户键入一个或多个搜索词的程序。然后搜索引擎将搜索查询与文档中的关键词相比较并且至少检索文档中具有与搜索查询匹配的关键词的部分。然后搜索引擎对用户显示部分文档,例如标题。用户可以在检索到的局部文档中滚动浏览并且选择所需文档。早期的关键词搜索引擎显示出严重缺陷。例如,为了增加特定文档的出现率,文档提供者可以使用与文档相关的尽可能多的搜索词。实际上,某些文档或者搜索引擎使用文档中的每个词作为关键词。因此,搜索引擎会检索到大量与用户需要通过搜索词组合寻找的主题无关或者仅边缘相关的文档。并且,这些搜索引擎的很多用户并不熟悉形成关键词搜索查询的技巧并且产生过于宽泛的搜索从而经常检索到数千个文档。那么用户必须检查关于各个文档的摘要信息以定位所需信息。这种缺陷通过搜索引擎的演变得以解决,即包括基于一个或多个用户的搜索活动的信息组织。这些方法基于用户偏好度多数意见而不是面向文档的参数(例如文本)而对结果排序。其中一种这样的方法根据基于所使用的关键词的演化得分而对文档排序。也就是说,文档接收与搜索查询的关键词相关的相关度分数。随着用户输入搜索查询并且在查询产生的文档列表中选择文档时,文档的相关度分数被调整。这些分数被用于组织文档的结果列表以进行后续搜索。这些方法典型的(至少在部分上)基于文档接收到的“点击”次数(即文档被选择的次数)而确定相关度。这些方法通常称为“人气排序方法”或者“点击人气方法”,提供了将最吸引并且满足最大多数先前用户的文档排列在最前面的搜索结果列表。而且,点击人气方法产生反映搜索上下文的结果。例如,先前的搜索方法会返回包含所有查询词的文档,但是不会自动排除不是查询部分的词。因此,对于“Mexico”的文本匹配搜索最有可能返回关于“New Mexico”的结果。点击人气方法可以减少这种错误结果,因为搜索“Mexico”的用户通常不会点击关于“New Mexico”的页面并且会倾向于点击他们认为与“Mexico”最相关的页面,从而增加了所需文档的相关度。由于与查询词相关的信息随着时间可能改变,基于点击次数确定相关度可能导致错误结果。例如,对于“民主先驱”的特定查询,涉及早期先驱HowardDean的文档可能在2003年12月被选择了很多次,但是2004年3月输入该查询的用户可能期望在此时作为领袖的John Kerry的结果。并且,排在最前面的结果通常会受到不成比例的更多的使用,这样导致了越来越歪曲的搜索结果,其中排在最前面的结果永远不会被替代。通过使用包括基于时间和基于使用的因素在内的大量因素对响应于查询提供的信息进行组织的搜索引擎已经解决了这些缺陷中的一部分。例如,这种方法可能使用先前用户响应于特定查询的活动而调整查询响应文档的相关度。这样的用户活动可以包括点击次数以及先前用户对特定信息的选择或者使用的时间。这些方法还可以将特定文档在先前用户对其选择时排列在先前结果列表中何处、文档的实际和期望使用频率的对比以及选定的文档如何被使用等考虑在内。然而,在当前方法中仍然存在大量缺陷。例如,当前方法并没有解决非常稀少的查询的问题,其中并没有汇集足够的用户活动数据。在此情况下,结果可能很少或者不存在。并且,点击结果依赖于数据源的质量和完整性。当前方法不能解决数据源质量的巨大差异。而且,当前方法受到欺骗影响,可能影响搜索结果的完整性。根据现有技术的一种示例方法试图通过在用户活动的基础上更新搜索引擎结果而解决某些问题。这种方法在名称为“SearchEngine”的美国专利No.6,421,675中进行了描述,其内容作为引用而结合于此,从而提供了对现有技术的全面描述并且明确区分本专利技术各个实施例的特征。
技术实现思路
本专利技术的一个实施例提供了一种方法,其中为多个用户提供概念相关信息集合。从两个或者更多用户中的每一个接收对于所提供的概念相关信息的一个或多个响应。然后来自两个或者更多用户的响应被关联(correlate),并且基于关联后的响应而修改所述概念相关信息的表述。附图说明通过参考下面的描述可以更好的理解本专利技术,并且利用附图表示本专利技术的实施例。在附图中图1为显示根据本专利技术一个实施例的基于来自多个用户的响应的关联而修改概念相关信息集合的组织和表述的程序的流程图;图2为显示根据本专利技术一个实施例的通过基于在其他用户的类似信息搜索会话期间获取的用户活动和/或用户信息的关联而影响用户查询与存储内容的联系的程序的流程图;图3为显示根据本专利技术一个实施例的用于组织并且表述概念相关信息以及用于联系特定存储内容和各个用户查询的系统的结构图;图4显示了根据本专利技术一个实施例的三个独立用户的搜索日志;图5为显示根据本专利技术一个实施例的提供更多相关搜索结果的程序的流程图;图6为显示根据本专利技术一个实施例的提供相关查询建议的程序的流程图;图6A为显示根据本专利技术一个实施例的提供查询拼写校正建议的程序的流程图;图7为显示根据本专利技术一个实施例的提供建议查询的程序的流程图;图8为显示根据本专利技术一个实施例的提供类似结果的程序的流程图;图9为显示根据本专利技术一个实施例的对信息进行相关以提供更相关的搜索结果的程序的流程图; 图10为显示根据本专利技术一个实施例的根据与选择相关联的位置而基于用户位置提供更相关的搜索结果的程序的流程图;图11为显示根据本专利技术一个实施例的基于用户位置对用户提供更相关的搜索结果的程序的流程图;以及图12为显示根据本专利技术一个实施例的数字处理系统的结构图。具体实施例方式概述本专利技术的实施例提供了用于概念上组织和表述信息的方法和系统,其中使用用户对信息组织和表述的响应的关联以确定信息的最优组织和表述。在本专利技术一个实施例中,在搜索引擎结果优化的上下文中,搜索会话期间多个用户的用户活动和/或用户信息与查询进行关联,以影响查询与文档的组织和表述之间的演化联系。根据这些实施例的系统存储整个搜索会话过程中的用户活动,从而可以使大量不同类型的用户活动和用户信息可以关联。使用关联的用户输入允许这些系统提供相关的搜索结果而不会产生现有技术中基于关键词的系统带来的限制。在下面的描述本文档来自技高网
...

【技术保护点】
一种方法,包括:表述概念相关信息集合给多个用户;从两个或者更多用户中的每一个接收一个或者多个对于所述概念相关信息的表述的响应;将来自两个或者更多用户的响应进行关联;以及基于所述关联后的响应而修改所述概念相关信 息的表述。

【技术特征摘要】
【国外来华专利技术】US 2003-12-8 60/528,139;US 2004-5-24 10/853,552;US1.一种方法,包括表述概念相关信息集合给多个用户;从两个或者更多用户中的每一个接收一个或者多个对于所述概念相关信息的表述的响应;将来自两个或者更多用户的响应进行关联;以及基于所述关联后的响应而修改所述概念相关信息的表述。2.根据权利要求1所述的方法,其中所述概念相关信息集合包括一个或者多个不同形成的具有不同表述的集合页面。3.根据权利要求2所述的方法,其中所述一个或者多个响应包括所述概念相关信息集合的选择或者未选择部分。4.根据权利要求3所述的方法,其中基于关联后的响应而修改所述概念相关信息的表述包括重新形成一个或者多个所述集合页面。5.根据权利要求1所述的方法,其中从两个或者多个用户中的每一个接收到的响应为各个用户的搜索引擎活动信息。6.根据权利要求5所述的方法,其中修改所述概念相关信息的表述包括将特定信息与对应用户查询相联系。7.根据权利要求5所述的方法,其中所述搜索引擎活动信息包括用户搜索引擎会话中的所有信息。8.根据权利要求5所述的方法,其中所述从两个或者多个用户中的每一个接收到的响应是从搜索引擎活动信息的组中选择的,所述搜索引擎活动信息的组包括查询—选择信息、选择—查询信息、选择—选择信息、查询—查询信息以及其组合。9.一种系统,包括服务器数字处理系统,用于发送概念相关信息集合到多个客户端数字处理系统,从两个或者多个用户中的每一个接收一个或者多个对于所述概念相关信息的表述的用户响应,对来自两个或者更多用户的响应进行关联,并且基于关联后的响应而修改所述概念相关信息的表述;以及一个或者多个客户端数字处理系统,用于表述所述概念相关信息给多个用户并且发送用户响应到所述服务器数字处理系统。10.根据权利要求9所述的系统,其中所述概念相关信息集合包括一个或者多个不同形成的具有不同表述的集合页面。11.根据权利要求10所述的系统,其中所述一个或者多个响应包括所述概念相关信息集合的选择或者未选择部分。12.根据权利要求11所述的...

【专利技术属性】
技术研发人员:A柯蒂斯A莱文A杰拉索利斯
申请(专利权)人:IAC搜索和媒体公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1