用于评估搜索引擎的质量的方法和系统技术方案

技术编号:2849687 阅读:240 留言:0更新日期:2012-04-11 18:40
一种用于评估一个或多个搜索引擎的质量的方法和系统,通过从查询日志(307,407,408)检索数据来监视搜索引擎(308,402,403)的用户(201)的重构会话,其中一重构会话是用户(201)发出以满足单个信息需求的至少两个对搜索引擎(308)的查询的系列。然后确定用于该搜索引擎(308,402,403)的重构会话参数,并分析该重构会话参数。该重构会话参数可以是在重构会话中的查询重构的比率或重构会话持续时间。分析单个搜索引擎的重构会话参数可确定参数是否随时间改变或根据单个搜索引擎内的不同设置确定参数。分析两个或更多个搜索引擎的重构会话参数包括比较该两个或更多个搜索引擎的参数以度量搜索质量。可使用该分析来控制一个或多个搜索引擎的操作。

【技术实现步骤摘要】

本专利技术涉及信息搜索和检索领域。具体地,本专利技术涉及使用从查询日志中提取的信息评估搜索引擎的质量。
技术介绍
搜索万维网所涉及的人中有三个群体。有提供Web的所有内容的作者。有使用搜索引擎查找其感兴趣的内容的搜索者。最后,有创建和维护搜索引擎的开发者。这三个群体有时会重叠,人们根据他们的需要常常属于几个群体。搜索引擎用户将这样的知识带入搜索过程,该知识可能没有在集合(collection)中被记录,可能没有被开发者处理和在排序函数中被处理,且可被除了提交查询的人之外的所有其他搜索者认为是不相关的。如图1中所示,用户102的知识范围和搜索引擎101的通过其集合和搜索过程的单个视野之间的重叠从一个个别用户102到另一个用户各不相同。一些用户可能会在他们如何描述内容上达成一致,但是不能在哪个查询最好地捕获该描述上达成一致。其他用户会提出完全相同的查询并且会期望找到完全不同的事物。一些人会选择在他们的查询中使用非常有限制性的语法以要求搜索引擎符合他们的请求。其他人可能会对引擎发展出信任感并让其决定应该如何处理查询。搜索引擎可信赖度的概念对于与搜索引擎的交互是必要的。它指示人们开始搜索本文档来自技高网...

【技术保护点】
一种用于评估一个或多个搜索引擎的质量的方法,该方法包括:监视(502)搜索引擎的用户的重构会话,其中一重构会话是用户发出以满足单个信息需求的至少两个对搜索引擎的查询的系列;确定(503)用于该搜索引擎的重构会话参数;以及 分析(504)该重构会话参数。

【技术特征摘要】
US 2005-3-17 11/083,2041.一种用于评估一个或多个搜索引擎的质量的方法,该方法包括监视(502)搜索引擎的用户的重构会话,其中一重构会话是用户发出以满足单个信息需求的至少两个对搜索引擎的查询的系列;确定(503)用于该搜索引擎的重构会话参数;以及分析(504)该重构会话参数。2.根据权利要求1的方法,包括根据所述分析控制(505)所述搜索引擎的操作。3.根据权利要求1或2的方法,其中,所述重构会话参数是以下组中的一个重构会话中的查询重构的比率;重构会话持续时间;被重构的查询的内容;或被重构的查询的语法。4.根据权利要求1-3中的任何一个的方法,其中,所述监视(502)重构会话的步骤包括识别在阈值时间内的重构查询,并将这些查询归组为重构会话。5.根据前面任何一个权利要求的方法,其中,所述监视(502)重构会话的步骤包括识别在阈值类似性内的重构查询,并将这些查询归组为重构会话。6.根据前面任何一个权利要求的方法,其中,所述分析(504)重构会话参数包括确定对于单个搜索引擎该参数是否随时间改变。7.根据前面任何一个权利要求的方法,其中,所述分析(504)重构会话参数包括根据单个搜索引擎内的不同设置确定该参数。8.根据权利要求2-7中的任何一个的方法,其中,所述控制(505)搜索引擎的操作控制单个搜索引擎的操作参数。9.根据前面任何一个权利要求的方法,其中,所述分析(504)重构会话参数包括比较两个或更多个搜索引擎的参数。10.根据权利要求9的方法,其中,所述控制(505)搜索引擎的操作从两个或更多个搜索引擎中选择供使用的搜索引擎。11.根据权利要求2-10中的任何一个的方法,其中,如果重构会话参数改变到预定的阈值之外,则所述控制(505)搜索引擎的操作提供警报。12.根据权利要求2-11中的任何一个的方法,其中,所述控制(505)搜索引擎的操作为该搜索引擎启动爬虫操作。13.根据权利要求2-12中的任何一个的方法,其中,所述控制(505)搜索引擎的操作向查询细化过程添加输入查询项。14.根据权利要求2-13中的任何一个的方法,其中,所述控制(505)搜索引擎的操作确定用户输入指令。15.根据权利要求2-14中的任何一个的方法,其中,所述控制(505)搜索引擎的操作启动搜索引擎内的索引改变。16.根据前面任何一个权利要求的方法,其中,所述监视(504)是在被搜索的数据集合的更新之后执行的。17.一种用于评估一个或多个搜索引擎(402,403)的质量的系统,该系统包括搜索引擎(402,403)的用户提交的查询的查询日志(407,408);用于监视搜索引擎的用户的重构会话的装置(412),其中一重构会话是用户发出以满足单个信息需求的至少两个对搜索引擎的查询的系列;用于确定搜索引擎的重构会话参数的装置(413);以及用于分析该重构会话参数的装置(411)。18.根据权利要求17的系统,其中,该系统包括用于根据所述分析控制搜索引擎(402,403)的操作的装置(420)。19....

【专利技术属性】
技术研发人员:E阿米泰A达洛U韦斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1