【技术实现步骤摘要】
【国外来华专利技术】
本专利技术通常涉及信息检索系统,并且更具体地,本专利技术涉及用 于4奮订用户查询的系统和方法。
技术介绍
通常,信息检索系统(如通过因特网搜索引擎所示例的那些信 息检索信息)能够快速提供通常与用户查询相关的文档。搜索引擎 可以使用词语和文档频率的各种统计测量以及文档之间和词语之间 的关联,来确定文档对于查询的相关性。支持大多数搜索引擎设计 的 一 个关键技术假设在于,用户查询精确地表示了用户期望的信息 目标。实际上,用户通常难以明确表达好的查询。经常地,单一查询 不能提供期望的结果,并且用户频繁地输入关于相同主题的许多不 同查询。通常,这些多查询包括查询词语的宽度和特征中的变化、 猜测的实体名称、词序、词的数量中的变化等,在实现期望的结果 集之前,有时候会形成长的查询链。由于不同用户对于成功地修订 他们的查询具有差异很大的能力,因而已经提出了各种自动化的查 询》务订方法。最普通地,使用查询精化(refinement)来从较为一般的查询 生成更为精确(例如,更窄)的查询。当用户输入过于宽泛的查询 时,查询精化非常有用,其中这种过于宽泛的查询的前面的结果包 括与用户所需信息相关的文档的超集。例如,用户想要关于 Mitsubishi Galant汽车的信息,则该用户可能输入Mitsubishi 这种过于宽泛的查询,而结果将覆盖许多不同的Mitsubishi公司, 而不仅是汽车公司。由此,希望对查询进行精化(尽管因为缺少额 外上下文以确定用户需要的特定信息,这是困难的)。然而,当用户输入过于具体的查询,其中正确的修订是扩展查 询时,或者当前面的结果与用户的信息需 ...
【技术保护点】
一种用于响应于第一查询来自动建议已知高等级查询的方法,包括: 根据第一查询相对于索引的查询的修订概率和针对所述索引的查询的查询等级,来计算针对所述索引的查询的修订分值; 响应于所述修订分值,选择性地检索所述索引的查询,作为对所述第一查询的可替换查询;以及 响应于所述可替换查询是已知高等级查询,返回所述可替换查询作为候选修订查询。
【技术特征摘要】
【国外来华专利技术】US 2005-3-29 11/094,814;US 2005-3-30 11/096,198;US1.一种用于响应于第一查询来自动建议已知高等级查询的方法,包括根据第一查询相对于索引的查询的修订概率和针对所述索引的查询的查询等级,来计算针对所述索引的查询的修订分值;响应于所述修订分值,选择性地检索所述索引的查询,作为对所述第一查询的可替换查询;以及响应于所述可替换查询是已知高等级查询,返回所述可替换查询作为候选修订查询。2. 根据权利要求1所述的方法,进一步包括 响应于所述可替换查询具有修订至已知高等级查询的统计上显著的概率,返回所述已知高等级查询作为候选修订查询。3. 根据权利要求1所述的方法,其中所述第一查询是查询修订。4. 根据权利要求1所述的方法,其中所述修订分值是所述第一 查询相对于所述索引的查询的修订概率和针对所述索引的查询的查 询等级的乘积。5. 根据权利要求1所述的方法,进一步包括将查询标识为所述 已知高等级查询。6. 根据权利要求5所述的方法,进一步包括计算针对所述查询的查询出现频率; 计算针对所述查询的用户满意分值;以及根据所述查询出现频率和用户满意分值来计算针对所述查询的 等级。7. 根据权利要求6所述的方法,其中由估计搜索结果上的点击长度的用户点击行为数据来确定所述用户满意分值。8. 根据权利要求6所述的方法,其中由逆修订频率来确定所述用户满意分值。9. 根据权利要求8所述的方法,其中所述逆修订频率是所述查询的修订次数除以所述查询的出现频率的结果的逆。10. 根据权利要求1所述的方法,进一步包括创建包括所述索引 的查询的查询的索引。11. 根据权利要求10所述的方法,其中所述索引包括从所述索 引中的每个所述查询指向一个或者多个已知高等级查询的指针。12. 根据权利要求1所述的方法,其中所述修订概率包括所述索 引的查询相对于所述第一查询的行为相似性。13. 根据权利要求1所述的方法,其中所述修订概率包括所述索 引的查询相对于所述第一查询的语义相似性。14. 根据权利要求1所述的方法,其中所述修订概率包括所述索 引的查询相对于所述第一查询的句法相似性。15. 根据权利要求1所述的方法,进一步包括 记录从用户会话生成的查询数据;以及使用所述查询数据以生成所述查询的索引。16. 根据权利要求1所述的方法,进一步包括使用针对所述候选修订查询的所述修订分值作为置信度度量来 对所述候选查询划分等级。17. 根据权利要求1所述的方法,进一步包括提供所述候选修订查询作为针对所述第 一 查询的建议的修订。18. 根据权利要求17所述的方法,其中在根据所述置信度度量 的相对强度的位置中向用户显示所述建议的修订。19. 一种响应于第一查询来自动建议已知高等级查询的方法,包括记录从用户会话生成的查询数据; 在所述用户会话期间创建查询的索引;根据所述第一查询相对于索引的查询的修订概率和针对所述索 引的查询的查询等级,来计算针对所述索引的查询的修订分值,其 中所述修订概率包括所述索引的查询相对于所述第一查询的相似 性;响应于所述修订分值,选择性地检索所述索引的查询,作为对所述第一查询的可替换查询;响应于所述可替换查询是已知高等级查询,返回所述可替换查询 作为候选修订查询,其中,标识所述已知高等级查询包括计算针对查询的查询出现频率;计算针对查询的用户满意分值,其中通过估计搜索结果上的点击长度的用户点击行为数据来确定所述用户满意分值;以及作为所述查询出现频率和所述用户满意分值的乘积,计算针对所述查询的等级;响应于所述可替换查询具有修订至已知高等级查询的统计上显 著的概率,返回所述已知高等级查询作为候选修订查询;使用针对所述候选修订查询的修订分值作为置信度度量来对所 述候选修订查询划分等级;以及将所述候选修订查询提供作为针对所述第 一 查询的建议的修订, 其中在根据所述置信度度量的相对长度的位置中向用户显示所述建 议的修订。20. —种将查询标识为已知高等级查询的方法,包括 计算针对所述查询的查询出现频率; 计算针对所述查询的用户满意分值...
【专利技术属性】
技术研发人员:DR贝利,AJ巴特尔,DA科恩,B恩格尔哈特,PP纳亚克,
申请(专利权)人:谷歌公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。