当前位置: 首页 > 专利查询>微软公司专利>正文

分析来自搜索系统的操作数据和其它数据的方法和系统技术方案

技术编号:2920671 阅读:179 留言:0更新日期:2012-04-11 18:40
一种系统分析来自搜索引擎的数据。用户搜索打包器分析用户搜索,将相似的用户搜索组合成用户搜索包。因子发生器考虑用户搜索和相关信息以生成各因子,其中每个因子与来自搜索结果集的特定结果相关。相关性分类器接收各因子并基于各个因子操作以产生对每个结果的判断。度量发生器基于各个因子和各个判断生成度量,且数据合成器将已提取数据格式化到数据库中。

【技术实现步骤摘要】

本专利技术涉及用于分析数据的系统和方法,该数据包括在诸如用于响应搜索请求的系统的系统操作期间编译的数据。本专利技术尤其涉及为了包括改进响应和维持系统性能的目的而分析相对较大量的数据的系统和方法。
技术介绍
结合诸如典型的搜索引擎,访问该典型搜索引擎的用户通过输入包含一个或多个搜索项的可能带有布尔操作符的搜索串等来请求搜索。作为响应,搜索引擎基于该搜索串来搜索一个或多个数据库,生成一个搜索结果集,并可能以用户可查看的信息页面或信息链接的形式将这些搜索结果返回给请求用户。特别是在信息链接形式的情形中,用户可访问一个或多个链接,以查看与特定搜索结果相关的内容,且如果与搜索结果的一个或多个链接相关联的内容对用户而言是可接受的,则该用户通常继续以任何看起来适当的方式来采用这种可接受的内容。然而,可能是相反的情形,因为搜索结果中没有内容满足所请求的搜索,搜索结果对用户而言是不可接受的(至少从该用户的角度看来)。在这种情形中,用户可决定输入新的搜索串或修改先前输入的搜索串,并查看基于该新的或经修改的搜索串的来自搜索引擎的搜索结果。可以理解,这样的过程可以搜索对话的形式反复多次直到用户找到可接受的搜索结果或放弃为止。一般而言,在诸如前述搜索引擎的高质量系统中,来自用户的如在搜索串中提出的每个查询应当准确地映射到表示回答该查询的内容的搜索结果。这种目标对提供好的搜索体验是重要的,并且实际上符合这种目标可显示出以下两者之间的差异将以新的搜索对话返回该搜索引擎的快乐的满意的用户,和将相反访问另一搜索引擎的愤怒的不满意的用户。为了实现该目标,已经认识到系统本身应当进行调整或“调谐”以改进响应并保持系统性能。如可以理解的那样,这种调整可主要(但不是只)基于系统操作期间编译的操作数据和其它数据来进行。然而,如果系统特别大,具有较高的通信量等,可用于分析的这种数据量会特别大,因而不易使用并以其它方式显现为难以工作。因此,需要用于分析大量数据,特别是来自搜索系统的大量数据的系统和方法。
技术实现思路
前述需要至少部分地通过本专利技术得到了满足,在本专利技术中提供用于分析来自搜索引擎的数据的系统。该搜索引擎基于从请求用户处接收的查询串来生成一个搜索结果集,其中查询串和搜索结果一起组成用户搜索。搜索结果包括至少一个结果,其中每个结果指向相信与查询串相关的特定内容项。一系列相关用户搜索组成一个对话,并且搜索引擎存储每个用户搜索及相关信息。在该系统中,用户搜索打包器(USB)分析用户搜索,以找出这些用户搜索中相似的用户搜索,并将这些相似的用户搜索组成用户搜索包,而意图处理器(IP)基于来自USB的用户搜索包产生意图。每个意图是被认为是彼此相关的一个或多个对话的组合。因素发生器(FG)考虑用户搜索及相关信息以产生因素,其中每个因素关于来自一个搜索结果集的一个特定结果。每个因素涉及一个或多个事件,其中,每个事件是与查询用户进行的动作有关的一段信息。相关性分类器(RC)接收FG为每个结果生成的因素,并基于它们操作以产生对结果的判断,其中该判断表示对在用户决定访问来自各搜索结果的结果之后用户如何判断该结果的确定。度量发生器(MG)基于由FG生成的因素和由RC生成的判断来产生度量,其中每个度量是有关结果、用户搜索或对话的度量。最后,数据合成器(DS)提取由USB、IP、FG、RC和MG生成的数据,将已提取数据格式化到一个或多个数据库,并将各数据库存储到库中,借此,可查看并聚集数据以提供反馈或生成报告。附图说明结合附图阅读前面的
技术实现思路
和以下本专利技术各实施例的详细描述,能得到更好的理解。为了说明本专利技术,在附图中示出当前优选的各实施例;然而,应理解本专利技术并不限于所示的精确排列和装置。在附图中图1是示出其中可组合本专利技术各方面和/或各部分的通用计算机系统的框图,以及图2是根据本专利技术各实施例示出用于分析来自诸如搜索引擎之类的较大系统的数据的数据分析流水线的框图。具体实施例方式计算机环境图1和以下讨论旨在提供一种本专利技术和/或其部分可在其中实现的适当计算环境的简要一般说明。尽管不是必需的,本专利技术将在由诸如客户机工作站或服务器的计算机执行的诸如程序模块的计算机可执行指令的一般环境中进行说明。通常,程序模块包括执行特定任务或实现具体抽象数据类型的例程、程序、对象、组件、数据结构等等。此外,本领域技术人员将理解,本专利技术和/或其部分可在其它计算机系统配置中实践,包括手持式装置、多处理器系统、基于微处理器的或可编程的电器消费品、网络PC、小型计算机、大型计算机等等。本专利技术还可在任务由经通信网络链接的远程处理装置执行的分布式计算环境中实践。在分布式计算环境中,程序模块可被置于本地和远程存储器存储设备中。如图1所示,示例性通用计算系统具有常规个人计算机120等,包括处理单元121、系统存储器122以及把包括系统存储器的各种系统组件耦合到处理单元121的系统总线123。系统总线123可能是若干总线结构类型中的任何一种,包括存储器总线或存储器控制器、外围总线、以及使用多种总线体系结构的任一种的局部总线。系统存储器包括只读存储器(ROM)124和随机存储器(RAM)125。含有帮助如启动期间在个人计算机120中元件之间传递信息的基本例程的基本输入/输出系统(BIOS)126被存储在ROM 124中。个人计算机120还包括读取和写入硬盘(未示出)的硬盘驱动器127、读取或写入可移动磁盘129的磁盘驱动器128、以及读取或写入诸如CD ROM或其它光学介质等可移动光盘131的光盘驱动器130。硬盘驱动器127、磁盘驱动器128和光盘驱动器130分别通过硬盘驱动器接口132、磁盘驱动器接口133和光盘驱动器接口134连接至系统总线123。诸驱动器及其相关联计算机可读介质为计算机120提供计算机可读指令、数据结构、程序模块和其它数据的非易失性储存。尽管在此所述示例性环境采用了硬盘、可移动磁盘129和可移动光盘131,但本领域技术人员应理解也可在示例性操作环境中使用其它类型计算机可访问的能够存储数据的计算机可读介质。这样的其它类型的介质包括诸如磁带盒、闪存卡、数字视频盘、Bernoulli卡式磁带、随机存取存储器(RAM)、只读存储器(ROM)等等。包括操作系统135、一个或多个应用程序136、其它程序模块137和程序数据138的众多程序模块,可存储在硬盘、磁盘129、光盘131、ROM 124或RAM 125中。用户可通过诸如键盘140和定位装置142的输入装置把指令和信息输入个人计算机120。其它输入装置(未示出)可包括诸如话筒、操纵杆、游戏垫、卫星接收器、扫描仪等等。这些和其它输入装置常常通过与系统总线相耦合的串行端口接口146连接到处理单元121,但是它也可通过其它接口相连,如并行端口、游戏端口或通用串行总线(USB)。监视器147或其它类型的显示装置也通过诸如视频适配器148的接口和系统总线123相连。除了显示器147,个人计算机通常包括其它外围输出装置(未示出),如扬声器和打印机。图1的示例性系统还包括主机适配器155、小型计算机系统接口(SCSI)总线156、以及与SCSI总线156相连的外部存储装置162。个人计算机120可以在使用与一台或多台远程计算机,诸如远程计算机149的逻辑本文档来自技高网
...

【技术保护点】
一种用于分析来自搜索引擎的数据的系统,所述搜索引擎基于从请求用户接收的查询串生成一组搜索结果,所述查询串和所述搜索结果共同包括用户搜索,所述搜索结果包括至少一个结果,每个结果指向被认为是与所述查询串相关的特定内容项,从而一系列相关用户搜索包括一对话,所述搜索引擎存储每个用户搜索和相关信息,所述系统包括:用户搜索打包器(USB),分析用户搜索以找出这些用户搜索中的相似搜索,并将这些相似用户搜索组合成用户搜索包,意图处理器(IP),基于来自所述USB的用户搜索包生 成意图,每个意图是被认为是彼此相关的一个或多个对话的组合,因素发生器(FG),考虑用户搜索和相关信息来产生因素,每个因素与来自一组搜索结果的特定结果相关,每个因素与一个或多个事件相关,每个事件是与查询用户所执行的动作相关的一段信息, 相关性分类器(RC),接收由所述FG对每个结果生成的因素,并基于所述因素操作以生成对所述结果的判断,所述判断表示对在用户决定访问来自各搜索结果的结果时,用户如何判断该结果的确定,度量发生器(MG),基于由FG生成的因素和由R C生成的判断来产生度量,每个度量是有关结果、用户搜索或对话的度量,以及数据合成器(DS),提取由所述USB、IP、FG、RC和MG生成的数据,将所述已提取数据格式化到一个或多个数据库,并将所述数据库存储到库中,从而可查看并聚集数据以 提供反馈或生成报告。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:BE安德森小FH贝尔JC芬格JJ马尔斯曼K卡那瓦特MB米德兰PM玛罗莱普斯清水刚TD怀特Y张
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1