当前位置: 首页 > 专利查询>雅虎公司专利>正文

查询自动分类的搜索处理制造技术

技术编号:2834397 阅读:218 留言:0更新日期:2012-04-11 18:40
使用搜索请求处理搜索结果,包括分析所接收到的查询以提供对被找到信息的更精确的理解。通过将查询分解为单位以及定义单位之间的各种关系来从一组查询中生成概念网络。通过这些概念网络,查询可被自动分为多个类别,或者更普遍地,可与分类的一个或多个节点相关联。分类可被用于改变搜索结果或向用户表示的结果。作为搜索结果或表示的改变实例,表示可包括对相关搜索查询项的“建议”。作为其它实例,搜索语料库可根据类别来改变,或者向用户表示的结果的排序或选择可根据类别来改变。

【技术实现步骤摘要】
【国外来华专利技术】
总的来说,本专利技术涉及网络和互联网的搜索以及接口系统,更 具体地,涉及提供包括多种功能的增强搜索功能性的搜索系统,其 中,才艮据一种或多种分类系统自动分类4臾索查询,以及其中,可从 过去的查询和/或关于查询的用户行为自动生成分类系统。
技术介绍
随着互联网以及万维网(网络)上用户可用的大量网页和々某体 内容的出现,存在向用户提供现代化的方法以过滤并获得来自网络 的期望信息的需要。已经开发了搜索系统和进程来满足用户获得期望信息的需求。这种4支术的实例可通过Yahoo!、 Google、以及其它 网站来访问。典型地,用户输入查询,然后4叟索进程返回与查询相 关的一个或多个链接(在搜索网页的情况下)、文档、和/或参考文 献(在不同4臾索语料库的情况下)。返回的链接可能与用户实际查 找的紧密相关,或者可能与其完全不相关。查询结果的关联性 部分地可以是所输入实际查询以及所使用的搜索系统(基础收集系 统)的稳定性的函凄t。关联性可以是由用户主^L地确定的或者由用 户可能正在查找的内容客观地确定的。用户llr入的查询通常地由 一个或多个词组成。例如,Hawaii 是一个查询,所以New York City,以及New York City law enforcement也是一个查询。因而,总体来i兌,查询^f人类大脑来 i兌是不完整的。换句话i兌,人们不会按照查询进4亍自然思考。它们是部分地由查询搜索引擎或查找库目录的需要而强加的人工构造。 人们也不会仅按照单个词来进行自然思考。人类思考的依据是自然冲既念。例如,Hawaii和New York City才艮据对词凄t的测量是 长度完全不同的查询,但它们共享一个重要的特性它们每个都由 一个才既念组成。然而,查询New York City law enforcement是不 同的,其由两个截然不同的4既念New York City和law enforcement 组成。人们还才艮据概念之间的逻辑关系进行思考。例如,法律实施 和警察是相关概念,因为警察是法律实施的重要机构;录入这 些概念中的一个的用户可能对与其它概念相关的网站感兴趣,即使 那些网站不包含用户录入的特定单词或短i吾。作为这种思考才莫式的 结果,人们通过输入一个或多个自然概念而不是简单的可变长度序 列的单个词来自然i也建立查询,并且查询通常不包4舌用户可能知道 的所有相关概念。另外,用户意图不必要反映在查询的各个词中。 例如,law enforcement是一个才既念,而分开的词law和 enforcement并不单独传达与组合这两个词相同的用户意图。搜索提供者使用的当前技术不能以与人们创建它们相同的方 式来理解查询。例如,现有4臾索引擎通常搜索用户输入的确切的词 或短语,而不是基本的自然概念或用户心里实际存在的相关概念。 这可能是妨碍搜索提供者确认用户意图和提供最佳搜索结果和内 容的最重要的原因。可以看出,需要提供一种改进的搜索和接口技术,其旨在提供 更加符合用户可能感兴趣的实际相克念的结果以及更好的用户体-验 的结果。
技术实现思路
本专利技术的实施例提供了 一种用于处理搜索请求的系统和方法, 包括分析接收到的查询以提供对查找的信息更加精确的理解。例 如,基于在查询中一起出现的单位才莫式,通过将查询分解成单位并 定义单位之间的各种关系来从一组查询中生成概念网络。可生成对 应于不同查询组(例如,表示不同时间周期或不同;也理区i或)的大 量不同扭克念网络。才艮据这些概念网络,可将查询自动分类成类别, 或者更通常地,可使查询与一个或多个分类节点相关联。分类可用 于改变搜索结果或对用户的表示结果。作为搜索结果或表示的改变实例,表示可包括对于相关搜索查 询项的建议,,列表。作为其它实例,溲索的语料库可才艮据类别而 改变,或者显示给用户的结果的排序和选择可根据类别而改变。在一些实施例中,使用习得的一组查询节点对进行分类,其中, 一个对将特定的查询映射到分类系统中的特定节点。可根据人工指 定哪个查询与哪个节点相匹配来初始化习纟寻的组,并且^W亍随着4臾 索越来越多而逐渐增强。增强的一种方法包^^艮踪后查询点击4亍为 以确定查询的类别估计^^f可与通过后查询点击;f于为(例3。,查询之后用户选择的搜索结果的特定点击)证明的查询的实际查询类别不 同。在一些实施例中,对于一些单位和扭无念类别是已知的,并且查 询可包含已知的或未知的或者对查询的不同部分的不同类别已知 的单位或概念。在这些情况下,可从部分查询的类别和多种类别中 推断整个查询的类别。下面的详细描述与附图 一起将提供对本专利技术的性质和优点更 好理解。附图说明图1是根据本专利技术实施例的信息检索和通信系统的简化高级方 框图。图2是根据本专利技术实施例的通信媒体内容的信息检索和通信网 络的简化方框图。图3是示出了才艮据本专利技术实施例的相克念网络的示图。图4是才艮据本专利技术实施例的查询处理引擎的简化方框图。图5是单位发生器的简化方框图。图6是自动查询分类器的实施例的方框图。图7是包括根据查询记录和查询的类别表示进行搜索的搜索引 擎的信息检索和通信系统的方^f匡图。图8是包括根据查询分类将查询引导到一个或多个搜索引擎的 查询导向器的信息检索和通信系统的方框图。图9是包括根据参照记录的查询的查询分类来修改查询记录以 形成l奮改的查询记录的预处理器的信息才企索和通信系统的方框图。图IO是自动分类系统的用户界面的一个实施例的示图。图11是用于输入搜索和才是供结果的用户界面的一个实施例的 示图。具体实施方式 I. 综述A.网络实现图1示出了根据本专利技术实施例的包括客户系统20的信息检索 和通信网络10的总的概述。在计算机网络10中,客户系统20通 过互联网40或其他通信网络(例如,通过任何局域网(LAN)或 广域网(WAN)连接)连接至任意数量的服务器系统50,至50n。 如这里将要描述的,根据本专利技术配置客户系统20,以使其与服务器 系统5(h至50N中的任何一个进行通信,例如,访问、接收、检索 和显示々某体内容和i者如网页的其他4言息。图1所示系统中的多个元件包4舌传统的、众所周知的元件,无 需在此进行详细解释。例如,客户系统20可包括台式个人计算机、 工作站、笔记本电脑、个人数字助理(PDA)、移动电话、或任何 WAP可用的装置或者任何其它能够直接或间接与互联网接口的计 算装置。典型地,客户系统20运行浏览器程序(例如,Microsoft's Internet Explorer 浏览器、Netscape Navigator 浏览器、Mozilla 浏览器、Opera 浏览器、或者在移动电话、PDA、或其它无线装 置等的情况下的WAP可用浏览器),其允许客户系统20的用户通 过互联网40访问、处理、和浏览来自服务器系统5(h至50N的对用 户可用的信息和页面。客户系统20通常还包括一个或多个用户接 口装置22(例如,键盘、鼠标、触摸屏、笔等),用于与由服务器 系统5(h至50w或其它服务器提供的页面、格式和其它信息一起和 通过浏览器在显示器(例如,监视屏、LCD显示器等)上提供的图 形用户界面(GUI)进行交互。本专利技术适用于互联网,互联网指的 是特定全球互联网络的网络。然而,应该理解,可使本文档来自技高网
...

【技术保护点】
一种计算机执行方法,用于使用户搜索查询与分类系统的节点相关联,其中,所述分类系统的每个节点均表示可对查询进行分类的类别,所述方法包括:    接收用户搜索查询;    使用使多个单位与其它单位相关的概念网络,生成对应于在所述用户搜索查询中表示的概念的一组一个或多个查询单位;    访问分类系统数据结构,其中,所述分类系统是表示类别的每个节点和对于作为节点特定概念网络的彼此相关的多个节点的等级;    对一组单位节点对测试所述一组一个或多个查询单位,以确定该组单位节点对是否包括与所述一组一个或多个查询单位相匹配的一个或多个记录的单位;    如果所述一组一个或多个查询单位与单位节点对不匹配,则根据所述组单位节点对中的类似单位测试一组一个或多个查询单位;以及    对于至少多个用户搜索查询,当发生用户动作以单独表示所述用户搜索查询的类别时,修改所述组单位节点对以反映所述用户搜索查询的所述类别。

【技术特征摘要】
【国外来华专利技术】US 2004-12-6 11/006,4661.一种计算机执行方法,用于使用户搜索查询与分类系统的节点相关联,其中,所述分类系统的每个节点均表示可对查询进行分类的类别,所述方法包括接收用户搜索查询;使用使多个单位与其它单位相关的概念网络,生成对应于在所述用户搜索查询中表示的概念的一组一个或多个查询单位;访问分类系统数据结构,其中,所述分类系统是表示类别的每个节点和对于作为节点特定概念网络的彼此相关的多个节点的等级;对一组单位节点对测试所述一组一个或多个查询单位,以确定该组单位节点对是否包括与所述一组一个或多个查询单位相匹配的一个或多个记录的单位;如果所述一组一个或多个查询单位与单位节点对不匹配,则根据所述组单位节点对中的类似单位测试一组一个或多个查询单位;以及对于至少多个用户搜索查询,当发生用户动作以单独表示所述用户搜索查询的类别时,修改所述组单位节点对以反映所述用户搜索查询的所述类别。2. 包括权利要求1的所述方法,进一步包括为所述组单位节点对读取在存储器中的单位节点对的初始组,其中,所述初始组是 人工生成的并且在所述测试步骤之前生成。3. 包括权利要求1的所述方法,其中,表示用户搜索查询的类...

【专利技术属性】
技术研发人员:希亚姆卡普尔吉格纳舒帕里克乔希迪帕
申请(专利权)人:雅虎公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1