当前位置: 首页 > 专利查询>微软公司专利>正文

用于搜索的用户定义的相关性排序制造技术

技术编号:4599654 阅读:235 留言:0更新日期:2012-04-11 18:40
此处详细描述了一种特别地允许搜索引擎使用用户定义的关联函数的技术。在本技术的一种方法中,描述了一种应用用户定义的关联函数的方法。在该方法中,将复杂的搜索查询分解成简单运算符。将简单运算符与用户定义的关联函数相关联。检索与搜索查询匹配的文档,并使用用户定义的关联函数来为该文档计算排名。

【技术实现步骤摘要】
【国外来华专利技术】用于搜索的用户定义的相关性排序背景数字信息的基本问题之一在于如何有效地对大量数据进行排序,以便在任何 给定时刻找出那些最相关的信息片段。为解决该问题,搜索引擎包括关联或排序函 数。这些关联函数用于将不同的权重给予需要搜索准则的文档;所分配的权重或排 名然后可用于进一步操纵信息池,例如通过按特定次序显示结果。许多搜索引擎,特别是那些用于与数据库交互的搜索引擎,使用tf-idf权重方 案的某些变体,其中一项出现在特定文档中的频率针对逆文档频率,即对该项出现 在文档池中的频率的度量来加权。不同的示例引擎将实现该方案的不同变体,且优 化单独的搜索引擎以使用其特定关联函数。概述此处详细描述了一种特别地允许搜索引擎利用用户定义的关联函数的技术。 在本技术的一种方法中,描述了 -种应用用户定义的关联函数的方法。在该方法中, 将复杂的搜索查询分解成简单运算符。将简单运算符与用户定义的关联函数相关 联。检索与搜索査询匹配的文档,并使用该用户定义的关联函数来为该文档计算排 名。在本技术的另一种方法中,描述了一种具有计算机可执行指令的计算机可读 介质。在该方法中,接收用户定义的排序函数,并接收搜索查询。将该搜索査询分 解成多个简单运算。这些简单运算中的每一个都与关联函数相关联。检索对应于这 些较简单的运算的多个结果,并使用相关联的关联函数来为这些结果中的每一个计 算排名。在本技术的另一种方法中, 一种具有总线、处理器、存储器和数据存储设备 的系统被配置成接收复杂搜索査询。该系统还被配置成将该复杂搜索査询解析成若 干较简单的运算。该系统还被配置成检索对应于这些较简单的运算的结果,并通过 应用用户定义的关联函数来为每一个结果计算排名。提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一 些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。 附图简述合并在本说明书中并形成其一部分的附图示出了各实施例,并且与说明书 一起用于解释所要求保护的主题的原理附图说明图1是其上可实现各实施例的示例性计算系统的框图。 图2是其上可实现各实施例的示例数据库表。图3是根据一个实施例的应用用户定义的关联函数的方法的流程图。 图4A是根据一个实施例的示例数据库查询。图4B是根据一个实施例的搜索树的描绘。图4C是根据一个实施例的中间搜索树的描绘。图4D是根据一个实施例的查询树的描绘。详细描述现在将详细参考若干实施例。尽管本主题将结合各替换实施例来描述,但将 理解,它们并不旨在将所要求保护的主题限于这些实施例。相反,所要求保护的主 题旨在涵盖可被包括在权利要求书所定义的所要求保护的主题的精神和范围内的 替换、修改和等效技术方案。此外,在以下详细描述中,阐明了众多具体细节以提供对所要求保护的主题 的全面理解。然而,本领域的技术人员将认识到各实施例可以在没有这些具体细节 或具有其等效物的情况下实施。在其它情况下,未详细描述公知的方法、过程、组件和电路以免不必要地使主题的各方面和特征显得晦涩难懂。以下详细描述中的各部分按照一种方法来呈现和讨论。尽管其步骤和排序在 此处描述该方法的各操作的附图(例如,图3)中公开,但这些步骤和排序是示例 性的。各实施例很好地适用于执行各种其他步骤或此处附图的流程图中所述的步骤 的变型,并且按照与此处所描绘和描述的不同的顺序。本详细描述的某些部分按照过程、步骤、逻辑块、处理、以及对可在计算机 存储器上执行的数据位的操作的其它符号表示来呈现。这些描述和表示是数据处理 领域技术人员用来将其工作的实质最有效地传达给本领域的其他技术人员的手段。 过程、计算机执行的步骤、逻辑块、处理等在此处且通常被认为是导致所需结果的 自相一致的步骤或指令的序列。步骤是需要对物理量的物理操纵的那些步骤。尽管并非必需,但这些物理量通常采用能够在计算机系统中被存储、传输、组合、比较、 或以其它方式操纵的电或磁信号的形式。原则上出于常见用法的原因将这些信号称 作位、值、元素、符号、字符、项、数字等被证明有时是方便的。然而,应当记住,所有这些和类似术语都应与适当的物理量相关联并且仅仅 是应用于这些物理量的方便的标签。如从以下讨论中清楚的,除非具体地另外指明, 否则可以理解,贯穿本专利技术,利用诸如访问、编写、包括、存储、发送、遍历、关联、标识等术语的讨论涉及计算机系统或类似的 电子计算设备的动作和处理,其操纵计算机系统的寄存器和存储器中被表示为物理(电子)量的数据并将其变换成计算机系统存储器或寄存器或其他这样的信息存 储、传输或显示设备中类似地被表示为物理量的其他数据。诸如计算系统环境10等计算设备通常包括至少某些形式的计算机可读介质。 计算机可读介质可以是可由计算机访问的任何可用介质。作为示例而非限制,计算 机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储 诸如计算机可读指令、数据结构、程序模块或其它数据这样的信息的任何方法或技 术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括但不限 于,RAM、 ROM、 EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储器、盒式磁带、磁带、磁盘存储或其它磁存储设备,或 者任何其它可用于存储所需信息并可由计算机访问的介质。通信介质通常以诸如载 波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块 或其它数据,并包括任意信息传送介质。术语已调制数据信号指的是以在信号 巾编码信息的方式设定或更改其一个或多个特征的信号。作为示例而非限制,通信 介质包括有线介质,诸如有线网络或直接线连接,以及无线介质,诸如声学、RF、 红外、和其它无线介质。以上的任何组合也应包括在计算机可读介质的范围内。某些实施例可以在由一个或多个计算机或其他设备执行的诸如程序模块等计 算机可执行指令的通用上下文中描述。 一般而言,程序模块包括执行特定任务或实 现特定抽象数据类型的例程、程序、对象、组件、数据结构等。通常,程序模块的 功能可以按需在各个实施例中进行组合或分布。参考图1,用于实现各实施例的示例性系统包括通用计算系统环境,如计算系 统环境10。在其最基本的配置中,计算系统环境IO通常包括至少 一个处理单元12 和存储器14。取决于计算系统环境的确切配置和类型,存储器14可以是易失性的(诸如RAM)、非易失性的(诸如ROM、闪存等)或是两者的某种组合。该最 基本配置在图1中由虚线16来示出。另外,计算系统环境IO还可具有附加的特征 /功能。例如,计算系统环境10还可包含附加存储(可移动和/或不可移动),包 括但不限于磁或光盘或磁带。这样的附加存储在图1中由可移动存储18和不可移 动存储20示出。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、 程序模块或其它数据等信息的任何方法或技术来实现的易失性和非易失性、可移动 和不可移动介质。存储器14、可移动存储18和不可移动存储20都是计算机存储 介质的示例。计算系统环境10还可包含允许其与其它设备进行通信的通信连接22。通信连 接22是通信介质的一个示例。在所描绘的实施例中,计算系统环境IO被示为通过 通信连接22来与数据库30进本文档来自技高网...

【技术保护点】
一种应用用户定义的关联函数的方法,包括: 将复杂搜索查询分解成简单运算符; 将所述简单运算符与所述用户定义的关联函数相关联; 检索与所述复杂搜索查询相匹配的匹配文档;以及 使用所述用户定义的关联函数来为所述匹配文档计 算排名。

【技术特征摘要】
【国外来华专利技术】US 2007-5-23 11/805,3801.一种应用用户定义的关联函数的方法,包括将复杂搜索查询分解成简单运算符;将所述简单运算符与所述用户定义的关联函数相关联;检索与所述复杂搜索查询相匹配的匹配文档;以及使用所述用户定义的关联函数来为所述匹配文档计算排名。2. 如权利要求l所述的方法,其特征在于,还包括 接收所述用户定义的关联函数。3. 如权利要求1所述的方法,其特征在于,还包括 在数据库中搜索所述匹配文档。4. 如权利要求1所述的方法,其特征在于,所述匹配文档包括由所述用户定 义的关联函数用来计算所述排名的信息。5. 如权利要求l所述的方法,其特征在于,所述计算包括所述用户定义的关 联函数使用与所述匹配文档相关联的信息来计算所述排名。6. 如权利要求1所述的方法,其特征在于,所述分解包括将同质逻辑表达式 分解成多路跳跃归并联结运算符。7. 如权利要求1所述的方法,其特征在于,所述复杂搜索査询包括布尔逻辑 查询。8. 如权利要求1所述的方法,其特征在于,所述分解包括将所述复杂搜索查 询分解成运算符树。9. --种具有用于执行以下步骤的计算机可执行指令的计算机可读介质,所述步骤包括接收用户定义的排序函数; 接收搜索査询;将所述搜索査询分解成多个简单运算;将所述多个简单运算中的每一个与所述用户定义的排序函数相关联; 检索对应于所述多个简单运算的多个结果;以及使用所述用户定义的排序函数来计算所述多个结果中的每一个的排名。10. 如权利要求9所述的计算机可读介质,其特征在于,还包括 接收多个用户定义的排序函数;以及将所述多个用户定义的排序函数与所述多个简单运算相关联。11. 如权利要求9所述的计算机可读...

【专利技术属性】
技术研发人员:D丘林J陆N哈诺卡S纳拉亚南T纳亚克F田
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1