用于利用多种查询语言检索信息的系统、方法和软件技术方案

技术编号:2823996 阅读:221 留言:0更新日期:2012-04-11 18:40
一种示例性方法包括接收查询语言的描述;和基于所接收的查询语言描述来自动配置语言转换器。所述语言转换器或翻译器可被用于对系统进行适配以改变查询语言。

【技术实现步骤摘要】
【国外来华专利技术】相关申请本申请要求于2005年1月13日和2005年9月2日分别提交的美国临时申请60/644,282和60/713,798的优先权,两者在此通过引用被纳入。
本专利技术的不同实施例均涉及信息检索系统,尤其是用于处理多种查询语言的系统、方法和软件。
技术介绍
某些信息检索系统从公共搜索接口向用户提供对多种数据库的访问。所述多种数据库通常包括需要使用与在搜索接口处所输入的查询语言不同的查询语言的一些数据库。这样,为了有效地搜索所述数据库,所述系统包括查询翻译器,所述查询翻译器可将输入查询翻译为与其它查询语言兼容的查询。本专利技术人意识到所述系统中存在的一个问题涉及所述系统无法适应查询语言的转变。典型地,查询翻译器被设计并构建用以将查询从一种特定语言翻译为另一种特定语言。因此,如果改变或重定义输入查询语言,则翻译器无法生成有效的翻译。可重新设计并编码翻译器以适应改变,但是重新设计和重新编码在系统停工期间和编程资源方面是浪费的。而且,即使查询语言是稳定的,但系统本身可能被扩展以包括需要设计和构建新翻译器的新数据库。因此,需要对传统的用于多个数据库的翻译查询方法的替代方案。
技术实现思路
为解决上述和/或其它需要,本专利技术人设计出用于在信息检索系统中翻译查询的一个或更多个系统、方法和软件。一个示例性方法要求接收查询语言的描述,并基于接收到的查询语言的描述自动配置语言翻译器或转换器。所述方法进一步包括使用自动配置的语言转换器对用户查询进行标准化,然后生成标准化查询的多种翻译以用于多个相应内容集或数据库。然后,汇总每个数据库的结果以生成全面的搜索结果。附图说明-->图1是对应于本专利技术一个或更多个实施例的示例性信息检索系统100的框图。图2是对应于本专利技术一个或更多个实施例的示例性方法的流程图。图3是对应于本专利技术一个或更多个实施例的示例性方法的流程图。具体实施方式结合附图和权利要求,本说明书描述本专利技术的一个或更多个具体实施例。为使本领域技术人员能够实现或实践本专利技术,所述实施例以足够的细节得以示出和说明,但其仅仅是示例的而非限制性的并教导本专利技术。因此,适当时为了避免使本专利技术晦涩,本说明书可以省略本领域技术人员公知的特定信息。示例性信息检索系统图1表示结合本专利技术教导的示例性信息检索系统100。系统100包括客户端访问设备110、服务器120和内容集130。通常代表一个或多个访问设备的客户端访问设备110,包括用于通过网络与服务器120通信的硬件和软件。服务器120尤其包括处理器模块121和存储器模块122。存储器模块122包括软件(机器可读或可执行指令),用于提供产品特定搜索部件(feature)123、产品特定结果部件124、基础搜索处理机125、并行搜索处理机126、127和128、以及合并结果处理机129。产品特定搜索部件123和结果部件124是可与客户端访问设备110交互的应用服务层的部分。搜索部件123从访问设备110接收查询。结果部件123可采取结果列表的形式。通常,基础搜索处理机125具有对查询进行标准化和基于产品特定搜索或查询来定义通向特定并行搜索处理机的搜索路径的功能。在该示例性实施例中,标准化通常要求捕获中性树(neutral tree)、如抽象语法树(abstract syntax tree,AST)形式的输入查询基本结构。例如,Gale CQL Query(查询)的标准化“cat”prox/=/2//ordered“hat”(cat within two words of hat)获得以下XML结构:--><query> <positionalexpr type=”unidirectional”value=“2”>   <queryterm type=″text”value=″cat″/>   <queryterm type=″text”value=″hat″/> </positionalexpr></query>在一个实施例中,并行搜索处理机之一将该标准化查询转化或翻译为“catW2 hat”,同时,另一搜索处理机将其翻译为“cat/2 hat”。在另一实施例中,基础搜索处理机122以与Z39.50 RPN Query:cat hat within/2相兼容的形式接收“cat within 2 of Hat”查询并将这标准化为:<query> <positionalexpr type=”unidirectional”value=“2”>   <queryterm type=″text”value=″cat″/>   <queryterm type=″text”value=″hat″/> </positionalexpr></query>搜索处理机之一将所述中性树形式翻译或去标准化为QF(CCL)查询:“catW2 hat”。响应于接收Gale QF Command scan(JN=management),基础搜索处理机将命令标准化为<query> <command type=”scan”>   <queryterm field=”JN”value=”management″/> </command></query>-->其可被转换为QF:scan(JN,“management”)并行搜索处理机126、127和128(也称为代理或目标代理)具有与内容集130一同管理状态和安全性问题的功能。同样,在某些实施例中,搜索处理机处理单独类型的搜索,并且在其它实施例中,所述搜索处理机处理相同类型的搜索。在某些实施例中,并行搜索处理机在从内容集130中所找到的内容路由到合并结果处理机120之前对所找到的内容进行标准化。合并结果处理机129具有从一个或多个并行搜索处理机接收部分结果集并将这些结果合并成一个完整的诸如结果列表的结果集的功能。然后,将完整化的结果集路由回客户端访问设备110。内容集130包括内容集131、132和133,其分别耦合到或可耦合到并行搜索处理机126、127和128。内容集130可采用任何不同的形式;然而,在图1的示例性实施例中,每个内容集与其他相比均使用不同的查询语言。在某些实施例中,由于冗余度或响应度的原因,一个或多个内容集反映其它内容集的内容。对信息检索系统进行操作的示例性方法图2表示对诸如图1所示的系统100的信息检索系统进行操作的示例性方法的流程图200。流程图200包括逐次排列并予以描述的块210-260。然而,其它实施例利用多处理器或类处理器设备或被组织为两个或多个虚拟机或子处理器的单处理器来并行执行两个或多个块。其它实施例还更改处理顺序或提供不同的功能部分或块以获得类似结果。而且,还有其它实施例把所述块实现为两个或多个内连硬件模块,其中在模块之间和经由模块传送相关的控制和数据信号。因此,示例性处理流应用于软件、硬件和固件实施。在块210,所述示例性方法开始接收查询。在该示例性实施例中,这要求(entail)客户端访问设备110通过诸如本文档来自技高网...

【技术保护点】
一种方法,包括:    接收查询语言描述;和    基于所接收的查询语言描述来自动配置语言转换器。

【技术特征摘要】
【国外来华专利技术】US 2005-1-13 60/644,282;US 2005-9-2 60/713,7981、一种方法,包括:接收查询语言描述;和基于所接收的查询语言描述来自动配置语言转换器。2、根据权利要求1所述的方法,进一步包括:通过因特网连接从客户端访问设备接收用户查询;使用自动配置的语言转换器来处理用户查询以定义标准化查询;使用标准化查询的第一翻译版本以在第一数据库中识别文档;使用标准化查询的第二翻译版本以在第二数据库中识别文档;将对来自第一和第二数据库的文档进行识别的搜索结果返回给客户端访问设备。3、根据权利要求1所述的方法,其中,自动配置语言转换器包括以一种XML样式表单来接收和基于XML样式表单配置解析器。4、根据权利要求1所述的方法,其中标准化查询具有抽象语法树。5、一种系统,包括:用于接收查询语言描述的装置;和用于基于所接收的语言转换器描述来自动配置语言转换器的装置。6、根据权利要求5所述的系统,进一步包括:用于通过因特网连接从客户端访问设备接收用户查询的装置;用于使用自动配置的语言转换器来处理用户查询以定义标准化查询的装置;响应于标准化查询的第一翻译版本来在第一数据库中识别文档的装置;响应于标准化查询的第二翻译版本来在第二...

【专利技术属性】
技术研发人员:JE布赖
申请(专利权)人:汤姆森环球资源公司
类型:发明
国别省市:CH[瑞士]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1