用于知识搜索的系统和方法技术方案

技术编号:7317421 阅读:162 留言:0更新日期:2012-05-04 06:15
知识搜索和映射系统和方法自动构造知识搜索地图,所述知识搜索地图表示所搜索的主题、其相互关系、以及通过例如自然语言或布尔查询的处理检索的有关响应,其中,所述自然语言或布尔查询经由知识搜索工具被自动提交到数据库。

【技术实现步骤摘要】
【国外来华专利技术】
本申请涉及用于访问存储在基于计算机的数据库系统中的信息的自动知识搜索系统和方法。更具体地,本申请涉及信息网络的导航以及交互式知识搜索环境中的搜索思考过程的自动捕获。
技术介绍
在信息技术的历史期间,已努力组织并理解不断增加的量的数据。虽然在关系数据库系统和商业智能系统的领域中已经进行了很多开发以帮助结构化数据的管理,但非结构化和异构数据管理的领域仍然是非常低效的。关键字搜索技术依然是主要的访问模型。 在语义技术中的最近进步产生了通过这样的搜索操作所检索的信息的精确性和相关性的提尚。然而,搜索的范例依然非常不适合于搜索者的需要。搜索者发出查询并接收结果, 但在很多情况下结果在数量上是巨大的,且必须在筛选结果时投入很多时间来找到特别重要的信息段。图1示出用于使用常规关键字搜索应用来检索查询结果的用户界面。具体地,在图1中,示出了 Google 搜索。关键字,S卩,“roller bearing (滚柱轴承)”被输入搜索框130中。当选择karch(搜索)按钮132时,返回“roller bearing”的结果134的列表。知识可视化技术被开发来帮助用户更好地理解结果集合的范围和内容。类似地, 面向本体的访问系统例(如语义web)试图通过导航分类学的揭露来向搜索者提供允许用户基于分类学术语来选择信息的子集的指导。图2示出用于数据可视化的用户界面,作为知识可视化工具的例子。具体地,在图2中,示出了Grokker 搜索。关键字,即,“roller bearing”被输入搜索框230中。当选择搜索按钮(“Grok”) 232时,针对“roller bearing” 返回的结果234显示在“Map View(地图视图)”中。这些常规导航系统具有从搜索者的意图分析中去除分类法的缺点。这会产生搜索者必须跨过的理解差距,以便有效地受益于所提出的信息观点。常规搜索技术的另一关键缺点是它们的事务(transactional)性质。每次搜索是完全独立的事件,且在搜索时期中没有使事件关联的持久信息。该动作的独立性内在地与搜索者的意图不一致。搜索者常常不是为了发出单个查询的目的来使用搜索技术,而是为了通过一系列搜索请求钻研主题领域的目的来使用搜索技术,这些搜索请求通过搜索者的意图而关联。 当前的搜索和概念检索工具缺乏以有意义的方式维持这个联系的能力。作为结果,搜索工作人员必须特别记录并跟踪有关的搜索请求和其产生的结果集合之间的关系。这个过程非常冗长乏味,耗费时间,并且如果搜索者忽略捕获该过程的任何部分则遭受错误。
技术实现思路
根据本专利技术的各种方面,提供了用于提供自动知识搜索和映射能力的基于计算机的方法和系统。在一个实施例中,数据库知识搜索工具通过包括搜索位置变化识别能力和使用过滤能力的基于用户意图的结果而加强,使得当查询被提交时,它按照其与最近的查询的关系而被自动分类,并且查询结果基于搜索的领域被过滤并在框架中呈现给搜索者。在这个实施例中,用户与结果集合的交互也被识别为用户意图的指标。所提交的查询被处理为对一个或多个数据库的查询,并且自动提供对来自数据库的该查询的响应,响应根据如知识领域概念地图所定义的关键主题的分类而被过滤。特别过滤的响应被安排用于向用户进行呈现。可从查询关系分类和其它用户意图指标(例如子查询的发出或特定结果的选择和保存)自动产生用户搜索过程的机器表示。根据本专利技术的方面,不同的搜索领域将提议不同的用户概念地图和产生不同的结果表示模型。类似地,所提交的查询格式将优选地随着所应用的知识搜索技术而变化。例如,自然语言查询可用于使用语义算法的搜索引擎,而关键字查询可用于较不复杂的引擎。根据本专利技术的方面,存在可用于执行特定查询与先前查询的关系的分类的很多特定的技术,这样的技术可以包括从特定查询提取关键属性以创建查询简档(profile),以及比较该查询简档与先前查询的简档。根据本专利技术的一个方面,提供了知识搜索和映射的基于计算机的方法。该方法包括提供耦合到至少一个非瞬态存储介质的至少一个计算机处理器。所述至少一个计算机处理器被布置为执行一组处理任务,包括接收与搜索的领域有关的查询;将搜索知识地图中的查询存储在所述至少一个计算机存储介质中;将查询自动提交到一个或多个知识库; 将对查询的一个或多个响应过滤到响应关系子集中;以及使来自响应关系子集的响应的一个或多个关联到搜索知识地图中的所存储的查询。知识地图为搜索领域内的一个或多个查询提供相关的信息。该方法还包括使用包括实体-关系-实体三元组的实体-关系模型来产生搜索知识地图,包括将从所述一个或多个查询确定的主题表示为实体以及从信息分类法确定实体之间的关系。代表一个或多个查询的实体可以使其关联到对查询的一个或多个响应。响应关系子集可被分类为对查询的一个或多个响应的子组,所述子组通过信息分类法的公共关系与查询相关联。将查询提交到一个或多个知识库可以包括将该查询提交到知识搜索引擎以及将查询自动格式化为与知识搜索引擎相兼容。该方法可以包括将查询格式化为自然语言查询或关键字查询。知识搜索引擎可以包括语义索引和搜索工具,而所述一个或多个知识库可以包括语义分析知识库。知识库可包括选自下列项所组成的组的一个或多个知识库一个或多个可本地访问的知识库;包含企业知识的一个或多个知识库;以及一个或多个可公开访问的知识库。该方法还可以包括在与查询有关的搜索会话(session)期间记录用户交互以及将用户交互的机器表示存储在搜索知识地图中。根据本专利技术的另一方面,提供了知识搜索和映射系统。该系统包括耦合到至少一个非瞬态存储介质的至少一个计算机处理器。该系统还包括查询输入模块,其接收与搜索的领域有关的查询,将查询存储在搜索知识地图中,并将查询提交到一个或多个知识库。该系统还包括将对查询的一个或多个响应过滤到响应关系子集中的结果呈现器;以及使来自响应关系子集的一个或多个响应关联到搜索知识地图中所存储的查询的搜索事件记录器。知识地图为搜索领域内的一个或多个查询提供相关的信息。该至少一个处理器可以使用包括实体-关系-实体三元组的实体-关系模型来产生搜索知识地图,使得从一个或多个查询确定的主题被表示为实体,并且根据信息分类法来确定实体之间的关系。表示一个或多个查询的实体可以使其关联到对查询的一个或多个响应。响应关系子集可以被分类为对查询的一个或多个响应的子组,所述子组通过信息分类法的公共关系与查询相关联。查询输入模块可以将查询提交到知识搜索引擎并且将查询自动格式化为与知识搜索引擎相兼容。查询可以被格式化为自然语言查询或关键字查询。知识搜索引擎可以包括语义索引和搜索工具,而一个或多个知识库可以包括语义分析知识库。知识库可包括选自下列项所组成的组的一个或多个知识库一个或多个可本地访问的知识库;包含企业知识的一个或多个知识库;以及一个或多个可公开访问的知识库。搜索事件记录器可以记录与查询有关的搜索会话期间的用户交互,并且将用户交互的机器表示存储在搜索知识地图中。根据本专利技术的另一方面,提供了具有存储在至少一个非瞬态存储介质中的计算机可执行指令的计算机程序产品,所述指令在由至少一个处理器执行时执行知识搜索和映射的方法。该方法包括提供耦合到至少一个非瞬态存储介质中的至少一个计算机处理器。所述至少一个计算机处理器接收与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:J·托德亨特Y·比亚里奥斯基L·Y·布里克曼韦泽
申请(专利权)人:发明机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术