信息管理、检索和显示系统以及相关方法技术方案

技术编号:2881200 阅读:168 留言:0更新日期:2012-04-11 18:40
本系统搜索信息资源,如一个或多个文档(18),或信息流,并以基于用户选择的显示条件或层次结构(32)的格式显示搜索结果。显示层次结构将使用户能够有效地获得感兴趣的内容。本系统执行一种检索信息的方法,该方法包括下列步骤:(a)将信息资源分为有限元素;(b)将分类标记分配到每个元素;(c)为各个元素生成可搜索的数据库记录(23),其中每个记录至少包含元素内的一个字符串;(d)提供搜索字符串;(e)搜索数据库,以查找包含搜索字符串的记录;(f)根据(至少部分地)分配到搜索所返回的元素的分类标记中的数据,按层次结构排列结果;以及(g)以层次结构显示结果。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术是搜索信息资源并从中检索信息的计算机化系统和方法,更具体来说,本专利技术是信息管理、检索和显示系统,用于搜索信息资源,并基于用户选择的显示条件或层次结构,以可折叠的/可展开的格式显示搜索的结果。
技术介绍
许多常规的搜索引擎或搜索工具(如InfoseekTM、AltaVistaTM、HotbotTM)的一个固有缺点是,搜索的结果通常按照正在搜索的每个文档(Web页)中的搜索字或短语的匹配数量来组织。这种类型的搜索结果显示要求最终用户一个一个地浏览匹配项,最终才能访问到他/她要查找的文档。此类常规搜索引擎的另一个缺点是,搜索的结果不考虑一个单词可能有多种不同意思的情况,以及在许多不同的上下文中使用的情况。例如,如果最终用户要查找有关卡通老鼠的信息,因为搜索查询将包含单词“mouse”,匹配列表将包括有关电子光标控制设备的文档、提供有关老鼠的生物信息的文档、提供有关老鼠的宠物信息的文档。因此,最终用户可能必须浏览许多此类匹配项,最终才能(如果有的话)找到涉及卡通老鼠的匹配项。因此,需要有一个这样的搜索引擎或搜索工具,以便使最终用户以这样的方式来组织搜索结果,以使最终用户有效而快速地获得感兴趣的内容。本专利技术是信息管理、检索和显示系统,用于搜索信息资源,如文档(例如,条约)、许多单个文档(例如驻留在因特网上的Web页)、信息流(例如,DNA代码、源代码、卫星数据传输信息等),并基于用户选择的显示条件或层次结构,以可折叠的/可展开的格式显示搜索的结果。这样的显示层次结构将使最终用户有效而快速地从搜索结果中获得感兴趣的内容。信息资源的类型或格式并不重要。本专利技术包括四个主要模块中断模块、索引模块、搜索模块和非中断模块。中断模块是一个专家系统,它根据定义其运行的一组专家规则来运行。中断模块分析信息资源,以将信息资源分为有限元素(如段、节、子节、小段等)。中断模块还为每一个有限元素创建分类标记,其中分配到每个有限元素的分类标记都基于对每个有限元素的内容的分析(由一组专家系统规则来定义)。分类标记可以包括标准分类,如,“Dewey十进制类型”号码。分类标记还可以包括组织属性(如关于有限元素的类型或相对于信息资源的其余部分的位置)、日期戳、分类词等。优选情况下,将分类标记插入到有限元素中。索引模块分析由中断模块标识/创建/处理的有限元素,并创建可搜索的数据库,该数据库有针对中断模块标识的每个有限元素的数据库记录。可搜索的数据库是一种反向索引,其中每个记录都包括对应的有限元素的地址或位置(反过来又包括分类标记),有限元素中包含的字符串(如单词、短语等)以及它们在有限元素内出现的频率(即,它们的权重)。在本专利技术的用户不能控制正在搜索的信息(即,因特网上的Web页)的应用场合,每个数据库记录还可能包括分类标记,因为分类标记无法由中断模块插入到有限元素中。因此,对于Web搜索应用场合,可能根本就不需要利用中断模块和非中断模块,因为对于本专利技术,每个Web页或链接都可能被认为是一个有限元素。一旦创建反向索引,就可以对反向索引进行搜索。最终用户可以提供关键字符串(如关键字、短语或符号段)作为搜索查询,用户还可以选择或定义显示层次结构或条件。所选择的显示条件将指示搜索模块如何处理搜索结果的数据。具体来说,所选择的显示条件将定义,搜索结果是否完全根据分类标记内包含的信息按某种顺序或结构来显示(以研究为中心),搜索结果是否完全取决于关键字符串在有限元素中出现的频率按某种顺序来显示(常规),或者搜索结果是否根据两种情况的组合按某种顺序或结构来显示(以文档为中心)。搜索模块访问搜索查询,并搜索反向索引,以查找与特定的搜索条件或搜索查询匹配的数据库记录。然后通过将满足搜索条件的每个有限元素的分类标记中的信息应用到所选择的显示层次结构,以可折叠的/可展开的(树形)结构显示搜索结果。例如,如果所选择的层次结构是以文档为中心的层次结构,显示层次结构的第一层次可以是,例如,创建有限元素的年份,显示层次结构的第二层次可以是,例如,有限元素在文档中出现的顺序,显示层次结构的第三层次可以,例如,基于搜索字在每个有限元素中出现的频率。搜索模块的运行,与中断模块和索引模块一样,基于一组专家规则。因此,如果搜索结果不令人满意,则修改中断模块、索引模块和/或搜索模块中的专家规则,然后再次执行该过程。一旦最终用户选择了搜索结果显示中的一个有限元素,那么非中断模块就允许最终用户查看所选择的有限元素所属的信息资源的连续部分。非中断模块将所选择的有限元素与其他相关的有限元素汇编在一起,以重新构建信息资源的连续部分。非中断模块参考所选择的有限元素的分类标记,获得有关有限元素相对于整个信息资源的位置的信息,然后用从属于该部分的所有有限元素来构建信息资源的一部分。例如,如果所选择的有限元素是文档的一个段落,那么可以配置非中断模块,以重新构建该段落所属的文档的章节。与本专利技术的其他模块一样,非中断模块的运行受一组专家规则的控制,如果结果不令人满意,可以修改这些规则。可以想象,由熟悉正在搜索的文档或信息的专家来创建和精炼规则集。例如,如果本专利技术的系统将要与《联邦管理法典》的第37卷关联,那么非常熟悉该卷的个人(或几个人)将最适合制定和微调这些规则集。对这些规则集的微调将涉及个人使用规则集连续地对该卷执行示例搜索,以及连续地修改规则集以获得所需要的内容和格式。一旦对规则集微调完毕,可以将本专利技术的搜索模块与该卷一起打包,并作为可搜索的卷来销售或分发。同样,搜索模块也可以在Web站点上运行,以便用户可以访问Web站点,并对该卷执行搜索。由于“专家”已经对规则集进行定义和微调,用户将拥有完全可操作的搜索引擎,该引擎可以根据专家掌握的卷的知识来执行搜索和显示结果。正如上文所提及的,可以想象,本专利技术的实施例可用于搜索驻留在因特网上的单个Web页,并基于用户所选择的显示条件或层次结构,采用可折叠的/可展开的格式来显示搜索结果。在这样的实施例中,采用上文所描述的形式的中断模块可能并不需要,因为每个Web页可能已经被认为是“有限元素”,且搜索引擎将无法修改Web页。相应地,在这样的应用场合,索引模块将分析每个Web页(有限元素),以创建具有每个Web页的记录的可搜索数据库。可搜索数据库中的每个记录将包括Web页的Web地址,包含在Web页中的非共用词以及它们的频率(权重),分类标记,如上文所述,这种分类标记包括基于对Web页的内容的分析的数据。索引模块还将检查每个Web页,以确定Web页的创建者是否在Web页中嵌入了分类标记,如果找到这样的嵌入分类标记,那么索引模块只需将这种预先定义的分类标记插入数据库记录中,而不需要重新创建。因此,随着本专利技术在因特网上越来越广泛地应用,Web页的创建者可能希望为他们的Web页创建他们自己的分类标记,而不是让搜索引擎为他们创建。有了这一功能,Web页设计人员就可以影响搜索结果,以便获得对Web站点的更准确描述。当然,这样的功能也可以由Web设计人员以虚假的方式使用,在这种情况下,当搜索者在查找完全不同类型的信息时,分类标记将使Web页列在搜索结果中。由于认识到这一潜在的问题,索引模块将包括一个选项,它将把Web页的实际内容与嵌入的分类标记进行比较,如本文档来自技高网...

【技术保护点】
检索信息资源上的信息的方法,包括下列步骤:(a)将信息资源分为众多有限元素;(b)将分类标记分配到每个有限元素,分类标记包括有关有限元素的内容的数据;(c)为各个有限元素生成可搜索的数据库记录,每个可搜索的数据库记录至少包含有限 元素内的一个字符串;(d)提供搜索字符串;(e)搜索可搜索的数据库,以查找包含搜索字符串的可搜索的数据库记录,从而提供搜索结果;(f)根据分配到有限元素(它们与在搜索步骤中查找到的可搜索的数据库记录相对应)的分类标记中的信息,按 层次结构排列搜索步骤的结果;(g)以层次结构显示搜索步骤的结果。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:乔治梅纳德
申请(专利权)人:伊夫色什有限公司
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1