具有自动预过滤和路径选择的协作式主题服务器制造技术

技术编号：2884147 阅读：227 留言：0更新日期：2012-04-11 18:40

公开了一种基于主题内容的信息组织和获取系统，它有效地组织文件，目的在于快速而高效地搜索和获取。这种信息组织和获取系统经过完善，仅组织和获取那些相关于给定的预定义的一组主题的文件。如果该文件不具有这套给定主题中的主题，它将被排除在所提供的服务之外。与此相似，如果该文件具有某个被所提供服务特别禁止的主题，它也将被排除在外。正是以这种模式，提供者有目的地限制了所提供的搜索和获取服务的范围，可是这样做提供了一种针对用户需求的更有效的服务。这种信息组织和获取系统也支持上下文敏感搜索和获取技术，包括使用预先定义或用户定义的意图，以及使用用户专门词汇。在一种优选实施方案中，所选的这套主题组织成有多个重叠的分层结构，并有一种分布的软件结构用来支持这些基于主题的信息组织、路径选择和获取服务。文件可以与一个或多个主题相关，并通过由信息服务器维护的主题结构与每个主题联系在一起。（*该技术在2019年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理和交换领域，特别是文件的存储、组织和获取领域。可供访问的信息量在不断增加，并且信息量的增加速率也在加大。这种不断增加的信息增长，导致了用来存储、组织和获取信息的不断膨胀的资源。传统的搜索引擎，例如因特网上用来查找文件的搜索引擎，使用了各种技术响应用户查询以快速找到用户要求的文件。其中的一种技术便是建立一个对应于万维网上文件的索引数据库。通过找出用户请求和索引数据库中信息的某种联系，完成用户请求的处理，而不是真的到万维网上去找来响应用户请求。传统的搜索引擎使用一种“爬行器(crawler)”来定位文件或更新文件。一旦一个新的或是更新的文件被定位，搜索引擎便生成一个对应于该文件的目录，其中包括比如文件中最常见单词和词组的列表。还存在一些可以代替以上步骤的技术，即让文件的创建者在文件中直接增添一些关键词或词组，而这些词或词组用来给文件编制索引。为了方便起见，下文中的关键字一词就指文件索引中包含的某个词，而不管将其放置在索引中的方法。当用户输入一个查询，搜索结果依据用户查询中的词和文件索引中的关键词的匹配。本领域的技术人员可以理解一个文件的目录可能较大，万维网上基本上所有文件的索引数据库实际上极其庞大，而且将以不断增长的速率继续增加。1998年，因特网上每天约增加150万页，并且每天增速预计将继续扩大。除了增加了的存储资源的代价外，随着数据库的扩张数据库查找技术的性能在下降。随着包含某个关键词的文件越来越多，依据关键词查找的文件获取效率越来越低，也越来越不可行。在因特网上一次关键词查找返回成千上万与此关键词相关的文件不足为奇，而其中的很...

【技术保护点】
一种信息处理系统（１００）包含：服务器（１１０），拥有一组相关的服务器主题（２１，２１１，２１２），主题提取器（３１０），被配置成从源文件（２０１，３０１）中提取文件主题（２１１），文件选取器（３２０），与文件提取器运行连接，被配置成依据文件主题（２１１）是否是服务器（１１０）的一组相关服务器主题（２１，２１１，２１２）的成员主题（２１１）确定源文件（２０１，３０１）作为被选中文件，文件路径选择器（３３０），与文件选取器（３２０）运行连接，使被选中文件与成员主题（２１１）相关联。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：程以宁，
申请(专利权)人：皇家菲利浦电子有限公司，
类型：发明
国别省市：NL[荷兰]

全部详细技术资料下载我是这个专利的主人