存取信息的方法和/或系统技术方案

技术编号:2890034 阅读:125 留言:0更新日期:2012-04-11 18:40
一种信息存取系统,用于对以分布方式存贮且可利用通信网络存取的信息进行存取,本存取系统包括至少一个用于利用网络来存取信息的软件代理,这个代理带有数据存贮器或能对数据存贮器进行访问,以便能保存与能通过网络进行存取的信息相联系的元信息,并保存至少一个关键词,上述代理是可触发的,当数据存贮器中的元信息被输入时,该代理就被触发,对上述至少一个关键词集与该元信息进行比较,并当比较结果为正时送出一个警靠报文。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术是关于通过通信系统来存取信息的方法和/或系统。Internet上的World Web是一个著名的基于许多被连在一起的单独的通信网的通信系统。它提供了一个丰富的来自许多不同提供者的信息的来源,但因为没有中央监控,所以其丰富也就产生了如何存取特定的信息的问题。1982,科学、组织和技术的信息量每五年翻一番。到1986年为每2.2年增长一倍,而到了1992年,则是每1.6年增长一倍。随着Internet和其它网络的扩充,这个增长速度会持续上升。这些网络生存能力的关键将会是其管理信息的能力和当用户需要信息时,提供给他们所需信息的能力。按照本专利技术的一个实施例,它提供了一个存取以分布方式存放且可通过通信网络存取的信息的系统,它包括许多软件代理(agent),以便用户能通过一个代理使用网络来存取信息。在系统中给每个代理都提供了一个智能页存贮器,用来存贮可通过网络存取的各条信息的摘要以及相关的数据,还为每个代理提供了许多用于存贮关键词集合的关键词存贮器,由于预先为每条信息都在智能页存贮器中建了一个项目,这样代理就可以通过把第一或第二关键词集合或两者全部加到上述项目上来识别用户所需的信息。在一个有用的结构中,关键词的第一和第二集合可与各自不同的用户相联系。然后,就可以为不同的用户,通过不同的环境来触发上述代理,以便把关键词集合运用到页存贮器中的信息页上,或为页存贮器添加新的信息页。例如,一个代理可以在某第一用户提出存贮请求期间,运用第一关键词集合。然而,代理有可能运用一个或更多附加的关键词集合以便向该项目的一个或更多其他用户进行通告。尽管在本存取系统中可能会有多个智能页存贮器或有多个智能页存贮器能为本存取系统所用,但最好是一个代理组共享一个智能页存贮器。这种共享提供了一种使一个代理能监视页存贮器中新项目的方法,以便向潜在地感兴趣的用户通告。本专利技术的实施例提供了一种智能软件代理的分布式系统,可以为用户或用户团体执行有关信息的任务,如通过Internet的World WideWeb(W3)来执行信息任务。即软件代理是用来对在W3上发现的信息进行存贮、检索、概括及通告给其它代理的。向W3这样的网络系统是为人熟悉的,并且是按照如客户/服务器型这样的已知的体系结构建起来的,所以其详细情况就不在这里说了。在专利技术不是要为检索如W3这样的系统提供另一种工具,这类工具已有很多了。这些工具频繁地随着Web的覆盖度和检索引擎的完善度的增加而增加。相反,本专利技术的实施例是关于以下问题的已经在W3上发现了有用的信息,如何对它进行存贮,使之易于检索,并且如何能识别和通知那些可能对该信息感兴趣的用户?软件代理提供了一种著名的处理分布式的而不是集中式的基于计算机的系统的方法。每个代理通常都包括以自动方式为一个实体(人或机器)执行一项或多项任务的功能,以及支持该项或该些任务的位置极据,或存取这些数据的手段。在本说明书中,在专利技术的实施例中的用于存贮和检索信息的代理被简称为“Jasper代理”它是由以下词的首字母组成的“Joint Accessto Stored Pages with Easy Retrieval(易于检索地对所存贮的页进行联合存取)”。当从W3上可获得的信息的量很大时,最好是能避免把信息从其原始位置拷贝到一个本地服务器上。的确,有人会说这种方法与Web的整体精神相违背。所以,Jasper代理不是拷贝信息,而是只存贮相关的“元信息”(Meta-information)。正如下面将会看到的,可以认为这个元信息的级别要高于信息本身,它是关于信息的,而不是实际的信息本身。例如,它可以包括关键词、一个摘要、文件标题、广泛资源定位器(URL)和存取的日期和时间。然后,当一个检索请求发生时,这个元信息可以被用来提供一个指向实际信息或指向“索引打开”的指针。大部分已知的W3客户(Mosaic,Netscape等)都提供某些存贮用户感兴趣的页的方法。通常,这是通过允许用户创建一个与特定的URL相联系(可能是分级的)名称菜单来实现的。这个菜单设备故然很有用,但当要涉及很大量的W3页时,它就显得不方便了。基本上这种方法所提供的代表还不丰富,不足以允许获取所有关于所存贮的信息的有可能需要的东西用户只能提供一个命名页的字符串。除了诸如存取页的时间这样的有用的元信息被丢失的事实之外,一个单独的词组(名字)可能不足以在所有上下文中精确地检索一个页。作为一个简单的例子,考虑关于在药理学数据的信息检索中使用基于知识的系统(KBS)的信息在不同的上下文中,所感兴趣的可能是KBS,信息检索或药理学三者中的任何内容。除非仔细选择一个名字,使之能提到所有三个方面,否则信息就可能在它的有用的上下文中的一个或多个中被错过。这个问题与UNIX(或其它)文件系统中查找包含所需信息的文件的问题相类似,Jones,W.P.在其所写的论文《关于人类记忆模型的使用记忆扩张器的个人文件系统》中对后者进行了描述。这篇文章登在Int J.Man.Machine Studies,25,191-228,1986中。然而在大多数文件系统中,至少有按创建日期来分类文件的设备。本专利技术的实施例中所采用的解决这个问题的方法是允许用户通过一个丰富得多的元信息的集合去存取信息。下面就解释Jasper代理是如何实现这个目的的,及结果元信息是如何被利用的。现在参照着附图,只用举例的方法来说明一个按照本专利技术的一个实施例的信息存取系统,其中附图说明图1所示的是一个结合着一个Jasper代理系统的信息存取系统。图2所示的是一个以图解方式显示的由上述存取系统所提供的存贮过程。图3所的是在图1的存贮过程中使用的一个智能页存贮器的结构。图4以图解的方式显示了由上述存取系统提供的检索过程;图5所示的是图2中存贮过程的流程图。图6、7和8所示的是使用Jasper存取系统的三个信息检索过程的流程图;以及图9所的是一个用分群技术生成的关键词网络,用于向一个Jasper系统扩展和/或添加用户档案。参照图1,按照本专利技术的一个实施例的一个信息存取系统可被建成为一个已知的信息检索体系结构,如一个与Internet相连的客户一服务器型体系结构。更详细一些,一个顾客,如一个国际公司,可能有多个配备了个人计算机或工作站405的用户。这些可能被通过在顾客的客户上下文中的一个WorldWide Web(www)浏览器400连和顾客的WWW文件服务器410上。做为浏览器400的一个有效的扩展,Jasper代理105可能实际上被装在WWW文件服务器410上。顾客的WWW文件服务器410被以已知的方式和Internet上,例如通过顾客自己的网络415和一个路由器420。这样服务提供者的文件服务器425就可以通过Internet,再通过路由器被访问了。一个文本摘要生成工具120和两个数据存贮器也装在顾客的文件服务器410上,或能被它访问,二个存贮器中,一个保存用户的档案(即档案存贮器430),另一个(即智能页存贮器100)主要是为一个文件集合保存元信息。在一个基于Jasper代理的系统中,代理105自身可以被建成为一个诸如Netscape这样的已知的浏览器的扩展。代理105被与浏览器400有效地结合起来,并可以从浏览器400中提取W3页,该本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:尼古拉斯·约翰·戴维斯理查德·威克斯
申请(专利权)人:英国电讯有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1