基于文档的信息和统一资源定位符管理方法和设备技术

技术编号:2841764 阅读:219 留言:0更新日期:2012-04-11 18:40
本发明专利技术允许用户动态地管理在承载一个或者多个链接的文档内的历史数据,并且保持由这些链接定义的关系。本发明专利技术不仅跟踪从源文档到目的文档的链接,而且还跟踪从目的文档回到源文档的链接,基于这些链接的内容/命名以分级方式组织这些链接,并且以实时和有意义的方式向用户显示该链接信息。

【技术实现步骤摘要】

本专利技术一般涉及文档管理,尤其涉及跟踪和组织在历史文档之间的链接。
技术介绍
1948年EDVAC计算机的研制经常被引证为计算机时代的开始。从那以来,计算机系统已经发展成非常复杂的设备,而且可以在许多不同的装置中找到计算机系统。计算机系统一般包括诸如半导体和电路板之类的硬件和也称为计算机程序的软件的组合。每天,计算机用户面临着管理几十封电子邮件消息、在他们个人计算机和服务器上的数以千计的文件、以及数十亿个网页并从中检索信息的令人畏惧的任务。管理这些来自大量来源的数不胜数的信息是困难和费时的任务。利用我们今天工作的互连本性,这些信息源中的许多经由链接彼此相连并且连接到其它参考。这样的链接的主要示例是统一资源定位符(URL)。统一资源定位符提供了在万维网上的文档和其它资源的全局地址。该地址的第一部分指示使用什么协议,第二部分指定该资源所位于的IP地址或者域名。因此,URL暗示了在源文档和目的文档之间的重要关系。当前,管理这些关系的唯一方法是通过诸如GoogleTMDesktop Search或者GoogleTMPagerank之类的搜索算法/产品。然而,这样的解决方案具有重大的欠缺,其中它们仅仅有助于在输入一个或多个关键字之后识别文件。当从这样的工具接收了结果时,仍难以跟踪哪些文档包含哪些链接(URL)。另外,记住每个链接(URL)的引用位置并且找到其相关文档是个难题。以相关的呈现形式人工地组织和保存全部链接(URL)在当前几乎是不可能的。需要有一种较好的技术来帮助用户动态地管理在承载一个或多个链接的文档之内或者之间的历史数据、以及保持由这些链接所定义的关系。该技术需要不仅跟踪从源文档到目的文档的链接,还跟踪从目的文档回到源文档的链接,基于这些链接的内容/命名以分级方式组织这些链接,并且以实时和有意义的方式向用户显示该链接信息。
技术实现思路
本专利技术提供了用于管理在承载一个或多个链接的文档之内或者之间的历史数据、并且保持由这些链接定义的关系的方法、设备和程序产品。本专利技术不仅从源文档到目的文档跟踪这个信息,而且从目的文档回到源文档跟踪这个信息。更具体而言,本专利技术提供了一种用于管理在多个文档内的链接的方法。该方法从打开从多个文档中选择的源文档开始,扫描该源文档以便获得文档链接,并且对于每个找到的文档链接、将指示该源文档名称和文档链接的项目添加到链接数据库中。在一个实施例中,该方法然后对于任何相关的关键字扫描由该文档链接所指向的文档,然后如果找到任何文档,则经由关键字项目将该相关关键字包含到该链接数据库中。关键字项目包含关键字本身、源文档名称、文档中的包含相关关键字的文档链接。在一个实施例中,本专利技术然后分析该源文档以便获得相关关键字,在该链接数据库内的关键字项目中搜索从该源文档中分析出的相关关键字的任何出现,并且创建包含与从该源文档中分析出的相关关键字相匹配的关键字的文档列表。然后向用户呈现包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表(例如,经由临时书签文件夹或者分屏视图)。在另一个实施例中,本专利技术在链接数据库内的文档链接项目中搜索当前源文档的任何出现,然后为每个找到的项目创建反向引用链接,并且然后向用户呈现(例如,经由临时书签文件夹或者分屏视图)。由本专利技术使用的源文档可以采用许多形式,包括但不限于字处理器文档、可移植文档格式(PDF)文件、电子邮件、网站、即时消息和电子笔记。本专利技术还可以基于源文档的结构、以分级方式组织源文档内的文档链接。在一个实施例中,本专利技术通过以下步骤来实现这个目的创建基础书签文件夹;分析源文档的结构以便确定文档链接的逻辑分组;基于文档链接的逻辑分组创建链接类别;分析源文档和链接内容以便获得相关关键字;以及基于链接子类别向基础书签文件夹创建书签子文件夹,其中每个书签子文件夹的名称基于相关的关键字。附图说明在下文中结合附图描述本专利技术的各种实施例图1描述了用于实现本专利技术实施例的示例系统的高级框图。图2说明了根据本专利技术、用于创建和保持历史文档之间的链接的方法的流程图。图3说明了根据本专利技术、用于从链接数据库中提取有用信息并且向用户呈现该有用信息的流程图。图4说明了本专利技术对其进行操作的文档示例。图5说明了根据本专利技术的链接数据库的一个实施例。图6说明了本专利技术对其进行操作的示范网站。图7是根据本专利技术、用于组织和分级地书签标记给定文档内到各个网站的多个链接(URL)的方法的流程图。图8说明了根据本专利技术、在图4中的源文档,其中在该源文档内的链接被分级地书签标记和组织了。然而应当注意到,附图仅仅说明了本专利技术的示例实施例,而且因此其不被认为对本专利技术范围的限制,因为本专利技术可以允许其它同样有效的实施例。具体实施例方式参见附图,其中类似的数字在几个附图中都表示类似的部分。图1描述了根据本专利技术的实施例、经由网络130连接到客户端132的计算机系统100的高级框图表示。计算机系统100的主要部件包括一个或多个处理器101、主存储器102、终端接口111、存储设备接口112、I/O(输入/输出)设备接口113、和通信/网络接口114,所有这些经由存储器总线103、I/O总线104、和I/O总线接口单元105相连接以用于部件间通信。计算机系统100包含一个或多个可编程中央处理单元(CPU)101A、101B、101C、和101D,此处将它们总称为处理器101。在实施例中,计算机系统100包含相对大的系统特有的多个处理器;然而在另一个实施例中,做为选择,计算机系统100可以是单个CPU系统。每个处理器101执行存储在主存储器102中的指令并且可以包括一或多级芯片内高速缓存。主存储器102是用于储存数据和程序的存储器。主存储器102在概念上是单个单一体,但是在其它实施例中,主存储器102为更复杂的配置,诸如高速缓存和其它存储设备的分级结构。例如,存储器102可以以多极高速缓存的形式存在,而且这些高速缓存可以进一步由功能划分,以便一个高速缓存保持指令同时另一个保持由一个或者多个处理器使用的非指令数据。如在任意各种所谓的不均匀存储器存取(NUMA)计算机体系结构中所知的那样,存储器可以进一步分布并且与不同的CPU或者CPU组相关联。存储器102包含链接管理器150、链接数据库152、和用户接口页面154。虽然将链接管理器150、链接数据库152、和用户接口页面154图示说明为包含在计算机系统100中的存储器102内,但是在其它实施例中,它们中的一些或者全部可以在不同的计算机系统上(例如,在客户端132上),而且可以例如经由网络130远程访问。计算机系统100可以使用虚拟寻址机制,其允许计算机系统100中的程序好象它们仅仅访问了大的、单一的存储设备实体而不是访问多个、较小的存储设备实体那样运转。因此,虽然将链接管理器150、链接数据库152、和用户接口页面154图示说明为包含在主存储器102内,但是这些单元不必全部完全同时包含在同一存储设备中。在一个实施例中,链接管理器150包括能够在处理器101上执行的指令或者能够由在处理器101上执行的指令解释的语句,以便执行如下参考图2-8进一步描述的功能。在另一个实施例中,链接管理器150可以以微码的形式实现。在另一实施例中,链接管理器150可以经由逻辑门和/或其它恰本文档来自技高网
...

【技术保护点】
一种用于管理多个文档内的链接的方法,该方法包含步骤:打开从多个文档中选择的源文档;扫描该源文档以便获得文档链接;对于在该源文档中找到的每个文档链接,将指示该源文档的名称和文档链接的项目添加到链接数据库中;扫描 由该文档链接指向的目的文档以便获得任何相关的关键字;以及经由关键字项目将该相关关键字包含在链接数据库中,该关键字项目包括该关键字、源文档名称、以及包含该相关关键字的目的文档的文档链接。

【技术特征摘要】
US 2005-12-8 11/297,3101.一种用于管理多个文档内的链接的方法,该方法包含步骤打开从多个文档中选择的源文档;扫描该源文档以便获得文档链接;对于在该源文档中找到的每个文档链接,将指示该源文档的名称和文档链接的项目添加到链接数据库中;扫描由该文档链接指向的目的文档以便获得任何相关的关键字;以及经由关键字项目将该相关关键字包含在链接数据库中,该关键字项目包括该关键字、源文档名称、以及包含该相关关键字的目的文档的文档链接。2.一种用于管理多个文档内的链接的方法,该方法包含步骤打开从多个文档中选择的源文档;扫描该源文档以便获得文档链接;对于在该源文档中找到的每个文档链接,将指示该源文档的名称和文档链接的项目添加到链接数据库中;在该链接数据库内的文档链接项目中搜索当前源文档的任何出现;以及为每个找到的项目创建反向引用列表。3.如权利要求2所述的方法,其中该方法还包含步骤向用户呈现反向引用列表。4.如权利要求3所述的方法,其中,经由临时书签文件夹向用户呈现反向引用列表。5.如权利要求3所述的方法,其中,经由分屏视图向用户呈现反向引用列表。6.如权利要求1所述的方法,其中该方法还包括步骤分析该源文档以获得相关关键字;在该链接数据库内的关键字项目中搜索从该源文档中分析出的相关关键字的任何出现;以及创建包含与从源文档中分析出的相关关键字相匹配的关键字的目的文档列表。7.如权利要求6所述的方法,其中该方法还包含步骤向用户呈现包含与从源文档中分析出的相关关键字相匹配的关键字的文档列表。8.如权利要求7所述的方法,其中,经由临时书签文件夹向用户呈现该文档列表。9.如权利要求7所述的方法,其中,经由分屏视图向用户呈现该文档列表。10.如权利要求1所述的方法,其中,源文档从下面的组中选出,该组包含字处理器文档、可移植文档格式(PDF)文件、电子邮件、网站、以及电子笔记。11.如权利要求1所述的方法,其中,该文档链接是统一资源定位...

【专利技术属性】
技术研发人员:布莱恩P沃伦菲尔特理查德M泰斯扎卡里A加鲍蒂莫西P克拉克
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1