一种可扩展标记语言文档修改痕迹的记录方法技术

技术编号:2865400 阅读:266 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种可扩展标记语言(XML,即Extensible  Markup  Language)文档修改痕迹的记录方法,属于计算机内容管理和出版技术领域。现有的技术方法是使用特定的工具,例如常用的文字编辑软件,将业务数据保存在专有的文件格式当中以记录数据的修改痕迹,普遍存在业务数据难以自动识别和重用的问题。本发明专利技术所述的方法采用一种将修改痕迹数据和具体XML文档格式相分离的方式,以基于过程的技术手段记录XML文档的修改痕迹。采用本发明专利技术所述的方法,可以支持任意格式的XML文档的修改痕迹记录,并同时兼顾记录精度和存储空间两个方面的要求。

【技术实现步骤摘要】

本专利技术属于计算机内容管理和出版
,具体涉及一种可扩展标记语言文档(XML文档)修改痕迹的记录方法。
技术介绍
XML是“Extensible Markup Language”的缩写,即可扩展标记语言。它是由国际互联网标准组织W3C发展并支持的技术,由于它的简单通用和跨平台特性,获得众多组织的支持而得到迅速的发展。目前,XML技术的应用已经非常的广泛,许多行业已经利用XML技术制定了相关的行业信息标准,越来越多的应用系统也开始使用XML技术来存储和交换业务数据。这些业务数据常常包含敏感的信息,例如报业,由于它经营新闻这一特殊的产品,要求对新闻编辑全程实施跟踪管理,每一个文字的修改变更都要有明确的责任人。因此对这些业务数据实施修改痕迹跟踪记录和版本管理显得尤为重要。修改痕迹是指对一篇文档的各种修改情况,包括文字的内容、格式或者顺序的变化。修改痕迹记录的目的在于保留文档的各种修改情况,并在需要时(例如新闻报道时出现文字错字要追究责任人时)详细展示这些变化信息。现在市场上有一些文字编辑工具(例如WORD、WPS和方正采编稿件编辑器)能够记录文字的修改痕迹,但这些工具所处理的都是自己专有的文档格式(例如doc或wps),而不是通用的XML文档格式,因此无法在使用这些工具记录文档修改痕迹的同时获得XML数据描述的技术优势。如果把业务数据都保存在这些专有文档格式当中会存在种种缺陷首先是许多业务数据结构错综复杂,很难在这些特定的专有文档格式中表达清楚;其次是计算机应用系统要从这些复杂的专有文档格式中提取出所需的业务数据也非常的困难。因此,提供一种能够直接支持XML文档修改痕迹的记录方法,在获得XML数据描述技术优势的同时,又能以通用的方式记录其修改痕迹,对这些信息敏感的行业有非常重大的价值。
技术实现思路
针对现有技术中存在的缺陷,本专利技术的目的是针对敏感数据XML文档处理的需求特点,提出一种在多用户环境下,支持任意格式XML文档的修改痕迹记录的新方法,同时兼顾修改痕迹记录精度和数据存储空间两个方面的要求。为达到以上目的,本专利技术采用的技术方案是,包括以下步骤1)载目标XML文档,为其内容建立一个独立的修改痕迹记录文件,所述的XML文档即可扩展标记语言文档;2)将目标XML文档的所有元素和属性节点一一映射到修改痕迹记录,目标XML文档的每一个元素和属性节点都有一个相对应的修改痕迹数据记录;3)在用户修改目标XML文档的过程中,同时更新其相应的修改痕迹记录的信息,包括修改内容、操作者、时间、版本号信息;4)重复上述步骤,获得增量的修改痕迹记录信息;5)在查看XML文档内容变化时,可以从修改痕迹记录中提取出详细的修改痕迹信息,展现文档的历史修改情况。更进一步,为使本专利技术具有更好的效果步骤1)中修改痕迹记录文件和目标XML文档是相分离的,其格式不受目标XML文档格式的影响。步骤3)中,目标XML文档内容的更新和修改痕迹数据记录的更新是同步进行的;修改痕迹记录信息的更新是增量式的,也就是说当目标XML文档的节点内容发生变化时,只需要记录相应部分的修改痕迹数据,而不是目标文档全部内容的备份。步骤5)中,该方法还可以从修改痕迹记录文件反向生成目标XML文档以前版本的内容,通过比较修改痕迹节点创建和删除的版本号与目标版本号的大小,就可以决定某一个节点是否应该出现在目标版本中,从而生成目标XML文档内容。与现有技术相比,本专利技术的效果在于1)本专利技术基于过程的修改记录,可以实时反映XML文档的修改情况,可以在多用户工作环境下精确记录XML文档内容的各种修改情况;2)本专利技术中采用增量式的记录方式,同时兼顾了记录精度和存储空间两个方面的要求;3)本专利技术修改痕迹记录和具体的XML文档格式(所代表的应用意义)相分离,因此适用于各种各样格式的XML文档的修改痕迹记录,具有非常高的灵活性;4)支持版本回溯,可以重现XML文档在某个历史版本下的状态,或者将文档内容恢复到以前的版本。本专利技术之所以具有上述显著效果,主要是因为1、本专利技术所述的方法基于过程的修改记录可以在用户修改目标XML文档的同时准确地记录内容的变化情况,相比其他方法(如一些编辑器所采用的基于结果比较的修改痕迹记录方法)有更高的时间和空间准确性。与基于结果比较的修改痕迹记录方法不同,本专利技术方法所采用的基于过程的修改痕迹记录方法能够极大地提高修改痕迹记录的精度。例如,对一段XML文本内容“1111”,当在其中第3个字符位置再插入一个“1”后,变为“11111”,本专利技术可以准确地反映出后来的“1”是在一个具体的时刻,在第3个位置插入的内容。而基于结果比较的修改痕迹记录方法只能反映出该段文字多出了一个“1”,而无法指出是在具体那个位置和时间。2、增量式的修改痕迹记录方式可以最小化修改痕迹记录对数据存储空间的需求。相比完全备份文档版本管理方式,能大大节省存储空间。理论上说(根据实施方式的不同,会有微小的差异),本专利技术方法所采用的增量式修改痕迹记录方式,在增加新版本的时候所需的修改痕迹数据存储空间与该版本实际增加的信息量相等。而采用完全备份的版本管理方式,增加新版本时所需的修改痕迹存储为原文档大小×2+新增信息量。举一个例子来说,对于一篇1万字的文档,对其进行修改,增加了100个字的内容,本修改痕迹方案所需的数据存储空间大约为10000+100=10100字,而完全备份方式的修改痕迹存储方案所需的存储空间为10000*2+100=20100字。由此可见本专利技术方法能极大地节约数据的存储空间。3、本专利技术所述方法中修改痕迹记录和具体的XML文档格式(所代表的应用意义)相分离,因此该方法适用于各种各样格式的XML文档的修改痕迹记录,具有非常高的灵活性,特别适用于政府、传媒等对信息敏感的行业。其实现也比较简单,能够方便地应用到XML文档数据加工处理系统中。附图说明图1是本专利技术方法的技术流程图;图2是实施案例“新华社多媒体编辑系统”的主界面截图;图3是版本历史记录浏览的实施方式示意图;图4是修改痕迹浏览视图的实施方式示意图。具体实施例方式下面结合附图和实施例对本专利技术作进一步的描述本专利技术所述方法的实现比较简单,可以以多种方式应用到各种XML文档数据加工处理系统中。如图2示,新华社多媒体新闻产品编辑系统是一个图文并茂,所见即所得的多媒体编辑系统,其新闻产品是一种以XML格式描述的文档,需要经过编辑、审阅、发布等一系列步骤的处理。由于新华社是我国非常重要的信息集散地,对信息特别敏感,因此新华社要求在整个生产过程中对新闻产品实施修改痕迹跟踪记录。如图1所示,,包括以下步骤1)装载目标XML文档,为其内容建立一个独立的修改痕迹记录文件;为提高系统的灵活性,在本实施例中我们采用了XML文档格式存储修改痕迹数据。将修改痕迹数据和目标XML文档相分离可以实现两个重要的目的首先,不需要把修改痕迹的数据加入到用户的XML文档当中,也就是说用户无需为了记录文档的修改痕迹而更改现有的XML文档的格式,这样可以很好地保护用户现有的投资。其次,独立的修改痕迹数据记录文件可以与目标XML文档的具体应用意义相分离,这样修改痕迹数据记录就可以适应各种不同的XML文档,从而适应各种不同的应用需求,使得系统具有很高的灵活性。2)将目本文档来自技高网
...

【技术保护点】
一种可扩展标记语言文档修改痕迹的记录方法,包括以下步骤:1)装载目标XML文档,为其内容建立一个独立的修改痕迹记录文件,所述的XML文档即可扩展标记语言文档;2)将目标XML文档的所有元素和属性节点一一映射到修改痕迹记录,目 标XML文档的每一个元素和属性节点都有一个相对应的修改痕迹数据记录;3)在用户修改目标XML文档的过程中,同时更新其相应的修改痕迹记录的信息,包括修改内容、操作者、时间、版本号信息;4)重复上述步骤,获得增量的修改痕迹记录信 息;5)在查看XML文档内容变化时,可以从修改痕迹记录中提取出详细的修改痕迹信息,展现文档的历史修改情况。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘洋
申请(专利权)人:北京北大方正电子有限公司北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1