一种基于删除标记的OOX文档数字水印方法技术

技术编号:8413305 阅读:257 留言:0更新日期:2013-03-14 02:14
本发明专利技术提出了一种基于删除标记的OOX文档数字水印方法,通过向OOX文本文档包中主文档部件增加删除修改标识符的方法,把水印信息嵌入到OOX文档中去,使得水印信息与文档的格式信息相结合,提高了水印的鲁棒性和嵌入容量,可有效的抵抗“删除文本内容”、“编辑”、“另存为”、“清除格式”等针对文本内容的攻击。因此,本发明专利技术所提出的基于删除标记的OOX文档数字水印方案为OOX文本内容认证与版权保护提供了新的关键技术,改进了数字水印技术一直存在的鲁棒性差的问题,为数字水印技术的进一步推广应用提供了理论基础和方法支持。

【技术实现步骤摘要】

本专利技术属于计算机文本版权保护
,尤指一种基于删除标记的OOX文档数字水印方法
技术介绍
Office Open XML (OOX)格式是 Microsoft 公司发布的 office2007_2010 产品所采用的新格式标准,它是互联网上最流行的文本格式之一。00X文档发布以来,它的使用范围和使用频率急速增加,很多企事业单位的重要机密文件资料都是以这种新文本文档格式保存的,并在互联网上进行传播。不法分子未经同意大量复制甚至篡改他人的文本资料,并宣称拥有版权。这给相关单位和个人带来了极大的损失。面对日益严峻的信任危机,迫切 需要行之有效的文本版权保护技术,辅助人们鉴定文本版权的真正所有者,打击盗版以及未经授权的篡改,确保公共信息秩序、打击犯罪、维护司法公正和新闻诚信。文本数字水印技术是近年发展起来的文本安全新技术,在版权保护、泄密追踪等方面有广阔的应用前景。文本是信息交流的一种重要手段,由于它可以承载水印的冗余信息非常有限,并且容易受到攻击,所以对文本水印的研究相对较少,且都没有研究如何保护00X格式文档的版权。我们提出了一种基于删除标记的00X文档数字水印方法,通过向00X文本文档包中有关部件增加删除修改标识符的方法,把水印信息嵌入到有关部件中去,可有效保护00X格式文档的版权。基于删除标记的00X文档数字水印方法是在00X文档包的主文档部件中实现的,在ZIP程序中打开一个正常的00X文档即可看到这些部件。每一个电子文档都不可避免的被编辑很多次直到最终版本的形成。这些修改编辑行为包括删除、插入、格式修改等。针对00X格式文档的每一次修改行为都会产生一定的痕迹,这些痕迹会被主文档等部件中的修改标识符(Revision Identifiers)及其属性值所记录。属性 w:rsidP, w:rsidR, w:rsidRPr, w:rsidRDefault 和 w:rsidDel 就是修改标识符。这些修改标识符是由w :p元素或w:r元素所定义的,它们的属性值是由随机的8位16进制数组成的。其中^rsidDel叫做删除修改标识符,一般不出现在主文档部件中。删除修改标识符w:rSidDel可以被添加到主文档部件的元素中,其属性值能用来隐藏编码后的水印信息,这种变化不会影响文档的使用。一般来说,绝大多数修改标识符属性值的前两位都是以“00”开头的,最后6位是随机产生的。因此,水印信息经编码转换为16进制数后可以嵌入到删除修改标识符属性值的最后6位中去。每一个元素可添加一个删除修改标识符,即可隐藏6位16进制数,即24位水印信息。
技术实现思路
本专利技术提出了一种基于删除标记的00X文档数字水印方法,通过向00X文本文档包中有关部件增加删除修改标识符的方法,把水印信息嵌入到有关部件中去,使得水印信息与文档的格式信息相结合,提高了水印的鲁棒性和嵌入容量,可有效的抵抗针对文本内容的攻击,从而实现了一种有效的OOX文档版权保护方法。为解决以上技术问题,本专利技术采用如下方案 一种基于删除标记的OOX文档数字水印方法,所述方法包括水印嵌入方法和水印提取方法,分别包括下列步骤 水印嵌入方法具体步骤为 (1)首先读取OOX格式文档包中的主文档部件document,xml文件,并提取出所述document, xml文件中的各个节点下的元素、属性和属性值; (2)针对每一段落,提取元素,然后将删除修改标识符W:rsidDel以及6位16进制的水印信息添加到w:r元素中; (3)重复步骤(2)直到所有水印信息嵌入完成; (4)添加已嵌入水印的主文档部件document,xml到原OOX文档包中; 水印提取方法步骤为 (5)首先读取OOX格式文档包中的主文档部件document,xml文件,并提取出所述document, xml文件中的各个节点下的元素、属性和属性值; (6)针对每一段落,提取元素,并提取元素中的删除修改标识符W:rsidDel属性值的后六位; (7)重复步骤(6)直到所有元素中的删除修改标识符w:rSidDel属性值提取完成,即水印信息提取完成。本专利技术的有益效果本专利技术实施例针对00X格式文本文档提出了一种基于删除标记的00X文档数字水印方法,通过向00X文本文档包中主文档部件增加删除修改标识符的方法,把水印信息嵌入到00X文档中去,使得水印信息与文档的格式信息相结合,提高了水印的鲁棒性和嵌入容量,可有效的抵抗“删除文本内容”、“编辑”、“另存为”、“清除格式”等针对文本内容的攻击。因此,本专利技术所提出的基于删除标记的00X文档数字水印方案为00X文本内容认证与版权保护提供了新的关键技术,改进了数字水印技术一直存在的鲁棒性差的问题,为数字水印技术的进一步推广应用提供了理论基础和方法支持。附图说明图I为水印嵌入前的主文档部件“document, xml”中的部分代码。图2为水印嵌入后的主文档部件“document, xml”中的部分代码。图3水印嵌入流程图。图4水印提取流程图。具体实施例方式为使本专利技术的目的、技术方案更加清晰,下面结合附图对本专利技术实施例所提出的基于删除标记的00X文档数字水印算法进行详细说明。00X格式文档的每一次修改行为都会产生一定的痕迹,这些痕迹会被主文档等部件中的修改标识符(Revision Identifiers)及其属性值所记录。如图I所示,w:rsidP, w:rsidR, w:rsidRPr, w:rsidRDefault就是修改标识符。这些修改标识符是由w p元素或w:r元素所定义的,它们的属性值是由随机的8位16进制数组成。图I是嵌入水印前的主文档部件“document, xml”中的部分代码,图2是嵌入水印后的主文档部件“document, xml”中的部分代码,其中w:rsidDel叫做删除修改标识符。基于添加删除修改标识符的数字水印嵌入算法流程如图3,步骤如下 输入原始载体文档D,原始水印信息M,私钥k ;输出隐写文档S ; 步骤I :利用私钥k和非对称加密算法RSA,对原始水印信息进行加密,得到加密后的水印信息I’ I’ =E (k, I),并将之转换为16进制编码H = H1H2. . . Hi...; 步骤2 :计算H的16进制编码长度Ien (H),并将Ien(H)转换为16进制数据附加在H前面得到A'; 步骤3 :利用XML文档解析技术,从原始载体文档D的ZIP包中读取主文档部件“document, xml”的所有内容给C :C = C1C2. . . Ci...;读取setting部件的所有内容给G G=G1G2. . . Gi...;步骤 4 :从 C :C = C1C2. . . C1...中提取一对 run 元素 “〈w:r>〈/w:r>” 给 R ; 步骤5 :增加一个删除修改标识符及其属性值到R中; 步骤6 :从H = H1H2. . . Hi...中读取6位16进制信息,替换步骤5增加的删除修改标识符属性值的后六位; 步骤7 :如果所有的run元素“〈w:r>〈/w:r>”都增加了删除修改标识符,而水印信息还没有嵌完,则向setting部件G G = G1G2. . . Gi...本文档来自技高网
...

【技术保护点】
一种基于删除标记的OOX文档数字水印方法,其特征在于,所述方法包括水印嵌入方法和水印提取方法,分别包括下列步骤:水印嵌入方法具体步骤为:(1)首先读取OOX格式文档包中的主文档部件document.xml文件,并提取出所述document.xml文件中的各个节点下的元素、属性和属性值;(2)针对所述document.xml文件每一段落,提取w:r元素,然后将删除修改标识符w:rsidDel以及6位16进制的水印信息添加到w:r元素中;(3)重复步骤(2)直到所有水印信息完全嵌入所述document.xml文件中;(4)添加已嵌入水印的主文档部件document.xml到原OOX文档包中;水印提取方法步骤为:(5)?首先读取OOX格式文档包中的主文档部件document.xml文件,并提取出所述document.xml文件中的各个节点下的元素、属性和属性值;(6)?针对所述document.xml文件每一段落,提取w:r元素,并提取w:r元素中的删除修改标识符w:rsidDel属性值的后六位;(7)重复步骤(6)直到所有w:r元素中的删除修改标识符w:rsidDel属性值提取完成,即水印信息提取完成。...

【技术特征摘要】

【专利技术属性】
技术研发人员:付章杰孙星明周璐束建钢
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1