当前位置: 首页 > 专利查询>北京大学专利>正文

一种水印嵌入和提取方法及装置制造方法及图纸

技术编号:4349839 阅读:186 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种水印嵌入和提取方法及装置,应用于数字内容的版权管理过程中,该方法包括:根据设定的区域确定规则,确定出待嵌入信息的文本文档中的可用标点区域;根据设定的位置确定规则,分别确定出每个所述可用标点区域中标点的原始位置;针对每一个可用标点区域,根据其中标点的原始位置和对应的待嵌入编码,对其中标点的位置进行调整,实现将所述待嵌入编码嵌入到对应的可用标点区域中。在提取水印时,采用对应的规则分别提取出各个可用标点区域中的嵌入编码。上述方法操作简单,嵌入的水印信息隐蔽性好、且稳定性高,同时能获得很好的视觉效果。

【技术实现步骤摘要】

本专利技术涉及数字版权管理领域,尤指一种用于数字文本的、基于标点的文本数字水印嵌入和提取方法及装置
技术介绍
随着全球信息数字化进程的日益加快,文本资料大量涌现,如个人档案、医疗记 录、学历证书、专利证件、手写签名、馆藏图书、机要文件等等都是文本的常见形式,这些文 本资料的重要性是不言而喻的。此外,随着电子商务、电子政务的日趋流行,对网上发行的 电子刊物进行盗版追踪,对来往的电子信函、公文或传真进行真伪判断、完整性认证也日益 紧迫。因此在文本资料中嵌入水印(即加入附加的信息),从而实现产权保护、信息安全维 护等也就显得尤为重要。上面所说的文本资料,有两种常见的载体形式一是纸张,二是电子文档。嵌入水印的方式也有两种显式和隐式。显式嵌入水印,指加入的信息人眼明显可见,例如半透明图像水印、在背景上印刷上单位名称、附加的条码等等。隐式嵌入水印,指加的信息人眼很难察觉,例如各种隐式的图像水印,需要用特定的仪器结合相应的软件才能识别出来。在上述几种情况的组合中,对纸质文件隐式地嵌入水印较为困难,其中又以在黑白二值的单色纸质文件(下面简称为二值纸张)中进行嵌入难度最大。纸质文件嵌入信息,最常见的是显示方式,例如在纸张背景上加上特定的背景图,写上特定的文字(如银行给客户看的样本文件,会在一些区域写上样本的字样);或采用特殊的纸张作为载体等。但在二值纸张,例如在常见的白纸黑字中隐式地嵌入信息,是很困难的。 现有的技术中,也出现了一些在二值纸张中嵌入数字水印的技术。 例如技术文献《Brassil J, Low S, Maxemchuk N F. Copyright Protectionforthe Electronic Distribution of Text Documents. Proceedings of the IEEE, 1999,87(7) :1181-1196》中,公开了通过修改行间距、字间距来调整文档的排版格式,从而实现信息的嵌入,该方法原理简洁,容易实现。其主要问题是嵌入信息的稳定性与视觉效果的矛盾很难解决如果行间距、字间距的改变量不足,则信息提取时很难做到准确;如果要保证提取的准确性,则需要较大的改变量,很容易被读者察觉,不能达到隐式的效果。 专利申请《对电子公文或文档进行加密及鉴别真伪的方法》(公开号CN1588351)中公开了将普通汉字做一些轻微的变形,人眼不易察觉,但可以通过手工或OCR技术识别出这种轻微的变形,从而达到隐式嵌入信息的目的。该方法嵌入信息量较大,稳定性高,但涉及到字库、OCR、打印输出、特定的电子文本格式(用于打印)、数据训练等技术,其工序烦琐、工作量大、制作成本非常高昂。 专利申请《基于字符拓扑结构的文本数字水印技术》(公开号CN1684115)中公开 了通过改变组成字符(串)的各笔划之间的连断关系来改变字符的拓扑结构,使变体字的 笔划组成的连通域数目发生变换,从而嵌入信息的方法。该方法的主要缺点首先是制作成 本高,此外在信息检测时的鲁棒性也不理想纸张的轻微污染可能造成原来未连通的笔划连通,而复印很容易造成原来连接的笔划断开,使连通域发生变化,从而使得通过连通域数 来检测变得很不稳定。 专利申请《一种数字水印嵌入与提取方法及装置》(公开号CNI945622A)中公开了 将文本中各字符划分区域,翻转每个区域内的点,造成区域内黑像素点发生变化,从而嵌入 信息。该方法嵌入水印的制作成本高,且由于视觉特征的限制,翻转的点只能在字符笔划边 缘处,实际是改变了笔划的粗细,对视觉效果也不够理想。 可见,现有技术中对文档进行加密(嵌入水印)的方法,存在潜入信息量大,工作 量大,制作繁琐,制作成本高的缺点;其稳定性也比较差,在复制过程中很难保持;且容易 被读者察觉,隐避效果不好,视觉效果也不佳。
技术实现思路
本专利技术实施例提供一种水印嵌入和提取方法及装置,用于解决现有技术中在文本文档中嵌入水印信息时存在的稳定性差、隐蔽性差的问题。 —种水印嵌入方法,包括 根据设定的区域确定规则,确定出待嵌入信息的文本文档中的可用标点区域; 根据设定的位置确定规则,分别确定出每个所述可用标点区域中标点的原始位 置; 针对每一个可用标点区域,根据其中标点的原始位置和对应的待嵌入编码,对其中标点的位置进行调整,实现将所述待嵌入编码嵌入到对应的可用标点区域中。 —种水印提取方法,包括 根据与嵌入水印信息时相同的区域确定规则,确定出已嵌入信息的文本文档中的 可用标点区域; 根据与嵌入水印信息时相同的位置确定规则,分别确定出每个所述可用标点区域 中标点所在的位置; 根据所述标点所在的位置,分别确定出各可用标点区域中的嵌入编码。 —种水印嵌入装置,包括 区域确定模块,用于根据设定的区域确定规则,确定出待嵌入信息的文本文档中 的可用标点区域; 位置确定模块,用于根据设定的位置确定规则,分别确定出每个所述可用标点区 域中标点的原始位置; 信息嵌入模块,用于针对每一个可用标点区域,根据其中标点的原始位置和对应 的待嵌入编码,对其中标点的位置进行调整,实现将所述待嵌入编码嵌入到对应的可用标 点区域中。 —种水印提取装置,包括 区域确定模块,用于根据与嵌入水印信息时相同的区域确定规则,确定出已嵌入 信息的文本文档中的可用标点区域; 位置确定模块,用于根据与嵌入水印信息时相同的位置确定规则,分别确定出每 个所述可用标点区域中标点所在的位置; 编码提取模块,用于根据所述标点所在的位置,分别确定出各可用标点区域中的嵌入编码。 本专利技术实施例提供的水印嵌入和提取方法及装置,通过选取可用标点区域;通过 对每一个可用标点区域中的标点位置进行调整,实现将待嵌入编码嵌入到对应的可用标点 区域中。在提取水印时,则根据调整后的标点位置采用对应的规则分别提取出各个可用标 点区域中的嵌入编码。上述方法操作简单,且由于人眼对标点位置改变的敏感度远远小于 对字符位置的改变,因此可做较大幅度的改变,使得嵌入的水印信息稳定性高,隐藏性好, 同时能够保证良好的视觉效果。附图说明 图1为本专利技术实施例中水印嵌入方法的流程图; 图2为本专利技术实施例中确定出文档片段中可用标点区域的示例图; 图3为本专利技术实施例中对确定出的可用标点区域进行频带划分的示意图; 图4为本专利技术实施例中在可用标点区域中嵌入信息后的文本片段示例; 图5为本专利技术实施例中水印提取方法的流程图; 图6为本专利技术实施例中水印嵌入装置的结构示意图; 图7为本专利技术实施例中水印提取装置的结构示意图。具体实施例方式本专利技术实施例提供的水印嵌入和提取方法,根据设定的区域选取规则在待嵌入水 印信息的文本文档中选取可用标点区域,确定出每个可用标点区域中标点所在的位置,然 后通过调整每个可用标点区域中标点的位置,达到嵌入水印信息的目的;在提取时,仍采用 相同的规则确定出已嵌入水印信息的文本文档中的可用标点区域和每个可用标点区域中 标点所在的位置,根据标点所在的位置得到嵌入的水印信息。 本专利技术实施例提供的水印嵌入方法,通过调整文本文档中标点的位置,达到嵌入 水印信息的目的,其流程图如图1所示,执行步骤如下 S101 :根据设定的区域选取规则,查找并确定出待嵌入信息的文本文档中的可用 t示点区域。 首先,利用OCR,对欲嵌本文档来自技高网
...

【技术保护点】
一种水印嵌入方法,其特征在于,包括:根据设定的区域确定规则,确定出待嵌入信息的文本文档中的可用标点区域;根据设定的位置确定规则,分别确定出每个所述可用标点区域中标点的原始位置;针对每一个可用标点区域,根据其中标点的原始位置和对应的待嵌入编码,对其中标点的位置进行调整,实现将所述待嵌入编码嵌入到对应的可用标点区域中。

【技术特征摘要】
一种水印嵌入方法,其特征在于,包括根据设定的区域确定规则,确定出待嵌入信息的文本文档中的可用标点区域;根据设定的位置确定规则,分别确定出每个所述可用标点区域中标点的原始位置;针对每一个可用标点区域,根据其中标点的原始位置和对应的待嵌入编码,对其中标点的位置进行调整,实现将所述待嵌入编码嵌入到对应的可用标点区域中。2. 如权利要求1所述的方法,其特征在于,所述根据设定的区域确定规则,确定出待嵌入信息的文本文档中的可用标点区域,具体包括获取所述文本文档中的纯文本区域;对所述纯文本区域进行文字切分和标点分析,确定出包含的可用标点;所述可用标点的前后均至少有一个相邻的其他字符;根据所述可用标点及其前后相邻的两个其他字符,定义起始边界和终止边界,得到可用标点区域。3. 如权利要求2所述的方法,其特征在于,所述可用标点区域的起始边界包括前面字符的左边界、右边界、重心位置或中心位置;所述可用标点区域的终止边界包括后面字符的左边界、右边界、重心位置或中心位置。4. 如权利要求2所述的方法,其特征在于,所述根据设定的位置确定规则,分别确定出每个所述可用标点区域中标点的原始位置,具体包括计算每个所述可用标点区域的起始边界至终止边界的距离,根据所述距离将每个所述可用标点区域划分为若干个频带;并根据每个可用标点区域中的标点所在的坐标位置,分别确定出每个可用标点区域中标点所在的频带以及对应的频带索引。5. 如权利要求4所述的方法,其特征在于,所述标点所在的坐标位置具体包括所述标点的重心、中心、左边界或右边界所在的坐标位置。6. 如权利要求4所述的方法,其特征在于,所述根据其中标点的原始位置和对应的待嵌入编码,对其中标点的位置进行调整,具体包括若所述标点所在的原始位置对应的频带索引为奇数,且对应的待嵌入编码为O,则移动所述标点的位置至频带索引为偶数的频带;若所述标点所在的原始位置对应的频带索引为奇数,且对应的待嵌入编码为l,则不改变所述标点所在的频带;若所述标点所在的原始位置对应的频带索引为偶数,且对应的待嵌入编码为O,则不改变所述标点所在的频带;若所述标点所在的原始位置对应的频带索引为偶数,且对应的待嵌入编码为l,则移动所述标点的位置至频带索引为奇数的频带。7. 如权利要求1-6任一所述的方法,其特征在于,还包括根据所述文本文档对应的待嵌入信息,确定出待嵌入的二进制数;所述二进制数的位数小于等于确定出的所述可用标点区域数量;根据所述待嵌入的二进制数和设定的信息嵌入规则,确定出每个所述可用标点区域的待嵌入编码。8. 如权利要求7所述的方法,其特征在于,所述根据所述文本文档对应的待嵌入信息,确定出待嵌入的二进制数,具体包括若所述待嵌入信息本身是或能转化为位数小于等于所述可用标点区域数量的二进制 数,则确定所述待嵌入信息或转化得到的二进制数为待嵌入的二进制数;若所述待嵌入信息本身是或能转化为位数大于所述可用标点区域数量的二进制数,或 所述待嵌入信息不是且不能转化为二进制数时;则选择一个位数小于等于所述可用标点区 域数量的二进制数,作为待嵌入的二进制数,并建立待嵌入的二进制数与所述待嵌入信息 的对应关系。9. 如权利要求8所述的方法,其特征在于,所述根据所述待嵌入的二进制数和设定的 信息嵌入规则,确定出每个所述可用标点区域的待嵌入编码,具体包括若所述待嵌入的二进制数的位数等于可用标点区域的数量,则直接将待嵌入的二进制 数包含的二进制编码分别分配给各可用标点区域作为待嵌入编码;若待嵌入的二进制数位数小于可用标点区域的数量,则通过冗余算法为各可用标点区 域分别分配待嵌入的二进制数中包含的二进制编码作为待嵌入编码。10. —种水印提取方法,其特征在于,包括根据与嵌入水印信息时相同的区域确定规则,确定出已嵌入信息的文本文档中的可用 t示点区域;根据与嵌入水印信息时相同的位置确定规则,分别确定出每个所述可用标点区域中标 点所在的位置;根据所述标点所在的位置,分别确定出各可用标点区域中的嵌入编码。11. 如权利要求io所述的方法,其特征在于,所述根据与嵌入水印信息时相同的区域确定规则,确定出已嵌入信息的文本文档中的可用标点区域,具体包括 获取所述文本文档中的纯文本区域;对所述纯文本区域进行文字切分和标点分析,确定出包含的可用标点;所述可用标点 的前后均至少有一个相邻的其他字符;根据所述可用标点、其前后相邻的两个其他字符和嵌入水印信息时定义的起始边界和 终止边界,确定出可用标点区域。12. 如权利要求11所述的方法,其特征在于,所述可用标点区域的起始...

【专利技术属性】
技术研发人员:康凯于权崔晓瑜吴於茜
申请(专利权)人:北京大学北大方正集团有限公司北京方正电子政务信息科技有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1