一种用于打印文档溯源的数字水印处理方法及装置制造方法及图纸

技术编号:17162874 阅读:46 留言:0更新日期:2018-02-01 20:56
本发明专利技术实施例提供了一种用于打印文档溯源的数字水印处理方法及装置,所述方法包括,将文本文档转换为图像,并将图像分割成文本文档中各文字对应的文字图像;计算各文字图像中的文字的欧拉数,并根据欧拉数的奇偶确定文字图像对应的数字特征;获取各文字图像的待嵌入数字水印信息,并判断数字特征与待嵌入数字水印信息是否相匹配;如果数字特征与待嵌入数字水印信息不匹配,则改变文字图像中的文字的拓扑结构,并计算改变拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与待嵌入数字水印信息相匹配。应用本发明专利技术实施例,能够提高纸质涉密文档输出的安全性。

A digital watermarking processing method and device for printing document traceability

The embodiment of the invention for a print document of the digital watermark processing method and apparatus is provided, the method includes the text document into the image, and the image is segmented into text image of the text in a text document corresponding to the Euler number to calculate the text; the text in the image, and to determine the characteristics of digital image according to the corresponding Euler number parity; obtain the text image to embed digital watermark information, and determine the digital characteristic and embedding digital watermark information is matched; if the digital characteristics and to embed digital watermark information does not match the topology change text text in the image, and calculate the Euler number change topology the text, to make the phase matching characteristics of the digital watermarking information is embedded into the Euler number. The application of the present invention can improve the security of the output of paper - related documents.

【技术实现步骤摘要】
一种用于打印文档溯源的数字水印处理方法及装置
本专利技术涉及信息安全领域,特别是涉及一种用于打印文档溯源的数字水印处理方法及装置。
技术介绍
随着电子信息技术的快速发展,社会各界的信息化程度的不断提高,各类多媒体文件如电子文档、图像、视频等被广泛地应用在人们的日常生活中。其中,电子文档具有创建快速、节约空间、运输便利等优点,成为了信息交流的便捷载体。许多企业和单位的日常文件甚至机密信息都是利用电子文档的形式进行存储与传输。这些文档中包含了多种多样的信息,具有巨大的经济价值和应用价值。但是,对于打印后的纸质文档及其复印件,由于缺乏文档溯源追踪信息,而导致无法确定文档打印的源头,造成纸质文档的随意打印、有意或无意的非法传播,进一步加大了文档打印管控的难度。基于该背景出现的数字水印技术,能够对文档版权进行有效保护,并能鉴别产品真伪,被广泛应用于版权保护、隐私通信及访问控制等多个领域,在保证电子文档安全性的同时,也确保了纸质涉密文档输出的安全性。数字水印技术是一种版权保护技术,对于视频、图像、文档等载体,将水印信息(特定标识)嵌入其中,或者对其某些特定结构进行修改。嵌入后的载体包含了水印信息,水印信息不易被察觉或修改,且载体的原价值不受到影响。水印信息可以被嵌入者进行识别与提取,并且嵌入者根据水印信息能够鉴别该数字作品所有者及授权等信息,还能够判断该作品是否经过修改。现有的用于打印文档溯源的数字水印处理方法,通过改变文档文本的行间距与字间距来进行数字水印信息的嵌入。具体的,将文档作为载体,对于通过改变文档文本的行间距来进行数字水印信息的嵌入的方法,先计算每行文字的间距,然后计算前后两个相邻行间距的比值,再根据比值确定数字水印信息的嵌入,如果相邻行间距比值与待嵌入的数字水印信息不相符,则通过改变文档文本的行间距来进行数字水印信息的嵌入,例如,规定前后两个相邻行间距的比值大于1时,嵌入的数字水印信息为1,前后两个相邻行间距的比值不大于1时,嵌入的数字水印信息为0,当第一行和第二行文字的间距,与第二行和第三行文字间距的比值为1.2,而待嵌入的数字水印信息为0,则改变第一行和第二行文字的间距,使得第一行和第二行文字的间距,与第二行和第三行文字间距的比值不大于1,从而在第一行和第二行文字之间嵌入数字水印信息0。同样,对于通过改变文档文本的字间距来进行数字水印信息的嵌入的方法,先计算每两个相邻文字的间距,然后计算前后两个相邻字间距的比值,再根据比值确定数字水印信息的嵌入,如果相邻字间距比值与待嵌入的数字水印信息不相符,则通过改变文档文本的字间距来进行数字水印信息的嵌入。但是,通过现有的用于打印文档溯源的数字水印处理方法,对于行间距算法,其水印容量过小;对于字间距算法,由于嵌入的水印信息是在文本的字间距之间,在打印文档进行复印扫描时,文字边缘的像素可能会进行翻转,造成字间距的改变,另外,复印扫描过程中如果对文档进行缩放,会使字间距差达不到阈值,若想抵抗这些攻击,则需要牺牲水印的透明性,将间距改变调整得较大,这都使得水印信息难以兼顾透明性与鲁棒性,导致水印信息的可用性比较差,降低了纸质涉密文档输出的安全性。
技术实现思路
本专利技术实施例的目的在于提供一种用于打印文档溯源的数字水印处理方法及装置,以提高数字水印的可用性,从而提高纸质涉密文档输出的安全性。具体技术方案如下:本专利技术实施例公开了一种用于打印文档溯源的数字水印处理方法,所述方法包括:将文本文档转换为图像,并将所述图像分割成所述文本文档中各文字对应的文字图像;计算各所述文字图像中的文字的欧拉数,并根据所述欧拉数的奇偶确定所述文字图像对应的数字特征;获取各所述文字图像的待嵌入数字水印信息,并判断所述数字特征与所述待嵌入数字水印信息是否相匹配;如果所述数字特征与所述待嵌入数字水印信息不匹配,则改变所述文字图像中的文字的拓扑结构,并计算改变所述拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与所述待嵌入数字水印信息相匹配。可选的,所述在改变所述文字图像中的文字的拓扑结构,并计算改变所述拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与所述待嵌入数字水印信息相匹配之后,所述的方法还包括:将所述数字特征与所述待嵌入数字水印信息相匹配的文字对应的文字图像合并。可选的,所述将所述图像分割成所述文本文档中各文字对应的文字图像,包括:将所述图像二值化,得到二值图像;从上到下逐行扫描所述二值图像,计算所扫描的每行图像的像素,并根据所述像素获取所述图像的水平投影;利用所述图像中的每行文字行间的空白间隔在所述水平投影形成的空白空隙,将所述图像分割为不同行,得到行图像;从左到右扫描各所述行图像,计算所扫描的每行图像中的所有文字的像素,并根据所述像素获取所述图像的垂直投影;利用各所述行图像中的文字之间的空白间隔在所述垂直投影形成的空白空隙,将所述行图像分割为单个的字符块,所述字符块为所述文本文档中各文字对应的文字图像;判断相邻两个字符块的间距是否大于预设阈值;当所述间距不大于所述预设阈值时,将这两个字符块合并为一个字符块。可选的,所述计算各所述文字图像中的文字的欧拉数,并根据所述欧拉数的奇偶确定所述文字图像对应的数字特征,包括:使用图像识别算法,识别出各所述文字图像中的文字的连通区域数和孔洞数;通过所述连通区域数和所述孔洞数的差值,计算所述文字的欧拉数;当所述欧拉数为奇数时,所述文字图像对应的数字特征为“1”;当所述欧拉数为偶数时,所述文字图像对应的数字特征为“0”。可选的,所述如果所述数字特征与所述待嵌入数字水印信息不匹配,则改变所述文字图像中的文字的拓扑结构,并计算改变所述拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与所述待嵌入数字水印信息相匹配,包括:如果所述数字特征与所述待嵌入数字水印信息不匹配,则提取所述文字图像中的文字骨架,并在所述文字骨架中确定嵌入数字水印信息的嵌入点,所述嵌入点为文字笔画相交的点;对所述嵌入点进行膨胀,以断开所述文字笔画相交的点,以改变所述文字图像中的文字的拓扑结构,并计算改变所述拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与所述待嵌入数字水印信息相匹配。可选的,所述提取所述文字图像中的文字骨架,并在所述文字骨架中确定嵌入数字水印信息的嵌入点,包括:利用图像形态学算法,将所述文字图像转换为只有一个像素连接的文字骨架;提取所述文字骨架的至少一个角点,将所有角点中除位于所述文字图像边缘的角点之外的任一角点作为嵌入信息的嵌入点。可选的,所述对所述嵌入点进行膨胀,以断开所述文字笔画相交的点,包括:在所述文字骨架中获取与所述嵌入点相邻的所有直线中最长的一条直线;利用最长直线斜率构造结构元,通过结构元对所述嵌入点进行膨胀,以断开所述文字笔画相交的点。本专利技术实施例还公开了一种用于打印文档溯源的数字水印处理装置,所述装置包括:分割模块,用于将文本文档转换为图像,并将所述图像分割成所述文本文档中各文字对应的文字图像;计算模块,用于计算各所述文字图像中的文字的欧拉数,并根据所述欧拉数的奇偶确定所述文字图像对应的数字特征;获取模块,用于获取各所述文字图像的待嵌入数字水印信息,并判断所述数字特征与所述待嵌入数字水印信息是否相匹配;处理模块,用于如果所述数字特征与所述待嵌入数字水本文档来自技高网
...
一种用于打印文档溯源的数字水印处理方法及装置

【技术保护点】
一种用于打印文档溯源的数字水印处理方法,其特征在于,所述方法包括:将文本文档转换为图像,并将所述图像分割成所述文本文档中各文字对应的文字图像;计算各所述文字图像中的文字的欧拉数,并根据所述欧拉数的奇偶确定所述文字图像对应的数字特征;获取各所述文字图像的待嵌入数字水印信息,并判断所述数字特征与所述待嵌入数字水印信息是否匹配;如果所述数字特征与所述待嵌入数字水印信息不匹配,则改变所述文字图像中的文字的拓扑结构,并计算改变所述拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与所述待嵌入数字水印信息相匹配。

【技术特征摘要】
1.一种用于打印文档溯源的数字水印处理方法,其特征在于,所述方法包括:将文本文档转换为图像,并将所述图像分割成所述文本文档中各文字对应的文字图像;计算各所述文字图像中的文字的欧拉数,并根据所述欧拉数的奇偶确定所述文字图像对应的数字特征;获取各所述文字图像的待嵌入数字水印信息,并判断所述数字特征与所述待嵌入数字水印信息是否匹配;如果所述数字特征与所述待嵌入数字水印信息不匹配,则改变所述文字图像中的文字的拓扑结构,并计算改变所述拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与所述待嵌入数字水印信息相匹配。2.根据权利要求1所述的方法,其特征在于,所述在改变所述文字图像中的文字的拓扑结构,并计算改变所述拓扑结构后的文字的欧拉数,以使该欧拉数的数字特征与所述待嵌入数字水印信息相匹配之后,所述的方法还包括:将所述数字特征与所述待嵌入数字水印信息相匹配的文字对应的文字图像合并。3.根据权利要求1所述的方法,其特征在于,所述将所述图像分割成所述文本文档中各文字对应的文字图像,包括:将所述图像二值化,得到二值图像;从上到下逐行扫描所述二值图像,计算所扫描的每行图像的像素,并根据所述像素获取所述图像的水平投影;利用所述图像中的每行文字行间的空白间隔在所述水平投影形成的空白空隙,将所述图像分割为不同行,得到行图像;从左到右扫描各所述行图像,计算所扫描的每行图像中的所有文字的像素,并根据所述像素获取所述图像的垂直投影;利用各所述行图像中的文字之间的空白间隔在所述垂直投影形成的空白空隙,将所述行图像分割为单个的字符块,所述字符块为所述文本文档中各文字对应的文字图像;判断相邻两个字符块的间距是否大于预设阈值;当所述间距不大于所述预设阈值时,将这两个字符块合并为一个字符块。4.根据权利要求1所述的方法,其特征在于,所述计算各所述文字图像中的文字的欧拉数,并根据所述欧拉数的奇偶确定所述文字图像对应的数字特征,包括:使用图像识别算法,识别出各所述文字图像中的文字的连通区域数和孔洞数;通过所述连通区域数和所述孔洞数的差值,计算所述文字的欧拉数;当所述欧拉数为奇数时,所述文字图像对应的数字特征为“1”;当所述欧拉数为偶数时,所述文字图像对应的数字特征为“0”。5.根据权利要求1所述的方法,其特征在于,所述如果所述数字特征与所述待嵌入数字水印信息不匹配,则改变所述文字图像中的文字的拓...

【专利技术属性】
技术研发人员:杨榆陈雨薇雷敏
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1