一种基于拓扑不变性和图像变形的打印文档信息追溯方法技术

技术编号:11882500 阅读:54 留言:0更新日期:2015-08-13 15:35
本发明专利技术公开一种基于拓扑不变性和图像变形的打印文档信息追溯方法,在文档的打印输出件中隐性嵌入打印信息,并预先提取所述打印信息的特征进行存储,通过嵌入的打印信息和存储的打印信息的特征追溯打印件的来源;所述在文档的打印输出件中隐性嵌入打印信息步骤通过如下两种方法实现:(1)将原始文件中字间/行间/页白距离进行编码并做微小调整,隐性嵌入打印信息;(2)将原始文件中的特定字进行字体的改变使每个人有属于自己的字体,隐性嵌入打印信息。本发明专利技术作为常规打印审计系统的补充和扩展,能在重要文档的打印输出件中嵌入隐藏信息,实现对打印的文档进行追溯,解决公司重要信息保护的安全挑战。

【技术实现步骤摘要】

本专利技术涉及一种打印文档信息追溯方法,具体涉及一种基于拓扑不变性和图像变 形的打印文档信息追溯方法。
技术介绍
目前,存放在信息系统上的重要信息被窃取和盗用,已经成为信息系统使用的头 等威胁。打印设备作为政府部门、军队、军工、企业等组织的标准配置,已经成为信息泄漏的 重要途径,给组织带来巨大的风险,甚至危害国家安全。为此,许多组织研发或部署了打印 审计系统,试图弥补这个漏洞。但由于打印审计系统只是管控和审计打印的行为,存在自身 的缺陷:(1)打印追溯的缺陷,当一个组织发现本组织打印的文件流出后,通过打印审计系 统一般只能发现是哪些人打印过这份文件,而不能确定流出的这份文件到底是谁打印流出 的,特别是当打印出的文件被别人复印或拍照再流出后。(2)显式水印的缺陷,传统打印审 计输出的文档通常显式的嵌入水印信息,一般包括标示密级的标志、谁打印或何时打印,打 印者可以在打印件上看到嵌入的水印信息,因此也容易被泄漏者有意的隐藏或掩盖,使流 出的文件无法被追溯。总之,现有的打印审计系统无法追溯是谁打印的文件发生泄漏,无法 追溯到源头,也就无法消除信息泄漏的通道。
技术实现思路
专利技术目的:本专利技术目的在于针对现有技术的不足,提供一种基于拓扑不变性和图 像变形的打印文档信息追溯方法,可以有效的追溯泄漏文件的打印源头,有效的定位或者 消除信息泄漏的通道。 技术方案:本专利技术所述一种基于拓扑不变性和图像变形的打印文档信息追溯方 法,在文档的打印输出件中隐性嵌入打印信息,并预先提取所述打印信息的特征进行存储, 通过嵌入的打印信息和存储的打印信息的特征追溯打印件的来源; 所述在文档的打印输出件中隐性嵌入打印信息步骤通过如下两种方法实现: (1)将原始文件中字间/行间/页白距离进行编码并做微小调整,隐性嵌入打印信 息; (2)将原始文件中的特定字进行字体的改变使每个人有属于自己的字体,隐性嵌 入打印信息。 本专利技术技术方案的进一步限定为,所述将原始文件中字间/行间/页白距离进行 编码并做微小调整,隐性嵌入打印信息的具体方法为: S1、定义原始文件中字间距离为D = {a,b} (a〈b),每行文字距离D为常值,即对每 行文字R所有字间距离D只能同时取值为a或b ; S2、对每行文字R做如下编码映射:【主权项】1. ,其特征在于,在文档的 打印输出件中隐性嵌入打印信息,并预先提取所述打印信息的特征进行存储,通过嵌入的 打印信息和存储的打印信息的特征追溯打印件的来源; 所述在文档的打印输出件中隐性嵌入打印信息步骤通过如下两种方法实现: (1) 将原始文件中字间/行间/页白距离进行编码并做微小调整,隐性嵌入打印信息; (2) 将原始文件中的特定字进行字体的改变使每个人有属于自己的字体,隐性嵌入打 印信息。2. 根据权利要求1所述的, 其特征在于,所述将原始文件中字间/行间/页白距离进行编码并做微小调整,隐性嵌入打 印信息的具体方法为: 51、 定义原始文件中字间距离为D = {a,b} (a〈b),每行文字距离D为常值,即对每行文 字R所有字间距离D只能同时取值为a或b ; 52、 对每行文字R做如下编码映射:53、 对一页文档,取该页文档中特定的N行,对每一行文字按式(I. 1)进行编码,并按下 式(1. 2)构成表示ID :其中Ri (i = 1,2···,N)表示所取N行文字中第i行文字; 54、 对于一个需要N_ID个ID号的系统,由(1. 2)式可计算出能编码N_ID个ID号所需 的最少的行数N_R为: N_R = Iog2 (N_ID) (I. 3) 即: 2°= N_ID (1.4); 对每行文字R做如下编码映射:则对一页文档,取特定的N'行文字,对每一行文字按式(1.5)进行编码,并按下式 (I. 6)构成 ID :对于一个需要N_ID个ID号的系统,由(I. 6)式可计算出能编码N_ID个ID号所需的 最少的行数N_R'为: N_R,= log4(N_ID) (1. 7) 即: 4n-e,= N_ID (I. 8) 〇3. 根据权利要求2所述的, 其特征在于,步骤S4中,若对于N_ID较大而N_R较小不能满足式(1. 3),(1. 4)时,可将每 行文字R分为两部分:前半行R1和后半行R 2,并规定& (j = 1,2)中字间距离D为常值,即 所有字间距离D只可能同时取值a或b。4. 根据权利要求2所述的, 其特征在于,步骤S3中,采用式(1. 2)进行编码的,编码加入校验位,方法为:将生成的二进 制ID码中N位二进制数字进行二进制相加,其和记为C,校验位计算如下: c = Cmod(Ol) = {0, 1} (1. 10) 在原来的用来编码ID号的N_R行文字的基础上再取一行,使得新加的这行文字Rn-k+1 的字间距离满足下式: D(W1) = Ifl,C = 0 P,C = 1 (Ul)。5. 根据权利要求2所述的, 其特征在于,步骤S4中,采用式(1. 5)进行编码的,编码加入校验位,方法为:将生成的ID 码中奇数为二进制数字取出并相加,其和记为C1,再将偶数位二进制数字取出并相加,其和 记为C2,并按下式计算: C1=C^od(IO) = {0,1} (1. 12) C2= C 2mod(01) = {1,0} (1. 13) 按下式构成校验位: c' =C1C2= {00,01,10,11} (I. 14) 在原来的用来编码ID号的N_R'行文字的基础上再取一行,使得新加的这行文字Rn-k^ 1的字间距离满足下式:6.根据权利要求1所述的, 其特征在于,所述将原始文件中的特定字进行字体的改变使每个人有属于自己的字体,隐 性嵌入打印信息的具体方法为: L1、取汉字中出现频率最高的前N个汉字,记为S,并将该N个汉字分为2组: S1= {ff|W e S且W在文档中必定出现} S2={W\WeSKW^S} = S-Sl (2. 1) S1I = N1, Is2I = N21N^N2= N 其中IsiI表示SiQ = 1,2)中所含文字的个数;对于&中的文字,我们可以认为至少 有一个会出现在文档中; L2、对于S1中的每个文字,设计该文字的字体,使其有NljG = 1,2,…,N1)种写法; 对于S2中的所有文字规定都只有Na= C(k = 1,2,…,N2)种写法,C为常量; 1^3、对S1中的第j个字,对构成该字的笔画进行分析,使得每个可改变写法的笔画有两 种写法,并假设有Iilj (j = 1,2,…,N1)个可以改变写法的笔画,则有: 2~=?,其中(j = 1,2,…,N1) (2. 2); 对于S2中的第k个字,可改变写法的笔画个数为n 2k= c个,其中c为常量,则有: =2' =C:,其中(k = 1,2,...,N2) (2. 3); L4、编码时对同一个笔画用"0"表示两种写法中的一种写法,用"1"表示另一种写法, 则对S1中的第j个文字W n,可采用长度为1^_的二进制数的不同值来表示该文字的不同写 法,即将该文字每一种写法映射为一个二进制数:对S2中所有的文字,都采用长度为c的二进制数表示文本文档来自技高网...

【技术保护点】
一种基于拓扑不变性和图像变形的打印文档信息追溯方法,其特征在于,在文档的打印输出件中隐性嵌入打印信息,并预先提取所述打印信息的特征进行存储,通过嵌入的打印信息和存储的打印信息的特征追溯打印件的来源;所述在文档的打印输出件中隐性嵌入打印信息步骤通过如下两种方法实现:(1)将原始文件中字间/行间/页白距离进行编码并做微小调整,隐性嵌入打印信息;(2)将原始文件中的特定字进行字体的改变使每个人有属于自己的字体,隐性嵌入打印信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭英凯
申请(专利权)人:南京安斯克信息科技有限公司
类型:发明
国别省市:江苏;32

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1