System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息安全方法,具体涉及一种版式文件隐写打印方法及系统。
技术介绍
1、信息隐写是指将秘密信息嵌入到如文本,图像、音频等其他传输媒体中,文本是网络中应用最广泛的信息载体,对文本进行信息隐写具有较大的研究价值。文本隐写的方式主要分为修改式和生成式两种,其中,修改式文本隐写指的是对文本进行格式修改或者利用不可见字符进行信息隐藏,具有无需额外载体、不易察觉和隐私保护性强的等优点,得到广泛的应用。
2、在传统修改式隐写算法中,通常采用随机方式进行隐写,即随机选取文本中的文字进行信息隐藏。随机选取文本中的文字进行修改或者同义词替换,可能导致原文本中进行隐写的信息分布不均匀,在原文中部分位置,出现文本嵌入失败的情况,导致隐写的文本可根据出现文本嵌入失败的位置进行破解,降低隐写文本的安全性。需要一种对需要隐写的文本进行隐写时,隐写信息均匀分布的修改式隐写算法,提升隐写文本的安全性。
技术实现思路
1、本专利技术提供一种版式文件隐写打印方法及系统,以解决文本隐写信息不均匀分布导致的隐写文本安全性不足的问题,所采用的技术方案具体如下:
2、第一方面,本专利技术一个实施例提供了一种版式文件隐写打印方法,该方法包括以下步骤:
3、根据版式文件中需要隐写的文本信息获取待隐文本,对待隐文本进行划分,获取汉字分组;
4、统计汉字的文概率和段概率,根据汉字分组内包含的汉字和汉字的文概率、段概率确定每个汉字分组的分组字频联合系数,基于不同汉字组合在待隐文
5、建立汉字笔画矩阵对照表,确定汉字的汉字笔画矩阵,根据汉字的汉字笔画矩阵确定汉字的笔画特异系数,根据汉字的笔画特异系数、词频共现粘连度和汉字笔画矩阵,获取汉字的组内笔画惩罚因子,根据汉字的组内笔画惩罚因子、文概率和段概率,获取汉字的嵌入隐写易用性评估系数,根据汉字的嵌入隐写易用性评估系数与汉字分组中包含的汉字数量,获取汉字分组的分组评价系数;
6、根据汉字分组的分组评价系数对汉字分组重排,获取调节汉字分组,对调节汉字分组进行文本隐写,获取隐写二维码和隐写信息,通过文件隐写打印系统实现版式文件的隐写打印。
7、进一步,所述文概率的获取方法为:将汉字分组中汉字出现的频率记为汉字的文概率。
8、进一步,所述段概率的获取方法为:对待隐文本进行段落划分,将段落中汉字出现的频率记为汉字的段概率。
9、进一步,所述分组字频联合系数的获取方法为:
10、将汉字分组中包含的所有汉字的段概率的乘积与第一权重调节因子的乘积记为第一字频系数,将汉字分组中包含的所有汉字的文概率的乘积与第二权重调节因子的乘积记为第二字频系数,将第一字频系数与第二字频系数的和记为汉字分组的分组字频联合系数。
11、进一步,所述笔画特异系数的方法为:
12、将汉字的汉字笔画矩阵的l1范数记为第一范数,将汉字的前一个汉字与后一个汉字的汉字笔画矩阵的和的l1范数记为第二范数,将第一范数与第二范数的比值记为汉字的笔画特异系数。
13、进一步,所述组内笔画惩罚因子的方法为:
14、
15、表示待隐文本中第个汉字分组中第个汉字的组内笔画惩罚因子;表示待隐文本中第个汉字分组中第个汉字的词频共现粘连度;表示第一调节系数;表示取以2为底数的对数;表示的f范数;表示待隐文本中第个汉字分组中第个汉字的汉字笔画矩阵;表示待隐文本中第个汉字分组中第个汉字的笔画特异系数。
16、进一步,所述嵌入隐写易用性评估系数的方法为:
17、将以2为底,汉字的段概率和文概率的和的对数与汉字的组内笔画惩罚因子的乘积记为汉字的嵌入隐写易用性评估系数。
18、进一步,所述分组评价系数的方法为:
19、将以2为底,汉字分组内包含的汉字数量的对数与汉字分组中包含的所有汉字的嵌入隐写易用性评估系数的乘积的向下取整值,记为汉字分组的分组评价系数。
20、进一步,所述通过文件隐写打印系统实现版式文件的隐写打印的方法为:
21、在文件隐写打印系统中,确认操作人员个人信息进行身份信息,选择需要隐写的版式文件,通过二维码确认后,打印版式文件的隐写信息,实现版式文件的隐写打印。
22、第二方面,本专利技术实施例还提供了一种版式文件隐写打印系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任意一项所述方法的步骤。
23、本专利技术的有益效果是:
24、本专利技术从汉字分组的字频分布不一致导致的部分分组内选择的隐写信息不合适的问题出发,对按句对待隐文本划分获取的汉字分组进行调整,首先,根据汉字出现的频率和关联汉字组合确定汉字的词频共现粘连度,词频共现粘连度即为汉字分组内汉字出现的频率状况评价,接着,根据笔画简单的汉字进行隐写容易被破解,针对每个汉字的笔画构造的繁杂程度进行分析,结合汉字在不同汉字分组中出现的频率,确定汉字分组的分组评价系数,对构造更为复杂的汉字进行隐写可提升隐写信息被破解的难度;最后,根据汉字分组的分组评价系数对汉字分组重排,获取调节汉字分组,调节汉字分组是根据汉字出现的频率状况和汉字笔画的复杂程度共同确定的,汉字出现的频率的评价可以使每个调节汉字分组在进行隐写后,文本的隐写程度基本一致,提高隐写嵌入率,汉字笔画的复杂程度评价可以提高对隐写内容进行破解的难度,减少汉字分组少和汉字简单导致嵌入失败的情况的出现,对调节汉字分组进行文本隐写,获取隐写二维码和隐写信息,通过文件隐写打印系统实现版式文件的隐写打印,可在提高隐写成功率的同时提高隐写嵌入度,解决文本隐写信息不均匀分布导致的隐写文本安全性不足的问题。
本文档来自技高网...【技术保护点】
1.一种版式文件隐写打印方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述文概率的获取方法为:将汉字分组中汉字出现的频率记为汉字的文概率。
3.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述段概率的获取方法为:对待隐文本进行段落划分,将段落中汉字出现的频率记为汉字的段概率。
4.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述分组字频联合系数的获取方法为:
5.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述笔画特异系数的方法为:
6.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述组内笔画惩罚因子的方法为:
7.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述嵌入隐写易用性评估系数的方法为:
8.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述分组评价系数的方法为:
9.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述通过文件隐写
10.一种版式文件隐写打印系统,包括存储器、处理器以及存储在所述存储器中并在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9任意一项方法的步骤。
...【技术特征摘要】
1.一种版式文件隐写打印方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述文概率的获取方法为:将汉字分组中汉字出现的频率记为汉字的文概率。
3.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述段概率的获取方法为:对待隐文本进行段落划分,将段落中汉字出现的频率记为汉字的段概率。
4.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述分组字频联合系数的获取方法为:
5.根据权利要求1所述的一种版式文件隐写打印方法,其特征在于,所述笔画特异系数的方法为:
6.根据权利要求1所述...
【专利技术属性】
技术研发人员:郭尚,刘赛赛,赵云,庄玉龙,杨瑞钦,陆猛,
申请(专利权)人:北京点聚信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。