当前位置: 首页 > 专利查询>青岛大学专利>正文

一种基于汉字结构特征的无载体文本隐写方法技术

技术编号:18723255 阅读:71 留言:0更新日期:2018-08-22 00:44
一种基于汉字结构特征的无载体文本隐写方法,首先将汉字结构组合分类,使每种结构类型具有大致相同的使用频率,对每种汉字结构进行等长度的二进制编码;将秘密消息转为二进制串,并按照汉字结构编码长度对其分组;找到包含所有汉字结构类型的文本,构建汉字结构编码矩阵;在编码矩阵中找出各结构类型首次出现的位置计算出质数序列,和秘密信息各分组位置信息构建线性同余方程组,求解结果作为密钥与载体文本分别发送给接收者。接收者采取与发送方相同的方法构建编码矩阵和质数序列,首先求得秘密消息二进制长度,得到秘密信息二进制串,进而再获得原始秘密消息。该方法有效解决了现有文本隐写方法鲁棒性差的问题,且隐蔽性和隐藏容量都较高。

A method of steganography without carrier text based on structural features of Chinese characters

A carrier-free text steganography method based on the structural features of Chinese characters is proposed. Firstly, the structure of Chinese characters is combined and classified so that each structure type has roughly the same frequency of use, and each Chinese character structure is encoded in binary with equal length. Find the text containing all the Chinese character structure types, construct the Chinese character structure encoding matrix; find out the position of each structure type for the first time in the encoding matrix, calculate the prime sequence, and construct the Linear Congruence Equations with the position information of each group of secret information, and send the solution results as the key and the carrier text to the receiver respectively. The receiver constructs the encoding matrix and prime sequence in the same way as the sender. First, the binary length of the secret message is obtained, then the binary string of the secret information is obtained, and then the original secret message is obtained. This method effectively solves the problem of poor robustness of existing text steganography methods, and has high concealment and hiding capacity.

【技术实现步骤摘要】
一种基于汉字结构特征的无载体文本隐写方法
本专利技术涉及信息隐藏
中的隐写术,特别是涉及一种无载体文本隐写方法。主要用于秘密信息的传递。
技术介绍
隐写术与密码学都是应用于秘密信息的传递,但与密码学的不同在于其特征在于隐藏秘密信息的存在,即将秘密信息隐藏于图像、声音和文本等载体。目前已有多种文本隐写方法,如:基于文本格式变换、基于同义词替换、基于文本生成、基于文本大数据搜索等文本隐写方法。这些隐写方法都存在一定的缺陷,如:基于格式变换的文本隐写方法主要主要通过文本中的字体大小、字间距、行间距、颜色等格式属性的微小改变来隐藏秘密信息,因而载密文本格式的修改将直接导致秘密信息的破坏,即鲁棒性较差;基于同义词替换的文本隐写可能导致某些同义词被替换后与原文的上下文语境不匹配,极易引起攻击者的怀疑;基于文本生成的文本隐写方法目前受限于自然语言处理技术,在生成较长文本时容易出现可读性差、语义异常等问题;基于文本大数据搜索的文本隐写方法存在隐藏容量相对较低、查找难度高或者嵌入成功率低等不足。综上所述,目前的文本隐写方法存在鲁棒性差,隐藏容量低等问题。
技术实现思路
为了克服上述方法中的不足,本专利技术提供一种基于汉字结构特征的新型无载体文本隐写方法。利用网络大数据环境下丰富的网络文本资源作为候选载体,通过汉字结构特征表示秘密信息,选择合适的网络文本实现秘密信息的传送。该方法有效解决了现有文本隐写方法载体鲁棒性差的问题,并且具有隐蔽性高、隐藏容量较高的优势。本专利技术解决技术问题所采用的技术方案是:提供一种基于汉字结构特征的文本无载体文本隐写方法,收发双方构建共同的汉字结构编码矩阵、质数数列、共享线性同余方程组的解而实现隐写。包括将秘密消息嵌入文本过程和从文本中提取过程,其中,将秘密消息嵌入文本过程包括以下步骤:(1)根据汉字使用频率,将汉字结构划分为2p种,使每种结构类型具有相同的使用频率,则可定义每种结构对应唯一的一个p位的二进制片段,这里p为不小于1的自然数。(2)在发送前,收发双方可约定任意方式将秘密信息转换成二进制串Ssecret,记Ssecret的长度为Lsecret;把Lsecret的二进制值以固定长度Lheader位放在Ssecret前,连接形成完整的二进制串Smsg,则Smsg的长度Lmsg=Lheader+Lsecret。然后将Smsg按每p位进行分组,若最后分组不足p位,则补0至p位,最后得到二进制片段序列<SEG1,SEG2,…SEGPnum>,元素个数为(3)选择包含上述2p种汉字结构的文本作为载体,并基于所选文本构造汉字结构矩阵,然后将汉字结构矩阵中的元素替换为其汉字结构所对应的p位二进制片段,形成汉字结构编码矩阵。(4)依据2p种汉字结构在汉字结构编码矩阵中首次出现的位置计算出两个质数序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum)。(5)找出SEG1,SEG2,…SEGPnum片段在汉字结构编码矩阵中的对应行号a1,a2,...,aPnum和列号b1,b2,...,bPnum,分别取ai与质数序列中的元素mi、bi与质数序列中的元素ni(这里1≤i≤Pnum)构造一元线性同余方程,形成一元线性同余方程组S1、S2,并利用中国剩余定理求解方程组,得到两个解。(6)将求得的两个解作为密钥、载体文本分别发送给接收者。从文本中提取过程包括以下步骤:(1)将文本载体按与嵌入过程相同的方法转换为汉字结构编码矩阵。(2)根据固定长度Lheader,以嵌入过程相同的方法计算出部分质数序列(m1,m2,...,mH)、(n1,n2,...,nH),这里进而提取出秘密消息的长度值。(3)按与嵌入过程相同的方法计算出与发送端相同的质数序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum)。(4)质数序列(m1,m2,...,mPnum)中的各元素关于x1的余数和(n1,n2,...,nPnum)中的各元素关于x2的余数分别就是二进制串在汉字结构编码矩阵中的位置信息(a1,a2,...,aPnum)、(b1,b2,...,bPnum)。(5)根据位置信息求得二进制串,去掉前面表示长度的Lheader位后进行译码得到原始秘密信息。本专利技术的有益效果具体如下:1)整个隐写过程未对文本进行修改和替换,因而不存在文本格式或语义失真问题。2)文本中的每个汉字都可以隐藏p(bit)的秘密信息,虽然并不是文本中每个汉字都会被嵌入秘密信息,但是用来构造汉字结构矩阵的汉字可以被重复使用无数次,因此在计算机的计算能力范围内,隐藏容量可达p*Pnum比特。附图说明图1是本专利技术隐藏和提取过程的总体流程图;图2是本专利技术汉字结构编码矩阵图的实施例。具体实施方式参见图1和图2,本专利技术一种基于汉字结构特征的无载体文本隐写方法的实现过程如下:一、将秘密消息嵌入文本的过程:(1)将汉字结构根据使用频率分为8种:“独体奇数”、“独体偶数”、“左右1:1”、“左右奇数”、“左右偶数”、“上下奇数”、“上下偶数”、“其他”,这里p=3,即每种结构代表3位二进制串,可分别是“000”、“001”、“010”、“011”、“100”、“101”、“110”、“111”。(2)将要发送的秘密信息按照收发双方约定的方式转换成二进制形式,如:秘密消息中的汉字用机内码表示,其它字符用ASCII码表示;或者使用UniCode编码或UTF-8等其它编码;或者使用加密处理等其它方式。将二进制串的长度加在二进制串的前面,占Lheader位长度,组成完整二进制串,然后再按3位一段进行分段,若最后一段不足3位,补0凑足。(3)选择包含前述8种汉字结构的文本,并利用文本中包含8种结构的最少的前面部分文本段来构造最小汉字结构方阵,并用8种汉字结构对应的二进制片段替换所得的汉字结构方阵中的元素将它转换为汉字结构编码方阵。(4)分别找到8种汉字结构对应的二进制片段在前面所构造的汉字结构编码矩阵中首次出现的位置,得到它们中的最大行号fr_max和最大列号fc_max、最小行号fr_min和最小列号fc_min;然后计算k1和k2:k1=fr_max-fr_min、k2=fc_max-fc_min;接下来计算质数序列:在质数集合中分别找出不小于fr_max、fc_max的第一个质数作为m1和n1,进而分别找到两个两两互质的数来构建序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum),这里要求mi-mi-1>=k1,ni-ni-1>=k2,其中mi、ni表示质数序列中的元素。(5)找出Smsg的各片段SEG1,SEG2,…SEGPnum在汉字结构编码矩阵的行号a1,a2,...,aPnum,将它们分别与质数序列(m1,m2,...,mPnum)中的对应元素构造一元线性同余方程,形成方程组S1,利用中国剩余定理求其解,记为x1。同理,利用Smsg的各片段SEG1,SEG2,…SEGPnum在汉字结构编码矩阵的列号b1,b2,...,bPnum分别与质数序列(n1,n2,...,nPnum)中的对应元素构造的一元线性方程并形成一元线性同余方程组S2,利用中国剩余定理求本文档来自技高网...

【技术保护点】
1.一种基于汉字结构特征的无载体文本隐写方法,其特征在于,包括发送方将秘密消息嵌入文本过程和接收方从文本中提取过程。

【技术特征摘要】
1.一种基于汉字结构特征的无载体文本隐写方法,其特征在于,包括发送方将秘密消息嵌入文本过程和接收方从文本中提取过程。2.如权利要求1所述的基于汉字结构特征的无载体文本隐写方法,其特征在于:发送方将秘密消息嵌入文本过程包括以下步骤:(1)根据汉字使用频率,将汉字结构划分为2p种,使每种结构类型具有相同的使用频率,并定义每种结构对应唯一的一个p位的二进制片段;(2)将秘密信息按照与接收方商定的方式转换成二进制串Ssecret,计算该二进制串的长度Lsecret,并将该长度值的二进制值以固定长度Lheader位与二进制串Ssecret连接,构建完整的二进制串Smsg,其长度Lmsg=Lheader+Lsecret;然后将Smsg按每p位进行分组,若最后分组不足p位进行补0至p位,则得到二进制片段序列<SEG1,SEG2,…SEGPnum>,元素个数为(3)选择包含上述2p种汉字结构的文本作为载体,基于所选文本构造汉字结构矩阵,然后根据汉字结构对应的p位二进制片段将汉字结构矩阵转换为汉字结构编码矩阵;(4)依据2p种汉字结构在汉字结构编码矩阵中首次出现的位置计算出两个质数序列(m1,m2,...,mPnum)和(n1,n2,...,nPnum);(5)找出SEG1,SEG2,…SEGPnum片段在汉...

【专利技术属性】
技术研发人员:王开西于翔美
申请(专利权)人:青岛大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1