可控密钥序列的具有误导功能的隐写方法技术

技术编号:7171557 阅读:328 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种具有误导功能的文本隐写(密写)方法,需要打开文件,读取文本内容,然后通过将文本中的关键词替换为具有相近、相反或同类的关键词,最终保存文本,使之具有误导功能。关键词的替换采用非固定替换结合固定替换。非固定替换是由密钥来控制的,先用一个密钥生成安全的序列进行尝试性的替换,如果替换不如意,可以在这一密钥后附加修正信息。隐写后的文本内容和隐秘文本的内容可能是相似、相反或者同类的,这样就可以起到误导的效果。这样的隐写方法摆脱了传统隐写方法需要图像、视频和音频等大文件的缺点,并且可以直接误导对方。

【技术实现步骤摘要】

本专利技术属信息安全领域,涉及一种文本隐写方法,特别是一种具有误导功能,可以随意误导的文本隐写(密写)方法。
技术介绍
Steganography (隐写术、密写术)是将秘密消息嵌入表面上正常的数字载体中, 以不被他人察觉的方式通过公开渠道如互联网进行传输,接收者使用专门的工具和密钥从含密载体中提取消息,实现隐蔽通信。用于隐写的载体以数字图像最为普遍,其次是数字音频,数字视频也可用于隐写,但由于视频文件尺寸过大,在网络上传输远不如图像和音频广泛,所以一般说来不是隐蔽通信的优选载体。还有一种特殊的信息隐藏技术,是1983年 Simmons提出的阈下信道(subliminal channel),狭义的阈下信道主要采用数字签名等来实现消息隐匿,但是阈下信道可以被封闭,并且利用数字签名传输的阈下消息往往很短。可见,目前的信息隐藏技术要么需要依靠大文件作为载体,要么只能传输很短消息,伪装文本 (载体,covertext)和隐秘文本(stegotext,这里称为原文)相比较大很多,信道利用率不高。一旦被禁止发送图片音频、视频等大容量的文件,不允许进行数字签名的情况下,秘密消息的隐匿就无法实现,而信息隐藏和阈下信道问题往往是针对被监视的囚犯之类的背景的,监管人完全可以禁止任何可能隐匿消息的行为。目前也出现了一些文本隐写方法,基本上也是利用某些文件格式中的冗余信息位来隐藏信息。文本是网上传输数量最多的信息载体,其形式多样,如网页、电子邮件、包括 pdf,d0c,ps在内各种格式的文本文件等,用作隐写载体具有广阔的应用前景。但与图像、音频等多媒体信号相比,在文本中嵌入额外信息而又不引起可察觉的变化相当困难,这是因为文本中可用于插入额外数据的冗余空间很小,因此利用文本作为隐写载体的技术发展大大滞后。Bender等人4将文本中嵌入信息的方法归纳为三类1)利用空格,例如单词之间空 1格代表0,空2格表示1 ;2)基于句法,包括句型和标点符号,例如句型a,b,andc表示0, a,b and c表示1; 利用语义,定义一个同义词表,例如big表示0,large表示1。其中第一类是基于文本格式的,后两类则是基于文字内容的。在基于文字内容的嵌入技术中,利用句法的方法一般嵌入量很小,因为特定句型在文章中出现的次数有限。语义编码的问题在于会产生文本内容的改变,或者使语言变得不自然。例如,尽管pacific与peaceful同义, 将I^cific Ocean变成Peaceful Sea却很容易引起警觉。在基于格式的信息隐藏方面,某些利用增减空格的简单方法过于明显,或者难以抵抗文本编辑的攻击。例如在每一行末尾插入的一个或两个不可见空格,只要改变页面的设置就会被完全破坏。Brassil等人提出了移词编码、移行编码、特征编码三种方法。由于单词间距并不固定,移词编码通常需要通过与原始文本的比较才能提取出嵌入的信息,用作水印尚可,用于隐写则不可行。特征编码的一个例子是用字母b、d和h顶部的短横线长度来表示嵌入信息。虽然这些方法都会使原始文本发生轻微变化,只要采取适当的措施仍能达到外人很难辨认的程度。若正常文本的行距是均勻的,则移行编码嵌入数据的提取不依赖原始文本,因此既可用于保护版权,亦可成为一种隐蔽通信手段。此外移行编码通常比移词编码更为稳健,故一直受到研究者的关注。 Villan等人最近构建了一个新的理论框架,将文本中的信息隐藏看成Gel’ fand-Pinsker 问题的特例。他们在这一框架下提出两种视觉隐蔽性优良且嵌入量大的基于特征文本信息隐藏方法半色调量化和颜色量化,该方法从电子版本和打印硬拷贝中均能自动提取隐蔽信息。在某些特定格式的文本文件例如XML和排版工具TeX的源文件中也能嵌入额外信息。 Word文档也可以作为文本隐写的载体。这些隐写方法都是利用了文件或者文本的冗余。我们也曾经设计了一种采用文本隐写方法,其方法有别于以上隐写方法,但是,这种方法得到的伪装文本虽然具有很好的误导性,但是密钥长度会很长,当文本很长的时候, 密钥长度是不能接受的。如果采用流密码等方法产生密钥流作为子密钥来控制误导的关键词,虽然密钥很短,但是,由于是流密码产生的子密钥序列,伪装文本是根据密钥序列产生的,不能随意去设置伪装文本,考虑其现实中使用会存在不能根据发送人的意愿有效误导监听者的问题,本专利技术设计了一种可以进行修正以有效误导对方的隐写方法。
技术实现思路
本专利技术旨在克服现有隐写方法冗余量大,依赖于图像、语音数据的缺点,以及不具有主动误导的缺陷,提供一种对文本进行隐写的方法,可以具有误导的功能,并且对不可控的密钥序列可以进行修改。与传统的隐写方法不一样,传统的隐写的载体一般与需要传递的信息没有多大关系,传统隐写方法是将原文嵌入到载体的某些冗余位置,而本隐写方法的隐写载体文本会直接地误导对方;与加密不一样,隐写的伪装文本直接进行传递,对方会以为是明文,所以可以直接去误导对方。为具备误导功能,在本专利技术中,设计了采用将重要的关键词替换为相似、相近、相反或者可以替代的关键词的替换隐写的方式,它需要有一个关键词数据库,在数据库中,把相似、相近、相反或者可以替代的关键词放在一个相同的组中。隐写的时候,打开文件,读取文本的内容,隐写时候把关键词替换成为具有相同性质的关键词,这一个关键词与原关键词意义相近、相反或者具有替代性。替换分为固定的替换和不固定的替换,如附图1所示。 由于文本中的关键词都是被用相似、相近和相反的关键词代替的,因而伪装文本具有误导作用。关键词数据库是一个基础性的数据库,一般而言隐写的目的是隐藏信息,监听人是不知道文本是经过隐写处理的。因此对于文本隐写,此数据库是需要保密的,并且收发双方都需要保密。在设计的时候,为了保证隐写和提取的唯一可逆性必须禁止一个关键词出现在两组关键词中,并且关键词不能存在包含关系。因为如果关键词有包含关系,比如关键词数据库中有中华,也有中华人民共和国,就会带来歧义,给隐写带来一定的困难。此外,如果一个关键词出现在数据库的两组关键词中,则隐写和提取过程中也会遇到歧义而无法得到确定的结果的问题。此外为了避免歧义,关键词之间除了应该互相不存在包含关系,也不能有重合交叉的部分。在进行替换的时候,有些关键词的替换是固定的、自动进行的,而有些关键词则是根据预先共享的流密码序列的产生密钥以及修正数据来确定的,后者可以保证需要修正的时候进行必要的修正,误导效果更好。在每一组关键词中,有一个属性代表是否是固定的替换1)如果是固定的替换,这样的固定替换的组中只有两个词,当然一般这样的替换是一对反义词。2)如果是非固定的替换,在数据库中,每一个关键词在这一组中都有一个编号,从0,1,一直到n-1,其中η为这一组中的关键词数目。隐写的时候,第s个非固定替换关键词的替换是根据对应位置的子密钥来确定哪个关键词被替换,这个子密钥是根据流密码算法计算的密钥流,进行分段截取,分配给相应序列位置的关键词,但是,如果是需要修正的,则修正为最合适的关键词, 并且在密钥后面增加相应的密钥修正信息。这样,最终密钥的结构如图3所示。前面为流密码算法的密钥,用于产生密钥流。后面为修正信息,这部分信息的长度是不固定的,与需要修正的关键词数目成正比,我们将针对每一个本文档来自技高网
...

【技术保护点】
1.一种可控密钥序列的隐写(密写)方法,与现有的隐写(包括文本隐写)方法不一样(它们是将隐写信息嵌入文件的冗余信息中),其特征在于是针对文本的隐写,将文件打开,读取文本,进行一定的关键词替换,这一替换是根据关键词数据库来进行的。由于替换的词可能和原来的词意义相近、相反和类似,替换后的文本依然具有意义,并且可能与原来的意义相近、相反,使之具有随意误导的功能。替换包括固定替换和非固定的替换。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:王勇
申请(专利权)人:桂林电子科技大学
类型:发明
国别省市:45

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1