一种基于句式控制的宋词载体文本信息隐藏方法、系统技术方案

技术编号:17878809 阅读:218 留言:0更新日期:2018-05-06 00:39
本发明专利技术公开了一种基于句式控制的宋词载体文本信息隐藏方法、系统,包括采取句式控制算法对宋词语料库的宋词和格律模板T进行处理,结合《文学意向词典》中韵律和词性相同的词语进行补充填入,得到用于信息隐藏和提取的韵律‑词性词典D;结合韵律‑词性词典D,采用信息隐藏算法对输入的原始信息进行隐写处理,得到所述原始信息对应的隐写宋词S;通过格律模板T和韵律‑词性词典D,采用提取算法还原隐写宋词S,得到原始信息。本发明专利技术可针对任意文本输入均可以生成含有隐写信息的人造宋词,解决了信道通信的安全性的问题,可广泛应用于军民等各类信息系统和数字水印中。

A text information hiding method and system based on sentence pattern control in Song Ci

This invention discloses a text information hiding method and system of Song Ci carrier based on sentence control, which includes the song word and the metrical template T of song word database by the sentence control algorithm, and fill in the words in the dictionary of literary intention and the words with the same words, and get the information hiding and extracting. D with the prosodic dictionary D, using the information hiding algorithm to stealth the original information of the input, and get the S of the song word corresponding to the original information; through the metrical template T and the prosodic dictionary D, the original information is obtained by using the extraction algorithm to restore the S of the song word. The invention can generate artificial song words containing hidden information for any text input, and solve the problem of the security of channel communication, and can be widely used in all kinds of information systems and digital watermarks, such as military and civilian.

【技术实现步骤摘要】
一种基于句式控制的宋词载体文本信息隐藏方法、系统
本专利技术涉及信息安全领域,特别是一种基于句式控制的宋词载体文本信息隐藏方法、系统。
技术介绍
现有的使用机器生成宋词的方案,如苏劲松等人提出基于统计学分析的宋词切分语料库生成的方法。通过结合性较强的二词或三词来建立宋词词表,进而按照宋词规律进行宋词划分和语料库生成。和何晶等人使用统计学方法利用大数据量的词汇数据库和语言模型进行格律诗词生成,二者均是利用了数据库概论学模型进行宋词生成,生成宋词的成功率很难达到100%,且无法在句式上与宋词词牌相对应。周昌乐等人提出基于遗传算法的一种宋词自动生成方法,但因其生成的宋词可嵌入信息较少,成功率低等因素无法作为信息隐藏的合适载体。故已有的一些方案无法在如何生成贴近真实宋词的技术上研究不多,且很难提供安全可靠的信息隐藏载体供安全通信使用。
技术实现思路
本专利技术的目的在于提供一种可以机器生成宋词的方法,并且以宋词为载体对带隐藏的秘密信息进行嵌入,从而在信道中进行安全通信。本专利技术公开一种基于句式控制的宋词载体文本信息隐藏方法,包括:S1:采取句式控制算法对宋词语料库的宋词和格律模板T进行处理,结本文档来自技高网...
一种基于句式控制的宋词载体文本信息隐藏方法、系统

【技术保护点】
一种基于句式控制的宋词载体文本信息隐藏方法,包括:S1:采取句式控制算法对宋词语料库的宋词和格律模板T进行处理,结合《文学意向词典》中韵律和词性相同的词语进行补充填入,得到用于信息隐藏和提取的韵律‑词性词典D;S2:结合韵律‑词性词典D,采用信息隐藏算法(SPC‑Steg)对输入的原始信息进行隐写处理,将原始信息转换为二进制串的形式,根据所述宋词格律模板T将所述二进制串划分位二进制划分段,对每个二进制划分段进行编码,得到所述原始信息对应的隐写宋词S;S3:通过格律模板T和韵律‑词性词典D,采用提取算法还原隐写宋词S,得到原始信息。

【技术特征摘要】
1.一种基于句式控制的宋词载体文本信息隐藏方法,包括:S1:采取句式控制算法对宋词语料库的宋词和格律模板T进行处理,结合《文学意向词典》中韵律和词性相同的词语进行补充填入,得到用于信息隐藏和提取的韵律-词性词典D;S2:结合韵律-词性词典D,采用信息隐藏算法(SPC-Steg)对输入的原始信息进行隐写处理,将原始信息转换为二进制串的形式,根据所述宋词格律模板T将所述二进制串划分位二进制划分段,对每个二进制划分段进行编码,得到所述原始信息对应的隐写宋词S;S3:通过格律模板T和韵律-词性词典D,采用提取算法还原隐写宋词S,得到原始信息。2.根据权利要求1所述的文本信息隐藏方法,所述格律模板T的韵律具体包括:中仄、平平、平中仄、中平、中仄,所述宋词的词性具体包括动词,名词,形容词,动名词。3.根据权利要求1所述的文本信息隐藏方法,所述采取句式控制算法对宋词语料库的宋词和格律模板T进行处理,具体包括:S11:对所述宋词语料库的宋词依照格律模板T,进行韵律拆分,得到韵律词典;S12:对所述韵律词典的每个韵律块Rj所对应的词语通过词性提取工具进行处理,然后进行如下操作;S13:每次读取两个单字或双字的字符串放在s1,s2中;S14:如果s1或s2的词语长度小于约定的组合词语长度L,则执行步骤S15,反之则根据s1或s2的词语的韵律-词性关系重制原有的韵律-词性词典;S15:判断s1和s2的词语词性,将s1和s2按照不同的词性构造成新的词语,依照不同词性输出到韵律-词性词典D。4.根据权利要求3所述的文本信息隐藏方法,所述约定的组合词语长度L具体包括:L=2或L=3。5.根据权利要求1所述的文本信息隐藏方法,所述采用信息隐藏算法(SPC-Steg)对输入的原始信息进行隐写处理,具体包括:S21:获取格律模板T每个韵律位置对应的韵律-词性信息;S22:将输入的原始信息转换为二进制编码;S23:为格律模板T提供可嵌入信息长度L,若输入的原始信息m长度小于L,则在所述二进制编码后进行补零;S24:获取韵律-词性词典D中词语的个数,放入所述二进制编码长度Len内;S25:获取下一个位置可嵌入的信息量长度B,并将B转换为十进制数;S26:将格律模板T对应位置匹配得到韵律-词性词典D;S27:将韵律-词性词典D中编码为n的词进行匹配,得到十进制索引,同时按照索引将每个词填入宋词S的每个位置,进而输出一篇完整含有隐藏信息的隐写宋词S。6.根据权利要求1所述的文本信息隐藏方法,所述采用提取算法还原隐写宋词S,得到原始信息,具体包括:S31:获取格律模板T每个位置对应的格律词性信息,将接收到的宋词S与格律模板T进行匹配;S32:对于宋词S中每个格律划分块在韵律-词性词典D中...

【专利技术属性】
技术研发人员:刘彦辰孙亭李毅满青珊徐斌丁杰黄利
申请(专利权)人:中国电子科技集团公司第二十八研究所
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1