【技术实现步骤摘要】
基于词元编码的文本无载体信息隐藏方法
本专利技术属于信息安全
,尤其涉及一种基于词元编码的文本无载体信息隐藏方法。
技术介绍
网络与通信技术的发展极大地推动了生产力变革,成为社会发展不可或缺的支柱力量。受互联网的开放性特点影响,数据安全面临的风险日益复杂,通信活动的隐蔽性和安全性亟待加强。在不影响数字载体正常功能的前提下,信息隐藏技术将预处理后的秘密信息嵌入到选定载体中,通过载体的传输来实现信息的传递。相比于加密方法,信息隐藏能够更好地消除秘密信息的可感知性。但在实践过程中,传统信息隐藏技术不可避免地会对载体进行一定粒度的修改,因而导致其统计特征发生变化,难以抵抗特定的隐写检测攻击。在此种背景下,无载体信息隐藏的概念引起了研究人员的重视。无载体信息隐藏方法以秘密信息为驱动,直接检索符合要求的自然文本并发送,接收方根据约定规则即可实现秘密信息的提取。与传统信息隐藏技术相比,无载体信息隐藏方法无需对载体进行修改,因而能够抵抗现有的隐写检测手段。由此可见,无载体信息隐藏技术能够真正实现关键数据的隐秘传输,在隐蔽性和抗检测性等方面具有无可比拟的优势,必将进一步推动信息隐藏技术的飞速发展。以文本为对象开展的无载体信息隐藏的研究工作主要包括:文献1(吉红勇,付章杰,孙星明.基于单关键词的文本无载体信息隐藏方案[C]//全国信息隐藏暨多媒体信息安全学术大会.2016.)将秘密信息切分为关键词形式,利用用户身份信息生成定位标签,检索含有“标签+关键词”组合的自然文本进行发送,接收方根据标签即可实现秘密信息的提取 ...
【技术保护点】
1.一种基于词元编码的文本无载体信息隐藏方法,其特征在于,包括:/n步骤1:建立动态更新的文本库C,并对文本库C中各文本进行预处理;/n步骤2:依次读取预处理后的各文本内容,提取词元信息,根据提取的词元信息构造词元节点树G;/n步骤3:遍历词元节点树G,对任意非叶子词元节点,按照转移概率将其相邻子节点降序排列,并对该词元节点的邻接路径进行编码;/n步骤4:遍历词元节点树G,构建各词元节点的源路径的同构文本集;/n步骤5:对秘密信息进行加密,根据词元节点树G与加密比特流确定词元节点源路径,从相应的同构文本集中选取载密文本并进行发送;/n步骤6:接收载密文本,提取载密文本的词元信息,根据词元节点树G提取词元信息中的加密比特流,经过相应逆变换实现秘密信息的提取。/n
【技术特征摘要】
1.一种基于词元编码的文本无载体信息隐藏方法,其特征在于,包括:
步骤1:建立动态更新的文本库C,并对文本库C中各文本进行预处理;
步骤2:依次读取预处理后的各文本内容,提取词元信息,根据提取的词元信息构造词元节点树G;
步骤3:遍历词元节点树G,对任意非叶子词元节点,按照转移概率将其相邻子节点降序排列,并对该词元节点的邻接路径进行编码;
步骤4:遍历词元节点树G,构建各词元节点的源路径的同构文本集;
步骤5:对秘密信息进行加密,根据词元节点树G与加密比特流确定词元节点源路径,从相应的同构文本集中选取载密文本并进行发送;
步骤6:接收载密文本,提取载密文本的词元信息,根据词元节点树G提取词元信息中的加密比特流,经过相应逆变换实现秘密信息的提取。
2.根据权利要求1所述的基于词元编码的文本无载体信息隐藏方法,其特征在于,所述步骤1包括:
步骤1.1:去除文本库C中各文本中的停用词、非中文字符;
步骤1.2:根据文本长度对文本库C中各文本进行筛选,去除长度偏离预设值的文本。
3.根据权利要求1所述的基于词元编码的文本无载体信息隐藏方法,其特征在于,所述步骤2包括:
步骤2.1:依次读取预处理后的各文本内容,提取各文本对应的词元内容、位置索引、可用文本链接并存储,形成词元索引文件;
步骤2.2:查询步骤2.1所得的词元索引文件,将位置索引为1且内容相同的词元聚合为同一节点,作为词元节点树G的第一层词元节点,并按照词元节点标识、父节点标识、位置索引、词元内容、可用文本链接集合的结构进行存储;
步骤2.3:设Vi为词元节点树G第i层词元节点的集合,vi,j为词元节点树G第i层的第j个词元节点,令i=2,对于读取vi-1,j的可用文本链接集合的文本内容,将该部分文本中位置索引为i且内容相同的词元聚合为同一节点,作为vi-1,j的子节点,重复执行该过程,直至集合Vi-1中所有词元节点均已处理完毕,获得词元节点树的第i层词元节点;
步骤2.4:令i=i+1,重复步骤2.3及步骤2.4直至所有的词元索引文件均已处理完毕,获得文本库C的词元节点树G。
4.根据权利要求1所述的基于词元编...
【专利技术属性】
技术研发人员:王晓梅,张维,张晨旭,吴亚男,安鑫,陈兴强,
申请(专利权)人:中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。