基于变分自动编码器的数字媒体保护文本隐写方法技术

技术编号：32133166 阅读：28 留言：0更新日期：2022-01-29 19:36

本发明专利技术属于信息安全领域，特别涉及一种基于变分自动编码器的数字媒体保护文本隐写方法，包括构建由编码网络、高斯采样以及解码网络构成的神经网络模型，将文本向量化；利用编码网络分别获取全局关键词和长序列的特征，并融合全局关键词和长序列的特征获取全局特征表示；利用高斯采样对编码网络中的全局特征表示进行高斯采样；利用解码网络对高斯采样的采样结果进行解码，获取文本的条件概率分布；选择条件概率最大的K个词，使用哈夫曼编码来选择同秘密比特流相对应的一个单词，完成文件的隐写；本发明专利技术不仅能够生成长而多样的隐写文本，使得隐写文本能携带更多的秘密信息，而且实现自然语言和隐写文本视觉不可区分、统计不可区分和语义不可区分。可区分和语义不可区分。可区分和语义不可区分。

全部详细技术资料下载

【技术实现步骤摘要】
基于变分自动编码器的数字媒体保护文本隐写方法

[0001]本专利技术属于信息安全领域，特别涉及一种基于变分自动编码器的数字媒体保护文本隐写方法。

技术介绍

[0002]信息隐藏技术的研究最早源于国外，在1999年全国信息隐藏暨多媒体信息安全学术大会的成功召开之后开始渐渐地流入到国内，成为一个新兴的研究领域。在信息隐藏技术中，隐写术、数字水印等用来解决隐蔽通信、数字取证和版权保护等安全问题。隐写术作为信息隐藏中的关键性的技术之一，其实质是将秘密信息嵌入到载体数据中，隐藏通信的存在，使得攻击者从外观上无法得知该信息是否含有秘密信息。而数字水印是指将特定的数字信息(如身份信息、序列号、文字等)嵌入到图像、音频或视频等数字产品中，多用于版权保护。与数字水印技术相比，隐写术可嵌入更多的秘密信息，且隐藏信息的方法无规律可循，增加了攻击的难度。
[0003]隐写术多使用各种多媒体信息载体来实现秘密信息的隐藏，其中包括文本、图像、视频和音频等公开的载体。文本作为人们日常通信及发表观点时使用最为广泛的信息载体，对其进行处理有着重大的研...

【技术保护点】

【技术特征摘要】
1.基于变分自动编码器的数字媒体保护文本隐写方法，其特征在于，把秘密信息转换为秘密比特流，将秘密比特流嵌入网络模型生成的载体文本中，具体包括以下步骤：对文本进行预处理，包括提取训练文本的全局关键词和组关键词，将长文本划分为多个短序列，每一个短序列都对应一组组关键词，全局关键词即为所有组关键词的并集；构建由编码网络、高斯采样以及解码网络构成的神经网络模型，将文本向量化；利用编码网络分别获取全局关键词和长序列的特征，并融合全局关键词和长序列的特征获取全局特征表示进行融合；利用高斯采样对编码网络中的全局特征表示进行高斯采样；利用解码网络对高斯采样的采样结果进行解码，获取文本的条件概率分布；选择条件概率最大的K个单词，使用哈夫曼编码对这K个单词进行编码，根据待嵌入的秘密比特流来选择与哈夫曼编码相对应的一个单词，完成文件的隐写。2.根据权利要求1所述的基于变分自动编码器的数字媒体保护文本隐写方法，其特征在于，获取全局关键词烦人特征，即提取文本中词
‑
词之间的上下文特征，采用结合双向门控循环单元和注意力机制来提取文本中词
‑
词之间的上下文特征，包括以下步骤：使用双向门控循环单元中的前向门控循环单元和后向门控循环单元获取文本的前向隐藏状态和后向隐藏状态；将当前前向门控循环单元和后向门控循环单元获取的状态进行合并，并将合并后的状态输入注意力层；在注意力层计算每个双向门控循环单元的隐藏层输出与整个文本表示向量的匹配得分占总体得分的比重，通过线性变换得出注意力层的输出。3.根据权利要求2所述的基于变分自动编码器的数字媒体保护文本隐写方法，其特征在于，使用双向门控循环单元对输入的向量进行处理包括：z
′
t
＝σ(W
z'
·
[h
t
‑1,x
t
]+b
z'
)r
t
＝σ(W
r
·
[h
t
‑1,x
t
]+b
r
)n
t
＝tanh(W
n
·
[r
t
*h
t
‑1,x
t
])h
t
＝(1
‑
z
′
t
)*h
t
‑1+z
′
t
*n
tt
其中，z
′
t
为更新门；W
z'
为更新门的训练权重；h
t
‑1为上一层的隐藏状态；x
t
为第t时刻输入双向门控循环单元的向量；b
z'
为更新门的偏置值；r
t
为重置门；W
r
为重置门的训练权重；b
r
为重置门的偏置值；n
t
为候选激活函数；W
n
为候选激活函数的权重；h
t
为时间t的隐层输出结果；σ(x)为Sigmoid激活函数；h
′
t
为隐藏层输出状态；为前向隐藏状态；为后向隐藏状态；其中表示h
t
的前向隐层结果，表示h
t
的后向隐层结果。4.根据权利要求2所述的基于变分自动编码器的数字媒体保护文本隐写方法，其特征在于，注意力层对隐藏层输出状态的处理包括：u
t
＝tanh(W
attn
h
′
t
+b
attn
)
s

【专利技术属性】
技术研发人员：刘红，李政，肖云鹏，李暾，贾朝龙，王蓉，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人