System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于掩码语言模型的信息隐藏方法及装置制造方法及图纸_技高网

一种基于掩码语言模型的信息隐藏方法及装置制造方法及图纸

技术编号:40930191 阅读:2 留言:0更新日期:2024-04-18 14:51
本发明专利技术涉及一种基于掩码语言模型的信息隐藏方法及装置,属于信息安全领域,该方法包括S1,通过发送方构造嵌入和提取秘密信息所需的必要共享信息,将所述必要共享信息通过安全信道发送至接收方;S2,根据所述必要共享信息中的信息确定文本,通过接收方嵌入所述秘密信息的位置;S3,根据两次所述二进制比特流和自然文字之间的转译过程,通过接收方提取秘密信息;与现有方法相比,由本发明专利技术技术方案生成的含密文本与自然文本的条件概率分布差异更小,使得第三方更难以机器分析的方式检测,进而保证了隐蔽通信的安全性。若将其应用于传递隐私内容,可降低隐私暴露的风险。

【技术实现步骤摘要】

本专利技术属于信息安全领域,尤其涉及一种基于掩码语言模型的信息隐藏方法及装置


技术介绍

1、信息安全对于个人、组织、社会和国家都至关重要,涉及保护隐私。个人和机构存储着大量敏感信息,包括身份证件、财务数据、医疗记录等。未经授权的访问或泄露这些信息可能导致个人、财务和声誉上的损失。在数字化时代,信息安全是一项永久性的挑战,需要持续关注和投资以保护我们的信息资产和利益。而信息隐藏可用于隐私保护,是信息安全领域的重要分支之一。

2、现有的基于语言模型的文本信息隐藏方法仅构建条件转移概率较大的词与二进制比特流的映射关系,也即仅有条件转移概率较大的词可能作为信息隐藏的输出候选词。这种编码方式使得所生成的含密文本中词语的条件转移概率一直是较大值。

3、然而,文本生成的相关研究表明当今的语言模型的评价标准仍有缺陷,其评价标准与人类对自然文本的评价标准仍有一定的差异。具体而言,将自然文本输入到语言模型中可以发现,自然文本中的词语所对应的条件转移概率不完全是较大值,相反地,人类常使用语言模型所评估的低条件转移概率的词进行表达。该研究认为在文本生成中总是使用条件转移概率较大的词是不合适的,与人类真实的表达方式存在一定差异。

4、该研究表明,现有的基于语言模型的文本信息隐藏方法将导致含密文本与原始自然文本在条件转移概率特性上存在较大差异。

5、除此之外,现有的基于语言模型的文本信息隐藏方法不利于隐蔽通信双方进行实时通信。对于接收方而言,接收方需要获取与接收方相同的语言模型,并使用语言模型计算条件转移概率,这增大了隐蔽通信沟通的复杂度和时间成本。


技术实现思路

1、本专利技术针对现有技术的问题,提供一种基于掩码语言模型的信息隐藏方法及装置,所采用的技术方案为:

2、第一方面,一种基于掩码语言模型的信息隐藏方法,包括:

3、s1,通过发送方构造嵌入和提取秘密信息所需的必要共享信息,将所述必要共享信息通过安全信道发送至接收方;其中,所述s1具体包括:

4、s11,通过发送方构造秘密信息与二进制比特流的第一映射关系,并将秘密信息根据映射关系转化;

5、s12,通过发送方共享所述必要共享关系的词表和分词器;

6、s13,通过发送方随机生成密钥,通过所述密钥确定每段文本中的嵌入位置和嵌入量;

7、s14,通过发送方使用构造词表中所有词与二进制比特流的第二映射关系;

8、s15,根据将所述s11~s14步骤,通过所述安全信道发送至接收方;

9、s2,根据所述必要共享信息中的信息确定文本,通过接收方嵌入所述秘密信息的位置;

10、s3,根据两次所述二进制比特流和自然文字之间的转译过程,通过接收方提取秘密信息。

11、进一步的,s11中,所述第一映射关系为双射关系,用于接收方恢复出秘密信息;

12、s14中,所述第二映射关系为满射关系,用于将多个词映射至相同的二进制比特流。

13、进一步的,s2具体包括:

14、s21,根据所述信息确定文本,通过发送方选取一段原始文本;

15、s22,根据所述密钥,通过发送方确定所述原始文本的掩码位置;

16、s23,根据所述掩码位置,通过掩码语言模型解析条件转移概率分布;

17、s24,根据所述词表与所述二进制比特流的映射关系,通过发送方选择在能够映射到所述秘密信息的条件下,与所述掩码位置的原始词汇条件概率最接近的词汇作为替代词汇;

18、s25,根据完成所述替代词汇后的含密文本,通过发送方从公共信号提供至接收方;

19、s26,当所述含密文本无法嵌入所有的所述秘密信息,则重复s21~s25步骤,并将所得的所有所述含密文本发送至接收方。

20、进一步的,s3具体包括:

21、s31,根据所述分词器和所述密钥,通过接收方确定所述含密文本中被掩码和所述词汇替换的位置;

22、s32,根据所述词表和所述第二映射关系,通过解构法搜索替换词所对应的二进制比特流;

23、s33,将接收方获取多段文本时,重复所述s27、s31、s32步骤,并将所得的所有所述二进制比特流进行拼接处理;

24、s34,根据所述秘密信息和所述第一映射关系,通过接收方获取发送方隐藏的所述秘密信息。

25、第二方面,本专利技术实施例提供一种基于掩码语言模型的信息隐藏装置,用于实现第一方面所述的基于掩码语言模型的信息隐藏方法,所述装置包括:

26、信息共享模块,同于通过发送方构造嵌入和提取秘密信息所需的必要共享信息,将所述必要共享信息通过安全信道发送至接收方;其中,所述信息共享模块,具体包括:

27、第一映射转化单元,用于通过发送方构造秘密信息与二进制比特流的第一映射关系,并将秘密信息根据映射关系转化;

28、关系共享单元,用于通过发送方共享所述必要共享关系的词表和分词器;

29、密钥嵌入单元,用于通过发送方随机生成密钥,通过所述密钥确定每段文本中的嵌入位置和嵌入量;

30、第二映射转化单元,用于通过发送方使用构造词表中所有词与二进制比特流的第二映射关系;

31、信息发送单元,用于根据将所述第一映射转化单元、关系共享单元、密钥嵌入单元和第二映射转化单元,通过所述安全信道发送至接收方;

32、嵌入处理模块,用于根据所述必要共享信息中的信息确定文本,通过接收方嵌入所述秘密信息的位置;

33、信息提取模块,用于根据两次所述二进制比特流和自然文字之间的转译过程,通过接收方提取秘密信息。

34、进一步的,第一映射转化单元中,所述第一映射关系为双射关系,用于接收方恢复出秘密信息;

35、第二映射转化单元中,所述第二映射关系为满射关系,用于将多个词映射至相同的二进制比特流。

36、进一步的,所述嵌入处理模块,具体包括:

37、文本选取单元,用于根据所述信息确定文本,通过发送方选取一段原始文本;

38、位置确定单元,用于根据所述密钥,通过发送方确定所述原始文本的掩码位置;

39、转移解析单元,用于根据所述掩码位置,通过掩码语言模型解析条件转移概率分布;

40、词汇处理单元,用于根据所述词表与所述二进制比特流的映射关系,通过发送方选择在能够映射到所述秘密信息的条件下,与所述掩码位置的原始词汇条件概率最接近的词汇作为替代词汇;

41、文本发送单元,用于根据完成所述替代词汇后的含密文本,通过发送方从公共信号提供至接收方;

42、发送检测单元,用于当所述含密文本无法嵌入所有的所述秘密信息,则重复所述文本选取单元、位置确定单元、转移解析单元、词汇处理单元和文本发送单元的处理,并将所得的所有所述含密文本发送至接收方。

43、进一步的,所述信息提取模块本文档来自技高网...

【技术保护点】

1.一种基于掩码语言模型的信息隐藏方法,其特征在于,包括:

2.根据权利要求1所述的一种基于掩码语言模型的信息隐藏方法,其特征在于,S11中,所述第一映射关系为双射关系,用于接收方恢复出秘密信息;

3.根据权利要求2所述的一种基于掩码语言模型的信息隐藏方法,其特征在于,S2具体包括:

4.根据权利要求3所述的一种基于掩码语言模型的信息隐藏方法,其特征在于,S3具体包括:

5.一种基于掩码语言模型的信息隐藏装置,其特征在于,用于实现权利要求1至4任一项所述的基于掩码语言模型的信息隐藏方法,所述装置包括:

6.根据权利要求5所述的一种基于掩码语言模型的信息隐藏装置,其特征在于,第一映射转化单元中,所述第一映射关系为双射关系,用于接收方恢复出秘密信息;

7.根据权利要求6所述的一种基于掩码语言模型的信息隐藏装置,其特征在于,所述嵌入处理模块,具体包括:

8.根据权利要求7所述的一种基于掩码语言模型的信息隐藏装置,其特征在于,所述信息提取模块,具体包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现如权利要求1至4中任意一项所述的基于掩码语言模型的信息隐藏方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读取存储介质中存储有计算机程序,所述计算机程序被处理器执行时用以实现如权利要求1至4中任意一项所述的基于掩码语言模型的信息隐藏方法。

...

【技术特征摘要】

1.一种基于掩码语言模型的信息隐藏方法,其特征在于,包括:

2.根据权利要求1所述的一种基于掩码语言模型的信息隐藏方法,其特征在于,s11中,所述第一映射关系为双射关系,用于接收方恢复出秘密信息;

3.根据权利要求2所述的一种基于掩码语言模型的信息隐藏方法,其特征在于,s2具体包括:

4.根据权利要求3所述的一种基于掩码语言模型的信息隐藏方法,其特征在于,s3具体包括:

5.一种基于掩码语言模型的信息隐藏装置,其特征在于,用于实现权利要求1至4任一项所述的基于掩码语言模型的信息隐藏方法,所述装置包括:

6.根据权利要求5所述的一种基于掩码语言模型的信息隐藏装置,其特征在于,第一映射转化单元中,所述第一映射关系为双射...

【专利技术属性】
技术研发人员:杨天予
申请(专利权)人:天翼云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1