System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于动态截取算术编码的文本隐写方法及系统技术方案_技高网

一种基于动态截取算术编码的文本隐写方法及系统技术方案

技术编号:40008731 阅读:13 留言:0更新日期:2024-01-16 14:56
本发明专利技术公开了一种基于动态截取算术编码的文本隐写方法,包括发送方发送二进制秘密信息,将秘密信息转化为秘密小数;采用文本生成模型,获取候选词概率分布,并通过动态截取侯选池大小,获取侯选池概率分布;采用算术编码,建立秘密小数与候选池概率分布的映射关系;采用动态截取算术编码,针对秘密信息进行嵌入处理,获取隐写文本;提取获取的隐写文本中的秘密小数;采用获取的秘密小数,通过二进制转换处理,获取二进制秘密信息;将获取的二进制秘密信息发送到接收方,完成秘密信息的提取;本发明专利技术还提出一种实现所述基于动态截取算术编码的文本隐写方法的系统;本发明专利技术方法的隐蔽性增强、隐写文本质量提高、充分考虑概率分布差异性。

【技术实现步骤摘要】

本专利技术属于信息隐藏,具体涉及一种基于动态截取算术编码的文本隐写方法及系统


技术介绍

1、在这个信息快速发展的时代,信息安全在电力系统可靠运行承担的作用也越来越重要,也已成为当前研究的热点问题,吸引了大量研究学者的关注。

2、在信息隐藏方面,许多载体可以用于隐写,包括图像、音频、视频和文本;文本作为人类最基本的一种交流手段,同时也是电力系统使用最广泛的信息交互方式,使用频率和编码效率都高,非常适合作为隐写技术的载体,因此,基于文本的隐写技术研究具有很强的实用价值。

3、文本隐写术是指将秘密信息隐藏到公开传递的文件或文档中,以实现秘密信息的隐蔽传递;传统的文本隐写术大多是基于文本修改的隐写术,直接修改秘密消息并将其转换为不会引起窃听者怀疑的自然文本;这种方法存在信息编码不充分和嵌入率低的问题。

4、随着自然语言技术的发展,出现了基于文本生成的隐写术,这种方法利用神经语言模型生成更为流畅和信息隐藏能力更强的高质量文本,具有更高的隐蔽性和隐写嵌入率;然而,大多数现有的基于文本生成的隐写术在隐写嵌入算法中都忽略了不同时刻语言模型输出的概率分布的差异,从而影响隐写文本的质量。

5、综上所述,当前基于文本的隐写方法大多存在隐蔽性不够、隐写文本质量不高、在文本隐写嵌入算法中没有充分考虑概率分布的差异的问题。


技术实现思路

1、本专利技术的目的之一在于提供一种隐蔽性增强、隐写文本质量提高、充分考虑概率分布差异性的基于动态截取算术编码的文本隐写方法

2、本专利技术的目的之二在于提供一种实现所述基于动态截取算术编码的文本隐写方法的系统。

3、本专利技术提供的这种基于动态截取算术编码的文本隐写方法,包括如下步骤:

4、s1.发送方发送二进制秘密信息,将秘密信息转化为秘密小数;

5、s2.采用文本生成模型,获取候选词概率分布,并通过动态截取侯选池大小,获取侯选池概率分布;

6、s3.采用算术编码,建立步骤s1中的秘密小数与步骤s2中的候选池概率分布的映射关系;

7、s4.采用动态截取算术编码,针对步骤s1中的秘密信息进行嵌入处理,获取隐写文本;

8、s5.提取步骤s4获取的隐写文本中的秘密小数;

9、s6.采用步骤s5获取的秘密小数,通过二进制转换处理,获取二进制秘密信息;

10、s7.将步骤s6获取的二进制秘密信息发送到接收方,完成秘密信息的提取;

11、步骤s1所述的发送方发送二进制秘密信息,将秘密信息转化为秘密小数,具体包括:

12、采用下述公式将秘密信息转化为秘密小数:

13、

14、其中,b表示秘密小数,范围在0~1之间;mi表示第i位的二进制秘密信息;i表示二进制秘密信息的下标;l表示秘密信息的长度;

15、步骤s2所述的采用文本生成模型,获取候选词概率分布,并通过动态截取侯选池大小,获取侯选池概率分布,具体包括:

16、采用动态截取算术编码(diac)根据获取的候选词概率分布构建候选池;

17、文本隐写评价指标包括困惑度和kl散度,针对评价指标提出两种动态截取侯选池方案,具体包括:

18、(2-1)diac-α

19、采用困惑度衡量隐写文本与真实文本之间的差异程度;

20、通过困惑度表示隐写文本的质量;

21、定义α表示概率差阈值,通过α值的大小表示能够接受的相邻候选词的概率差大小,进而判断候选词是否能够添加到侯选池中;

22、通过文本生成模型获取候选词概率分布:p=[p1,p2,p3,k,pt-1,pt],其中,pi表示概率分布中第i时刻的概率值;i=1,2,…,t,i表示第i时刻,t表示候选词概率分布中的时刻规模;具体包括:

23、(1)计算候选词当前时刻概率比:

24、采用下述公式计算

25、

26、其中,表示当前时刻为i时,候选词的当前时刻概率比;pi表示候选词概率分布中第i时刻的概率值;pi-1表示候选词概率分布中第i-1时刻的概率值;

27、(2)计算候选词次当前时刻概率比:

28、采用下述公式计算

29、

30、其中,表示当前时刻为i时,候选词的次当前时刻概率比;pi-2表示候选词概率分布中第i-2时刻的概率值;

31、(3)计算差值:

32、采用下述公式计算之间的差值:

33、

34、设置概率差阈值α,判断α与ppi之间的关系,如果ppi≤α,则当前时刻i下的候选词能够加入到侯选池中;如果ppi>α,则当前时刻i下的候选词不能够加入到侯选池中;

35、在当前时刻判断结束后,继续对下一时刻的差值进行判断,进而确定已选侯选池的大小;

36、(2-2)diac-α-kl

37、kl散度表示隐写文本与自然文本分布之间的差异;

38、通过kl散度值,表示隐写文本的安全性;具体表示为应用gpt-2文本生成模型得到的隐写文本与应用语言模型得到的生成文本之间的差异;

39、基于步骤(2-1)提出的diac-α,设置kl散度阈值;当kl散度超过设定的阈值时,需要重新确定侯选池的大小;通过增加diac-α中的α值,扩大相邻候选词概率差,扩大截取的侯选池;

40、采用下述公式表示α值的变换:

41、

42、其中,αi表示第i时刻的概率差阈值;αi+1表示第i+1时刻的概率差阈值;βi表示kl散度超过设定的阈值时对应的αi值的增量值,取值范围为0~α/100;ps(cp_size)表示侯选池大小为cp_size的概率分布;plm表示文本生成模型的生成文本概率分布;dkl(ps(cp_size)||plm)表示侯选池大小为cp_size的kl散度;kl_tv表示设定的kl散度阈值;

43、本专利技术还提供一种实现所述基于动态截取算术编码的文本隐写方法的系统,包括发送方模块、文本生成模型模块、算术编码模块、隐写文本获取模块、信息提取模块、信息转换模块、接收方模块;各个模块按照串联的顺序依次连接;发送方模块用于发送二进制秘密信息,将秘密信息转化为秘密小数;文本生成模型模块通过文本生成模型,获取候选词概率分布,并通过动态截取侯选池大小,获取侯选池概率分布;算术编码模块用于建立秘密小数与侯选池概率分布的映射关系;隐写文本获取模块通过动态截取算术编码,针对秘密信息进行嵌入处理,获取隐写文本;信息提取模块用于提取隐写文本中的秘密小数;信息转换模块针对获取的秘密小数,通过二进制转换处理,获取二进制秘密信息;接收方模块接收获取的二进制秘密信息,完成秘密信息的提取。

44、本专利技术提供的这种基于动态截取算术编码的文本隐写方法,通过在每个时间步长下,使用概率差阈值判断候选词是否能够加入到侯选池中,获取侯选池的概本文档来自技高网...

【技术保护点】

1.一种基于动态截取算术编码的文本隐写方法,包括如下步骤:

2.根据权利要求1所述的一种基于动态截取算术编码的文本隐写方法,其特征在于步骤S1所述的发送方发送二进制秘密信息,将秘密信息转化为秘密小数,具体包括:

3.根据权利要求2所述的一种基于动态截取算术编码的文本隐写方法,其特征在于步骤S2所述的采用文本生成模型,获取候选词概率分布,并通过动态截取侯选池大小,获取侯选池概率分布,具体包括:

4.根据权利要求3所述的一种基于动态截取算术编码的文本隐写方法,其特征在于通过KL散度提出的动态截取侯选池方案,具体包括:

5.一种实现了包括权利要求1~5之一所述的基于动态截取算术编码的文本隐写方法的系统,其特征在于包括发送方模块、文本生成模型模块、算术编码模块、隐写文本获取模块、信息提取模块、信息转换模块、接收方模块;各个模块按照串联的顺序依次连接;发送方模块用于发送二进制秘密信息,将秘密信息转化为秘密小数;文本生成模型模块通过文本生成模型,获取候选词概率分布,并通过动态截取侯选池大小,获取侯选池概率分布;算术编码模块用于建立秘密小数与侯选池概率分布的映射关系;隐写文本获取模块通过动态截取算术编码,针对秘密信息进行嵌入处理,获取隐写文本;信息提取模块用于提取隐写文本中的秘密小数;信息转换模块针对获取的秘密小数,通过二进制转换处理,获取二进制秘密信息;接收方模块接收获取的二进制秘密信息,完成秘密信息的提取。

...

【技术特征摘要】

1.一种基于动态截取算术编码的文本隐写方法,包括如下步骤:

2.根据权利要求1所述的一种基于动态截取算术编码的文本隐写方法,其特征在于步骤s1所述的发送方发送二进制秘密信息,将秘密信息转化为秘密小数,具体包括:

3.根据权利要求2所述的一种基于动态截取算术编码的文本隐写方法,其特征在于步骤s2所述的采用文本生成模型,获取候选词概率分布,并通过动态截取侯选池大小,获取侯选池概率分布,具体包括:

4.根据权利要求3所述的一种基于动态截取算术编码的文本隐写方法,其特征在于通过kl散度提出的动态截取侯选池方案,具体包括:

5.一种实现了包括权利要求1~5之一所述的基于动态截取算术编码的...

【专利技术属性】
技术研发人员:王天锷黄瑶马雪强潘丽丽罗顺辉
申请(专利权)人:国网湖南省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1