当前位置: 首页 > 专利查询>温州大学专利>正文

一种序列生成式DNA隐写方法和评价方法技术

技术编号:36430090 阅读:39 留言:0更新日期:2023-01-20 22:41
针对现有的隐写技术所生成的伪序列仅能保留原DNA序列中一小部分统计分布特征,隐蔽性差;且抗隐写分析能力也很差,因此安全性较低。本发明专利技术提出了一种基于条件概率自适应编码的序列生成式DNA隐写方法,首先利用RNN网络学习自然DNA中的统计分布特征,再通过自适应分组算法生成与原始DNA高度相似的伪序列,实验结果显示,该方法显著提升了伪序列的隐蔽性和抗隐写分析能力,提高了信息隐藏的安全性。此外,在现有的DNA隐写术对其生成的伪序列的隐蔽性未有完善的评价机制的前提下,本发明专利技术提出通过三个参数来评价伪序列的感知隐蔽性与统计隐蔽性,进一步完善了DNA隐写系统安全性的评价体系。评价体系。评价体系。

【技术实现步骤摘要】
一种序列生成式DNA隐写方法和评价方法


[0001]本专利技术涉及信息加密传输领域,具体涉及基于DNA序列编码技术的秘密信息传输技术,具体为一种序列生成式DNA隐写方法和评价方法,包括:序列生成式DNA隐写方法、隐写载体伪序列(简称伪序列)的获取方法和对其的评价方法。

技术介绍

[0002]在当下信息传输环境中,信息传输的安全性一直都受到广泛关注,其中隐写术是保证信息安全的重要技术之一,它可以将秘密信息隐藏到自然载体中,而不会引起第三方检测者的怀疑,从而保证秘密信的安全传递。
[0003]在现代隐写术中,自然载体的形式可以分为数字形式和物理形式。对于数字形式的载体而言,其可以提供更快的传输速率和更多样化的信号形式(图像、视频、音频等),但是它严重依赖于互联网或者通讯设备,同时网络噪声和环境干扰也会对隐写算法的鲁棒性产生一定的影响。因此,在某一些特殊场景下(网络受限、干扰严重等),物理形式的载体有着不可替代的作用,这使得基于物理载体的隐写术一直吸引着相关领域研究者的目光。
[0004]随着近年来基因编辑技术和脱氧核糖核酸(DNA)本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种序列生成式DNA隐写方法,其特征在于:基于条件概率自适应编码ADG的序列生成式DNA隐写方法,利用RNN网络学习原始DNA中的统计分布特征,再通过自适应分组算法生成包含秘密信息的、与自然DNA高度相似的隐写载体伪序列;隐写载体伪序列简称伪序列;最后通过生物合成技术,按照该伪序列进行合成,即可得到包含秘密信息的DNA链;该DNA链具有高感知隐蔽性和统计隐蔽性,显著提升了隐写DNA链的抗隐写分析能力,使得隐写DNA链的信息隐藏具有高安全性。2.根据权利要求1所述的一种序列生成式DNA隐写方法,其特征在于:包含以下步骤:步骤1:准备阶段:选择RNN网络学习所用的DNA序列,为自然DNA序列的非编码区;步骤2:预处理阶段:对所选DNA序列以不同的分割长度SL进行划分,进行预处理,获得与DNA序列对应的碱基单元字典V
b
;分割长度的值即为SL值;步骤3:将预处理后的DNA序列构成数据集;步骤4:隐写载体伪序列模型训练阶段:构建RNN神经网络的隐藏层和全连接层,其中,RNN神经网络用于学习由步骤3获得的数据集的统计分布特征;RNN神经网络的隐藏层通过更新神经元权重值来保存学习到的统计分布,并用于生成伪序列;RNN神经网络的全连接层作为RNN网络输出的承接者,接收RNN网络的输出并最终输出碱基单元字典V
b
中所有碱基单元的分数,归一化后得到概率集合P
t
,用以计算损失函数;步骤5:构建损失函数,由损失函数是否收敛来决定是否继续训练:修正RNN隐藏层的神经元权重参数;即将步骤4获得的碱基单元概率分布P
t
输入到损失函数中,根据所述损失函数是否收敛来决定是否继续修正神经网络的参数值;当损失函数收敛后,得到训练完成的隐写载体伪序列生成模型,进入步骤6;反之,重复步骤5,直到损失函数收敛;步骤6:秘密信息嵌入阶段:根据步骤5获得的生成模型构建含有秘密信息的伪序列,具体为:根据步骤2中获得的碱基单元字典V
b
中所有碱基单元的概率集合,采用ADG编码算法对碱基单元的概率集合进行编码,生成包含秘密信息的伪序列;将该包含秘密信息的伪序列通过生物合成技术完成隐写DNA链的合成,即可发送给接收者。3.根据权利要求1或2所述的一种序列生成式DNA隐写方法,其特征在于:解密方法即显现的步骤,可以认为是加密过程的逆向过程,并且密钥是相同的,即对称加密算法;前述密钥即DNA隐写载体伪序列;显现方法具体如下:步骤C1:隐写DNA链传输阶段:发送者将隐写DNA链用任何可用于传输自然DNA链的方式传输给接收者,作为可选择的实施方式,可溶于纯净水后发送给接收者;同时,为了便于接收者获取其中的秘密信息,发送者需同时向接收者发送包括含有秘密信息的伪序列合成的DNA链、训练模型和SL值、碱基单元字典V
b
;步骤C2:秘密信息提取阶段:信息提取和信息隐藏的过程是反向的,因此接收者收到该隐写DNA链后,通过生物技术对其进行反向测定解析,获得该DNA链的序列,即含秘密信息的伪序列;再将伪序列按照SL值进行分割,得到处理后的由碱基单元组成的序列;碱基单元即为碱基数为SL的寡核苷酸;步骤C3:将步骤C2获得的序列输入到接收到的训练模型中,获得V
b
中所有碱基单元的概率分布P
t
;步骤C4:使用ADG编码算法对P
t
进行编码,根据碱基单元序列中的最后一个单词,提取出其包含的秘密信息;提取完毕后,删除掉最后一个碱基单元,更新碱基单元序列,重复步骤
C3和C4,直到所有碱基单元中的信息均被提取完毕,至此,接收者获得了所有秘密信息。4.根据权利要...

【专利技术属性】
技术研发人员:张鉴杨忠良黄陈炜戚昊琛尤方朔陈炯铭
申请(专利权)人:温州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1