【技术实现步骤摘要】
一种基于神经网络的DNA存储中恶意篡改检测方法
[0001]本专利技术涉及DNA存储的
,尤其涉及一种基于神经网络的DNA存储中恶意篡改检测方法。
技术介绍
[0002]信息存储是人类文明发展的必然需求,在这个信息爆炸的时代,高效快速的信息给人们的生活带来了许多便捷,同时由此也产生了海量的数据。数据的价值日益凸显,成为了宝贵的财富,对人类文明的发展有着重要的作用。但是磁带、硬盘、闪存等存储介质在存储密度、使用寿命、能源损耗等方面存在一定的局限。与此同时,DNA作为一种在人类历史上一直存在的超高密度和超稳定的数据存储介质,逐渐走入人们的视野中。
[0003]随着科学研究的不断推进,特别是人类基因组计划等科学项目的进行,人们已经从原来的仅仅认识DNA发展到能够人工合成DNA、读取DNA信息等,这对DNA存储而言是至关重要的。曾经的遗传信息的组成部分,现在可以用来记录人们日常产生的信息,这已经不再是遥不可及的事情。
[0004]DNA存储是将基于二进制01的信息映射到四种碱基(A、G、C、T)上并通过信息编码 ...
【技术保护点】
【技术特征摘要】
1.一种基于神经网络的DNA存储中恶意篡改检测方法,其特征在于,包括如下步骤:S1:将原始数据生成数据集,利用DNA编码规则将数据集中的原始数据生成DNA序列,并将数据集分成训练序列和测试序列;S2:使用k
‑
mers对训练序列进行分割生成对应的词表,将分割后序列输入DNABERT网络进行训练得到DNABERT检测模型;S3:使用k
‑
mers对测试序列分割并输入训练好的DNABERT检测模型对DNA序列进行分类,以判别其是否发生恶意篡改。2.根据权利要求1所述的基于神经网络的DNA存储中恶意篡改检测方法,其特征在于,所述DNA编码规则为固定规则的简单映射编码、Goldman编码、Grass编码、DNA喷泉编码、阴阳编码或Spider
‑
web编码中的一种。3.根据权利要求1或2所述的基于神经网络的DNA存储中恶意篡改检测方法,其特征在于,所述步骤S1中的DNA序列满足生化约束,生化约束为均聚物长度约束、序列GC含量约束或特异片段约束中的至少一种。4.根据权利要求3所述的基于神经网络的DNA存储中恶意篡改检测方法,其特征在于,所述k
‑
mers的实现方法是将一个长度为L的DNA序列,按照窗口长度为k进行滑动,将每个长度为k的片段视为一个词,总共得到L
‑
k+1个词;通过自然语言处理在L
‑
k+1个词的最前面增加分类头[CLS]、在最后面增加句子分隔符[SEP]。5.根据权利要求4所述的基于神经网络的DNA存储中恶意篡改检测方法,其特征在于,所述DNABER...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。