当前位置: 首页 > 专利查询>大连大学专利>正文

一种隐藏寻址的DNA存储编码设计方法技术

技术编号:33962813 阅读:75 留言:0更新日期:2022-06-30 00:52
本发明专利技术公开了一种隐藏寻址的DNA存储编码设计方法,包括:首先要将信息转换为二进制数据,并将数据分组、组内分段。其次,在每组数据中通过喷泉编码方式将数据异或并转化为DNA序列。然后,将每组数据中满足约束条件的DNA片段保留。最后,从每组数据中选出能够代表此序列的索引片段及7个配合索引解码的DNA片段,依次连接并输出。本发明专利技术因为在组内的数据片段异或,转化为满足约束条件的DNA片段使得DNA序列的局部GC含量更稳定,提高了序列的测序正确性。同时选取的用于隐藏索引的DNA片段为数据异或产生,所以相似性较低,可以避免序列拼接过程中因为索引相似度过高导致的拼接错误。过程中因为索引相似度过高导致的拼接错误。过程中因为索引相似度过高导致的拼接错误。

【技术实现步骤摘要】
一种隐藏寻址的DNA存储编码设计方法


[0001]本专利技术涉及编码设计
,具体涉及一种隐藏寻址的DNA存储编码设计方法。

技术介绍

[0002]目前,面对全球数据量呈指数级的增长趋势,传统的存储介质已不能满足对海量数据的存储需求,DNA作为一种天然的存储介质具有体积小、存储密度高等优势,可以提供一种稳定、高效、可持续的海量数据存储解决方案。直到21世纪初,Church等人首次以体外合成DNA的方式存储了659KB数据,并最终能够无损恢复原始数据。这项试验的成功打破了人们早期只能利用DNA存储少量字节的束缚,而在这项工作之前,最大的存储数据量小于1KB。Goldman等人设计的DNA序列存储数据更多,达到了739KB。这两项试验的成功掀起了包括哈佛大学、哥伦比亚大学等众多科研人员的研究高潮,将DNA存储推向一个新的研究热点方向。
[0003]DNA作为一种新型的存储技术,一般来讲,首先将数据通过某种映射方式将其转化成DNA序列,然后采用体外合成方式对数据进行存储,最后通过测序解码还原始数据。目前受DNA合成技术的限制,需要将DNA本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种隐藏寻址的DNA存储编码设计方法,其特征在于,包括:步骤1:获取输入数据并转换为二进制数据,将所述二进制数据进行分组,并在每组的数据内分段,根据分段情况生成鲁棒孤波度分布函数;步骤2:根据所述鲁棒孤波度分布函数确定一个度,再选取一个随机种子,所述种子与所述度一一对应;步骤3:在数据组内选取度个数据段进行异或,并将所述种子置于异或数据前形成异或数据段;步骤4:按照{00,01,10,11}

{A,C,G,T}的映射方式将所述异或数据段转化成DNA片段;步骤5:根据GC含量及均聚物筛选器的约束条件对所述DNA片段进行过滤,将满足约束条件的DNA片段暂且保留,不满足约束条件的DNA片段直接丢弃;步骤6:每组数据中都进行步骤2

5的操作,直至将所有种子用尽,该组数据编码完成;步骤7:将编码完成的每组数据都进行一个喷泉编码过程...

【专利技术属性】
技术研发人员:王宾王鹏浩陈蓉蓉张强
申请(专利权)人:大连大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1