一种基于特定基序列的高鲁棒性DNA存储方法技术

技术编号:44817963 阅读:25 留言:0更新日期:2025-03-28 20:06
本发明专利技术提出了一种基于特定基序列的高鲁棒性DNA存储方法,用于解决现有存储方案中忽视局部GC稳定性与全局鲁棒性技术问题。本发明专利技术的步骤为:构建"0‑1"映射规则和特定基序列;利用"0‑1"映射规则和特定基序列对待编码的二进制序进行DNA编码,生成规则索引序列和数据DNA序列;采用多元霍夫曼编码对规则索引序列进行压缩,并结合多元旋转编码对压缩的序列进行编码生成DNA编码序列;将得到的数据DNA序列多次测序与特定基序列比对来检错和纠错。本发明专利技术在保证局部GC含量接近50%的同时提高了纠错能力,优化了DNA存储的可靠性和效率;在平均存储密度为1.33bit/nt的情况下,提高了存储的鲁棒性,为大规模DNA数据可靠存储提供了新思路。

【技术实现步骤摘要】

本专利技术涉及dna序列编码的,尤其涉及一种高鲁棒性dna存储方法。


技术介绍

1、随着大数据时代的到来,互联网和物联网的快速发展加速了大规模数据的产生。5g通信技术大幅提高了数据传输速率,据2021年国际数据公司(international datacorporation,idc)预测,全球数据量从2020年至2025年的复合增长率为23%,预计到2025年将达到180泽字节。然而,传统的存储介质如光盘、磁性存储和半导体存储由于存储密度低、寿命短,难以应对未来大数据存储的挑战。dna链由四种核苷酸组成:腺嘌呤(a)、胸腺嘧啶(t)、鸟嘌呤(g)和胞嘧啶(c)。随着dna合成和测序技术的发展,dna存储为大数据存储提供了一种新的解决方案。

2、dna存储具备信息存储密度大、维护成本低、稳定性强和寿命长的显著优势。dna作为一种新型存储介质,具有高存储密度、长期稳定和低能耗等优势。然而,传统存储方案通常侧重于高密度存储,忽视了局部稳定性和解码鲁棒性。dna存储仍面临许多技术难题。在dna合成、扩增和测序过程中,单个核苷酸可能出现插入、删除和替换错本文档来自技高网...

【技术保护点】

1.一种基于特定基序列的高鲁棒性DNA存储方法,其特征在于,其步骤如下:

2.根据权利要求1所述的基于特定基序列的高鲁棒性DNA存储方法,其特征在于,所述"0-1"映射规则由"0"规则和"1"规则组成,"0"规则和"1"规则分别将二进制集合B={00,01,10,11}中的每个元素映射为DNA碱基集合N={A,C,G,T}中的一个碱基,且满足两个条件:①"0"规则和"1"规则均为一一映射,即N01≠N02≠N03≠N04,N11≠N12≠N13≠N14;其中,N01、N02、N03、N04为"0"规则中的元素,N11、N12、N13、N14为"1"规则中的元素;②碱基A/T与...

【技术特征摘要】

1.一种基于特定基序列的高鲁棒性dna存储方法,其特征在于,其步骤如下:

2.根据权利要求1所述的基于特定基序列的高鲁棒性dna存储方法,其特征在于,所述"0-1"映射规则由"0"规则和"1"规则组成,"0"规则和"1"规则分别将二进制集合b={00,01,10,11}中的每个元素映射为dna碱基集合n={a,c,g,t}中的一个碱基,且满足两个条件:①"0"规则和"1"规则均为一一映射,即n01≠n02≠n03≠n04,n11≠n12≠n13≠n14;其中,n01、n02、n03、n04为"0"规则中的元素,n11、n12、n13、n14为"1"规则中的元素;②碱基a/t与碱基g/c为互斥关系;

3.根据权利要求2所述的基于特定基序列的高鲁棒性dna存储方法,其特征在于,所述"0-1"映射规则的数学描述为

4.根据权利要求1-3中任意一项所述的基于特定基序列的高鲁棒性dna存储方法,其特征在于,对待编码的二进制序列c=(c1 c2 … ci-1 ci … cn-1 cn),第i个二进制元素ci∈{0,1},n为二进制序列c的长度,利用"0-1"映射规则和特定基序列进行dna编码是将二进制序列c映射为重复循环的特定基序列,实现方法为:

5.根据权利要求4所述的基于特定基序列的高鲁棒性dna存储方法,其特征在于,所述多元霍夫曼编码为m元霍夫曼编码,通过m元霍夫曼编码将规则索引序列压缩为m元序列,多元旋转编码利用旋转编码表将m元序列映射为符合约束的碱基序列。

6.根据权利要求5所述的基于特定基序列的高鲁棒性dna存储方法,其特征在于,所述m元霍夫曼编码构建m元霍夫曼树的方法为:将规则索引序列srules按照每t位二进制为一组转换为十进制数据并统计每种十进制数据的概率,将十进制数据称为信源符号;假设有f个信源符号,根据信源符号的概率将其按顺序排列,给m个概率最小的信源符号(af-m-1,af-...

【专利技术属性】
技术研发人员:牛莹张瑞凤张勋才齐宝楠刘奇刘飞凡王延峰焦洋洋
申请(专利权)人:郑州轻工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1