一种满足生物条件约束的DNA编码方法、终端设备及存储介质技术

技术编号:43571350 阅读:18 留言:0更新日期:2024-12-06 17:40
一种满足生物条件约束的DNA编码方法,包括:根据给定的参数信息构造分圆陪集S<subgt;a</subgt;;根据分圆陪集S<subgt;a</subgt;构造一个多项式;选择由部分多项式张成向量空间V<subgt;d</subgt;:其进一步包括根据设定的汉明距离d选择满足max{S<subgt;a</subgt;}≤d的所有分圆陪集S<subgt;a</subgt;所对应的多项式,用这些多项式张成F<subgt;4</subgt;上向量空间;将向量空间V<subgt;d</subgt;中的多项式映射成码字;从所述码字中筛选符合生物约束的码字以产生最终码本,所述最终码本满足:其中任意两个码字之间的编辑距离至少为d<subgt;e</subgt;≤d,其中该码可以纠正个编辑错误。本发明专利技术是一种新型的可纠正多个编辑错误(插入、删除或替换)且满足生物约束(包含但不仅局限于GC全局平衡与局部平衡,游程约束以及发卡约束)的DNA编码方法。

【技术实现步骤摘要】

本申请属于数据存储,尤其涉及一种满足生物条件约束dna编码方法、终端及计算机可读存储介质,特别是特别涉及一种新型的可纠正多个编辑错误(插入、删除或替换)且满足生物约束(包含gc全局平衡与局部平衡,游程约束以及发卡约束)的dna编码方法、终端设备及存储介质。


技术介绍

1、在爆炸性数字数据增长的时代,正在探索dna作为下一代分子存储介质。 通过使用四个天然核苷酸(a,t,g和c),合成dna分子中的数据,并通过测序从dna中检索数据,可以在体外编码数据。由于分子在原子水平上的操作,dna数据存储实现了极高数据密度。 dna材料在液体中在相对较高的温度下都是非常稳定的,与许多现有的介质材料相比提供了高耐久性(高保持力)。 dna中的数据可以通过简单的pcr反应容易地产生数亿个拷贝,同时保持低能量。 dna数据检索极大地受益于测序技术的革命,包括illumina下一代测序(ngs)和纳米孔3。rd产生测序,其可以以不断降低的价格快速地对人和其它基因组测序。

2、然而,dna数据存储的当前策略也面临挑战。任何数据集的存储都需要通过化学或酶法无模板地合成本文档来自技高网...

【技术保护点】

1.一种满足生物条件约束的DNA编码方法,其特征在于,包括:

2.如权利要求1所述的满足生物条件约束的DNA编码方法,其特征在于,根据给定的参数信息构造分圆陪集Sa进一步包括:

3.如权利要求2所述的满足生物条件约束的DNA编码方法,其特征在于,分圆陪集Sa为具有如下性质:且,且。

4.如权利要求2所述的满足生物条件约束的DNA编码方法,其特征在于,根据所述分圆陪集Sa构造一个多项式进一步包括:

5.如权利要求4所述的满足生物条件约束的DNA编码方法,其特征在于,将所述向量空间Vd中的多项式映射成码字进一步包括:

6.如权利要求...

【技术特征摘要】

1.一种满足生物条件约束的dna编码方法,其特征在于,包括:

2.如权利要求1所述的满足生物条件约束的dna编码方法,其特征在于,根据给定的参数信息构造分圆陪集sa进一步包括:

3.如权利要求2所述的满足生物条件约束的dna编码方法,其特征在于,分圆陪集sa为具有如下性质:且,且。

4.如权利要求2所述的满足生物条件约束的dna编码方法,其特征在于,根据所述分圆陪集sa构造一个多项式进一步包括:

5.如权利要求4所述的满足生物条件约束的dna编码方法,其特征在于,将所述向量空间vd中的多项式映射成码字进一步包括:

6.如权利要求1或4所述的满足生物条件约束的dna编码方法,其特征在于,从所述码字中筛选符合生物约束的码字以产生最终码本进一步包括:

7.如权利要求6所述的满足生物条件约束的dna编码方法,其特征在于,从所述码字中筛选符合生物约束的码字为候选码字进一步包括:选择满足gc-全局平衡、gc-局部平衡、游程约束、发卡约束在内至少其中之一的生物条件约束的码字。

8.如权利要求7所述的满足生物条件约束的dna编码方法,其特征在于,所述gc-全局平衡的码字是选择满足以下条件的码字:对任意小的实数,和dna序列,s的gc含量满足,k1是小于1的一预设常数。

...

【专利技术属性】
技术研发人员:姜朔张璐帅
申请(专利权)人:密码子杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1