当前位置: 首页 > 专利查询>大连大学专利>正文

一种利用双重匹配约束和错配约束提高DNA编码集质量的方法技术

技术编号:36498917 阅读:14 留言:0更新日期:2023-02-01 15:19
本发明专利技术公开了一种利用双重匹配约束和错配约束提高DNA编码集质量的方法,包括:随机构造初始DNA候选集;通过改进的算术优化算法对初始DNA候选集进行迭代寻优;获取符合传统约束条件的DNA序列;利用双重匹配约束和错配约束对符合约束条件的DNA序列进行再次筛选,得到DNA编码集。本发明专利技术能够获得数量多、质量好的DNA存储集,有效地提高DNA编码速率,减少DNA序列存储过程中发生的错误。列存储过程中发生的错误。列存储过程中发生的错误。

【技术实现步骤摘要】
一种利用双重匹配约束和错配约束提高DNA编码集质量的方法


[0001]本专利技术涉及DNA存储
,具体涉及一种利用双重匹配约束和错配约束的DNA编码方法。

技术介绍

[0002]随着社会进程信息化的推进,数据呈爆炸式增长,传统存储介质已经无法满足当前数据的存储需求,迫切地需要新的存储介质。DNA具有存储容量大、高持久性等优点,是最有可能解决数据存储问题的存储介质之一。设计数量大的编码集对于DNA存储是很重要的,编码集数量的大小会直接影响编码速率。数量增加,编码速率也随之提高。编码集的数量提高后,可以利用更短的序列实现和长序列一样的编码性能。
[0003]另一方面,低质量的DNA编码会增加测序过程中的错误,而测序是DNA存储的重要过程,直接影响存储效率。因此设计出高质量的DNA编码集是十分有意义的。

技术实现思路

[0004]本专利技术的目的在于,提供一种利用双重匹配约束和错配约束的DNA编码方法,其能够得到数量更大和质量更好的DNA编码集,减少非特异性杂交反应,有效地降低DNA存储中的错误率。
[0005]为实现上述目的,本申请的技术方案为:一种利用双重匹配约束和错配约束提高DNA编码集质量的方法,包括:
[0006]随机构造初始DNA候选集;
[0007]通过改进的算术优化算法对初始DNA候选集进行迭代寻优;
[0008]获取符合传统约束条件的DNA序列;
[0009]利用双重匹配约束和错配约束对符合约束条件的DNA序列进行再次筛选,得到DNA编码集。
[0010]进一步地,通过改进的算术优化算法对初始DNA候选集进行迭代寻优,具体为:算术优化算法的加速函数MOA和数学优化器概率MOP通过初等函数产生的随机扰动参数h和g来改变其值;用于获取DNA编码集时增加其数量;具体公式如下:
[0011][0012][0013]其中,min是加速函数MOA的最小值,max是加速函数MOA的最大值,可以分别设置为0.2和1;t是算法的当前迭代次数,T是算法的最大迭代次数;α为敏感参数,可以其值设置为5。
[0014]进一步地,所述随机扰动参数h和g获取方式为:
[0015]h=|m2×
acos(m3)|
ꢀꢀꢀꢀ
(3)
[0016]g=|m1×
acos(m3)|
ꢀꢀꢀꢀ
(4)
[0017]其中,m1和m2分别设置为1.2和0.65,m3是一个随机数,范围在0到1之间。
[0018]进一步地,在算术优化算法执行除法和减法算子时增加自适应权重w1,执行乘法和加法算子时增加自适应权重w2;用于获取DNA编码集时增加其数量;DNA序列的位置更新公式如下:
[0019][0020][0021]其中,参数V
j
=((UB
j

LB
j
)
×
μ+LB
j
),UB
j
和LB
j
分别表示第j个位置的最小值和最大值;μ是调节搜索符合条件的DNA序列的参数,可以设置为0.5;x
i,j
(t+1)表示本次迭代中第i个DNA序列的位置j;best(x
j
)是当前迭代的最优DNA序列的第j个位置;ε为一个整数;r2、r3为随机数。
[0022]进一步地,所述自适应权重w1和w2由下式获取:
[0023][0024][0025]其中,rand是一个随机数,范围在0到1之间;S为当前DNA序列。
[0026]更进一步地,所述双重匹配约束,具体为:以两个连续的碱基为一个组合,然后确定所有组合中是否存在三个以上的组合为互补碱基或者为相同碱基,如果存在则选择其中一个组合的两个不同碱基进行交换,若该组合的碱基互补,则选择组合外的非互补碱基进行替换。
[0027]更进一步地,所述碱基进行交换或替换的公式如下:
[0028][0029]其中,x为一条DNA序列,n表示此序列的碱基总数,x

为x的子序列,count为序列x中与x

相同或者互补的序列数量,x

=(x
j
,x
j+1
),j∈[1,n

1]。
[0030]更进一步地,所述错配约束,具体为:DNA序列扩增时3'端发生错配的可能程度和错配的引发效率程度,用MPL来表示,数字越大则发生错配的可能性和错配后引发的效率越高;在序列S中,最后一个碱基为G/C时,评级数为1,最后一个碱基为T时,评级为2,最后一个碱基为A时,评级为3,将错配约束等级设置为1。
[0031]更进一步地,所述错配约束用下式表示:
[0032]S=S1S2…
S
i
‑1S
i
[0033][0034]本专利技术采用的以上技术方案,与现有技术相比,具有的优点是:
[0035]1、改进的算术优化算法IAOA在每次迭代中对重要参数增加随机扰动,并使用添加自适应权重后的位置更新公式,以便得到更多的候选DNA序列,进而有利于得到全局最优的候选DNA序列。
[0036]2、利用改进的算术优化算法IAOA的优越性,结合传统约束设计DNA编码集,大大地增加了DNA编码集的数量,提高了编码速率,在更短的序列下实现了同样的编码性能。
[0037]3、双重匹配约束和错配约束,很好地解决了序列出现自身的互补反应和序列3'端碱基分布不合理的问题,有效地提高了DNA编码集的质量。
附图说明
[0038]图1为利用双重匹配约束和错配约束提高DNA编码集质量的方法的流程图。
具体实施方式
[0039]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请,即所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。
[0040]因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0041]为了证明本专利技术所提方法的有效性,利用双重匹配约束和错配约束,通过IAOA得到的DNA编码集进行验证。
[0042]实施例1
[0043]如图1所示,本实施例提供一种利用双重匹配约束和错配约束提高DNA编码集质量的方法,步骤如下:
[0044]步骤1:获取满足汉明距离约束的DNA候选集;
[0045]步骤2:在所述DNA候选集中加入自适应权重和初等函数扰动策略,更新所述DNA候选集;
[0046]步骤3:在更新后的DNA候选集中获取符合传统约束条件(GC含量约束、汉明距本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用双重匹配约束和错配约束提高DNA编码集质量的方法,其特征在于,包括:随机构造初始DNA候选集;通过改进的算术优化算法对初始DNA候选集进行迭代寻优;获取符合传统约束条件的DNA序列;利用双重匹配约束和错配约束对符合约束条件的DNA序列进行再次筛选,得到DNA编码集。2.根据权利要求1所述一种利用双重匹配约束和错配约束提高DNA编码集质量的方法,其特征在于,通过改进的算术优化算法对初始DNA候选集进行迭代寻优,具体为:算术优化算法的加速函数MOA和数学优化器概率MOP通过初等函数产生的随机扰动参数h和g来改变其值;具体公式如下:其值;具体公式如下:其中,min是加速函数MOA的最小值,max是加速函数MOA的最大值;t是算法的当前迭代次数,T是算法的最大迭代次数;α为敏感参数。3.根据权利要求2所述一种利用双重匹配约束和错配约束提高DNA编码集质量的方法,其特征在于,所述随机扰动参数h和g获取方式为:h=|m2×
acos(m3)|
ꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)g=|m1×
acos(m3)|
ꢀꢀꢀꢀꢀꢀꢀ
(4)其中,m1和m2分别设置为1.2和0.65,m3是一个随机数,范围在0到1之间。4.根据权利要求1或2所述一种利用双重匹配约束和错配约束提高DNA编码集质量的方法,其特征在于,在算术优化算法执行除法和减法算子时增加自适应权重w1,执行乘法和加法算子时增加自适应权重w2;DNA序列的位置更新公式如下:;DNA序列的位置更新公式如下:其中,参数V
j
=((UB
j

LB
j
)
×
μ+LB
j
),UB
j
和LB
j
分别表示第j个位置的最小值和最大值;μ是调节搜索符合条件的DNA序列的参数;x
i,j
(t+1...

【专利技术属性】
技术研发人员:周士华杜海桂李萍
申请(专利权)人:大连大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1