当前位置: 首页 > 专利查询>天津大学专利>正文

一种DNA串联重复单元的拆分组装方法技术

技术编号:35432880 阅读:38 留言:0更新日期:2022-11-03 11:38
本发明专利技术涉及生物技术领域,尤其涉及一种DNA串联重复单元的拆分组装方法。本发明专利技术通过对串联重复序列进行拆分、组装,以较少的DNA模板量可实现高效的体外组装;无需对组装结果进行扩增,反应得到的为环形重组质粒,可直接转化受体细胞完成克隆,无需酶切、纯化等后续处理步骤;反应过程不依靠DNA聚合酶扩增反应,不涉及复杂的重组过程,突变率低,反应效率和保真度高;反应体系简单,成本低,便于操作,可适用于各种DNA片段的组装,在串联重复单元的组装上具有明显优势。装上具有明显优势。

【技术实现步骤摘要】
一种DNA串联重复单元的拆分组装方法


[0001]本专利技术涉及生物
,尤其涉及一种DNA串联重复单元的拆分组装方法。

技术介绍

[0002]DNA合成技术是合成基因组学,乃至现代分子生物学的根基,受当前合成技术的限制,双链DNA或目标基因组只能以短链oligo(寡聚核苷酸)的形式逐步拼接才能获得。PCR(聚合酶链式反应)或者酶切方法只限于获得自然界已有的DNA片段,而双链DNA的从头合成则需要通过oligo的拼接获得。除此以外,对于复杂的DNA序列,oligo往往需要经过合理的设计以减少oligo本身可能形成的二级结构等问题,以提高组装的效率。Repeat Splicer可以将用户输入的DNA序列按照用户自定义的参数拆分并设计成可组装的oligo,并通过评价序列退火温度、发卡结构及其退火温度等参数来输出最优结果,最大程度提高组装过程中的成功率。目前,通过oligo实现的DNA体外合成主要包括两类:
[0003](一)PCA技术:PCA技术通过将全长DNA序列打断为部分序列互补的寡核苷酸,通过退火、延伸及全长组装和扩增获得全长DNA片段的方法。过程如下:1)单链寡核苷酸末端序列互补,互为引物和模板;2)在嗜热DNA聚合酶作用下,经退火、延伸变成更长的双链DNA;3)与其他寡核苷酸片段或延伸产物变性、退火及延伸循环,见图4。
[0004]该方法需要寡核苷酸之间存在唯一、特异的互补序列。对于一个串联重复单元来说,PCA方法是可行的。但是当合成的DNA序列包含多个串联重复单元或oligo之间存在可能的错配或发卡结构时,PCA方法收到较大的限制。
[0005](二)连接酶链式组装:采用具有互补末端的引物,使PCR产物形成了重叠链,从而在随后的扩增反应中通过重叠链的延伸,将不同来源的扩增片段重叠拼接起来。过程如下:1)加入具有互补序列的寡核苷酸链、耐热DNA连接酶;2)加热,寡核苷酸链变性,解链;3)退火,寡核苷酸链彼此互补;4) DNA连接酶连接,见图5。
[0006]与PCA方法类似,该方法需要待组装的DNA序列在两端具有特异的同源序列,并且由于要求序列完全互补,对于序列非同源性的要求更高,在包含多个同源序列的DNA组装中存在困难。
[0007]单链oligo之间在退火形成双链后需要使用DNA连接酶进行连接及组装,这要求oligo的5

端具有磷酸基团。由于目前化学合成的oligo的两端均为羟基,往往需要对oligo进行磷酸化。为实现对oligo 5

端的特异性磷酸化,目前成熟的技术主要使用T4 PNK酶来实现。在本专利技术在采用此方法实现oligo的磷酸化过程。
[0008]总之,目前成熟的DNA体外组装方法受限于同源臂的特异性或组装效率,无法实现大规模的串联重复序列的体外组装。

技术实现思路

[0009]有鉴于此,本专利技术提供了一种DNA串联重复单元的拆分组装方法,该方法可现大规模的串联重复序列的体外组装,反应体系简单,成本低,便于操作。
[0010]为了实现上述专利技术目的,本专利技术提供以下技术方案:
[0011]一种DNA串联重复单元的拆分组装方法,包括:
[0012]步骤1:在目标序列的5

端依次加入XhoI的切割碱基、XhoI补充碱基、 BsaI识别序列及BsaI切割间隔碱基;在其3

端依次加入切割间隔碱基、BsaI 反向识别序列、XbaI补充碱基及XbaI切割碱基,获得待拆分序列;
[0013]步骤2:采用k

mer方法对待拆分序列进行分析,按照5

到3

的顺序依次获得长度为kbp的分析单元D1~D
n
;其中,k为大于0的任意帧数;n为所有分析单元的个数,n>1;
[0014]步骤3:判断分析单元D1~D
n
中是否存在发卡结构,如果存在发卡结构,记录发卡结构的位置,并按照如下公式计算发卡结构的退火温度T
m

[0015][0016]其中,[Na
+
]为Na
+
离子浓度;[GC]为发卡结构的GC含量,所述GC含量为发卡结构中GC碱基数占所述发卡结构的碱基总数的比例;length为发卡结构的长度,即碱基总数;
[0017]步骤4:以拆分长度为L bp对步骤1所述的待拆分序列按照5

到3

端的顺序依次进行拆分、判定,依次获得拆分单元C1~Cm;其中,L为用户自定义的拆分长度,m为拆分单元的个数,m>1;
[0018]以获得第一个拆分单元C1为例,假设将以拆分长度为Lbp对步骤1所述的待拆分序列按照5

到3

端的顺序拆分获得的第一个拆分单元为拆分单元1

1,判定是否保留拆分单元1

1,如果保留拆分单元1

1,则将其标记为拆分单元C1;
[0019]所述判定的方法包括:
[0020]首先根据步骤3获得的发卡结构的位置,判断拆分单元1

1中是否存在发卡结构;当拆分单元1

1中不存在发卡结构时,直接保留该拆分单元1

1,标记为拆分单元C1,然后以L bp的拆分长度对剩余待拆分序列继续进行拆分;当拆分单元1

1中存在发卡结构时,按照以下方法对拆分单元1

1进行处理:
[0021]1)按照如下公式计算拆分单元1

1的退火温度T
m


[0022]T
m

=81.5+16.6
×
log
10
[Na
+
]+0.41
×
([GC]‑
600/length)
[0023]其中,[Na
+
]为Na
+
离子浓度,[GC]为拆分单元的GC含量,length为拆分单元的长度;
[0024]2)将步骤1)计算的T
m

与步骤3记录的所述拆分单元1

1中最大发卡结构的T
m
进行比较:
[0025]①
、T
m

≥1.5T
m
时,则该拆分单元1

1满足拆分要求,保留该拆分单元1

1,标记为拆分单元C1,然后以L bp的拆分长度对剩余待拆分序列继续拆分;
[0026]②
、T
m

<1.5T
m
时,则不满足拆分要求,以L+1 bp的拆分长度对待拆分序列重新进行拆分,获得新的第一个拆分单元,拆分单元1

2;
[002本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种DNA串联重复单元的拆分组装方法,包括:步骤1:在目标序列的5

端依次加入XhoI的切割碱基、XhoI补充碱基、BsaI识别序列及切割间隔碱基;在其3

端依次加入切割间隔碱基、BsaI反向识别序列、XbaI补充碱基及XbaI切割碱基,获得待拆分序列;步骤2:采用k

mer方法对待拆分序列进行分析,按照5

到3

的顺序依次获得长度为kbp的分析单元D1~D
n
;其中,k为大于0的任意帧数;n为所有分析单元的个数,n>1;步骤3:判断分析单元D1~D
n
中是否存在发卡结构,如果存在发卡结构,记录发卡结构的位置,并按照如下公式计算发卡结构的退火温度T
m
;其中,[Na
+
]为Na
+
离子浓度;[GC]为发卡结构的GC含量,所述GC含量为发卡结构中GC碱基数占所述发卡结构总碱基数的比例;length为发卡结构的长度;步骤4:以拆分长度为Lbp对步骤1所述的待拆分序列按照5

到3

端的顺序依次进行拆分、判定,依次获得拆分单元C1~Cm;其中,L为用户自定义的拆分长度,m为拆分单元的个数,m>1;以获得第一个拆分单元C1为例,假设将以拆分长度为Lbp对步骤1所述的待拆分序列按照5

到3

端的顺序拆分获得的第一个拆分单元为拆分单元1

1,判定是否保留拆分单元1

1,如果保留拆分单元1

1,则将其标记为拆分单元C1;所述判定的方法包括:首先根据步骤3获得的发卡结构的位置,判断拆分单元1

1中是否存在发卡结构;当拆分单元1

1中不存在发卡结构时,则满足拆分要求,直接保留该拆分单元1

1,并标记为拆分单元C1,然后以Lbp的拆分长度对剩余待拆分序列继续进行拆分;当拆分单元1

1中存在发卡结构时,按照以下方法对拆分单元1

1进行处理:1)按照如下公式计算拆分单元1

1的退火温度T
m

;T
m

=81.5+I6.6
×
log
10
[Na
+
]+0.41
×
([GC]

600/length)其中,[Na
+
]为Na
+
离子浓度,[GC]为拆分单元的GC含量,length为拆分单元的长度;2)将步骤1)计算的T
m

与步骤3记录的所述拆分单元1

1中最大发卡结构的T
m
进行比较:

、T
m

≥1.5T
m
时,则该拆分单元1

1满足拆分要求,保留该拆分单元1
...

【专利技术属性】
技术研发人员:元英进谢泽雄殷振宁赵昊乾高峰
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1