【技术实现步骤摘要】
一种DNA串联重复单元的拆分组装方法
[0001]本专利技术涉及生物
,尤其涉及一种DNA串联重复单元的拆分组装方法。
技术介绍
[0002]DNA合成技术是合成基因组学,乃至现代分子生物学的根基,受当前合成技术的限制,双链DNA或目标基因组只能以短链oligo(寡聚核苷酸)的形式逐步拼接才能获得。PCR(聚合酶链式反应)或者酶切方法只限于获得自然界已有的DNA片段,而双链DNA的从头合成则需要通过oligo的拼接获得。除此以外,对于复杂的DNA序列,oligo往往需要经过合理的设计以减少oligo本身可能形成的二级结构等问题,以提高组装的效率。Repeat Splicer可以将用户输入的DNA序列按照用户自定义的参数拆分并设计成可组装的oligo,并通过评价序列退火温度、发卡结构及其退火温度等参数来输出最优结果,最大程度提高组装过程中的成功率。目前,通过oligo实现的DNA体外合成主要包括两类:
[0003](一)PCA技术:PCA技术通过将全长DNA序列打断为部分序列互补的寡核苷酸,通过退火、延伸及全长组装和扩增获得全长DNA片段的方法。过程如下:1)单链寡核苷酸末端序列互补,互为引物和模板;2)在嗜热DNA聚合酶作用下,经退火、延伸变成更长的双链DNA;3)与其他寡核苷酸片段或延伸产物变性、退火及延伸循环,见图4。
[0004]该方法需要寡核苷酸之间存在唯一、特异的互补序列。对于一个串联重复单元来说,PCA方法是可行的。但是当合成的DNA序列包含多个串联重复单元或oligo之间存在可能的 ...
【技术保护点】
【技术特征摘要】
1.一种DNA串联重复单元的拆分组装方法,包括:步骤1:在目标序列的5
’
端依次加入XhoI的切割碱基、XhoI补充碱基、BsaI识别序列及切割间隔碱基;在其3
’
端依次加入切割间隔碱基、BsaI反向识别序列、XbaI补充碱基及XbaI切割碱基,获得待拆分序列;步骤2:采用k
‑
mer方法对待拆分序列进行分析,按照5
’
到3
’
的顺序依次获得长度为kbp的分析单元D1~D
n
;其中,k为大于0的任意帧数;n为所有分析单元的个数,n>1;步骤3:判断分析单元D1~D
n
中是否存在发卡结构,如果存在发卡结构,记录发卡结构的位置,并按照如下公式计算发卡结构的退火温度T
m
;其中,[Na
+
]为Na
+
离子浓度;[GC]为发卡结构的GC含量,所述GC含量为发卡结构中GC碱基数占所述发卡结构总碱基数的比例;length为发卡结构的长度;步骤4:以拆分长度为Lbp对步骤1所述的待拆分序列按照5
’
到3
’
端的顺序依次进行拆分、判定,依次获得拆分单元C1~Cm;其中,L为用户自定义的拆分长度,m为拆分单元的个数,m>1;以获得第一个拆分单元C1为例,假设将以拆分长度为Lbp对步骤1所述的待拆分序列按照5
’
到3
’
端的顺序拆分获得的第一个拆分单元为拆分单元1
‑
1,判定是否保留拆分单元1
‑
1,如果保留拆分单元1
‑
1,则将其标记为拆分单元C1;所述判定的方法包括:首先根据步骤3获得的发卡结构的位置,判断拆分单元1
‑
1中是否存在发卡结构;当拆分单元1
‑
1中不存在发卡结构时,则满足拆分要求,直接保留该拆分单元1
‑
1,并标记为拆分单元C1,然后以Lbp的拆分长度对剩余待拆分序列继续进行拆分;当拆分单元1
‑
1中存在发卡结构时,按照以下方法对拆分单元1
‑
1进行处理:1)按照如下公式计算拆分单元1
‑
1的退火温度T
m
’
;T
m
’
=81.5+I6.6
×
log
10
[Na
+
]+0.41
×
([GC]
‑
600/length)其中,[Na
+
]为Na
+
离子浓度,[GC]为拆分单元的GC含量,length为拆分单元的长度;2)将步骤1)计算的T
m
’
与步骤3记录的所述拆分单元1
‑
1中最大发卡结构的T
m
进行比较:
①
、T
m
’
≥1.5T
m
时,则该拆分单元1
‑
1满足拆分要求,保留该拆分单元1
...
【专利技术属性】
技术研发人员:元英进,谢泽雄,殷振宁,赵昊乾,高峰,
申请(专利权)人:天津大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。