用于改进多核苷酸体外组装的组合物和方法技术

技术编号:39045891 阅读:10 留言:0更新日期:2023-10-10 11:58
将大量的片段有序地组装成单个大DNA在组装产物的频率和保真度方面都得到了改善。这是通过新的组合物和方法实现的,这些组合物和方法被用于计算机系统,该系统整合了来自多个来源的综合连接数据,以提供优化的合成悬链或来自限制性核酸内切酶切割DNA片段的悬链,以便通过连接进行组装。通过使用新型的识别7个核苷酸(碱基)并切割DNA的限制性核酸内切酶,以在合成活化剂寡核苷酸的帮助下形成4碱基悬链,避免了基因内切割位点。不同连接酶的连接偏好的变化为组装反应提供了额外的精度。使用该改进的方法的实例是从52个片段的病毒基因组成功组装,以及还有细菌操作子的52个片段的有序组装。有序组装。

【技术实现步骤摘要】
【国外来华专利技术】用于改进多核苷酸体外组装的组合物和方法

技术介绍

[0001]从较小的组件DNA分子体外有序组装大DNA分子是合成生物学的重要特征。已经开发了多种方法,包括序列和连接无关的克隆(SLIC)(Li等人,Nat.Methods Res,第4卷,251

256(2007))、Golden Gate(Engler等人,PLOS one 3,e3647(2007)、Engler等人,PlosOne e5553(2009))、循环聚合酶延伸克隆(CPEG)(Quan等人,PlosOne 4,e 6441(2009),(New England Biolabs,Ipswich,MA)、无缝连接克隆提取物(SLICE)(Zhang等人,NAR 40,e55(2012)和枯草杆菌中有序基因组装(OGAB)(Tsuge等人,Scientific Reports,5,10655(2015))。这些方法在体外和体内组装方法、同源重组方法以及外切酶和连接酶的各种使用方面有所不同。任何组装方法的成功都取决于组装片段的频率和保真度,然而对这些参数所依赖的标准的系统分析却非常少。
[0002]在被称为Golden Gate组装的方法中,DNA的片段是用在双链DNA上产生单链悬链的限制性核酸内切酶而形成的。然后在多个不同的片段上的悬链之间进行连接,以由这些片段组装单一的双链分子。WO 2020/081768中描述了在期望数量的片段的指定标准下为多核苷酸片段组装确定优选悬链的方法。使用T4 DNA连接酶选择优化悬链是在改变悬链序列的基础上,基于组装片段的广泛测序使用计算机软件进行整理(collate)。包括温度和温育时间的其他因素也有变化,并将这些因素的结果整合到计算分析中。对片段组装的保真度和效率的系统分析,以及所得数据以用户友好的格式的可及性,显示出促进了大量的片段以期望的顺序以时间上有效的方式组装。
[0003]Golden Gate组装方法的一个方面是对IIS型限制性核酸内切酶和连接酶的依赖。识别5或6个碱基的IIS型核酸内切酶可能会产生不期望的内部切割位点。这些可以通过位点定向诱变或通过在识别序列中设计组装连接点来消除,但这些消除策略需要时间并增加成本。内部位点大大降低了组装效率,因为它们使完成的构建体容易被组装反应中存在的限制酶消化,导致不正确和不需要的组装。因此,具有识别7个核苷酸的IIS型内切酶以进行裂解是期望的。这样的酶对组装多片段是特别有用的,在这种情况下,组装是复杂的,并且最大效率是期望的。此外,能够彻底切割且没有可检测到的星号活性(star activity)的核酸内切酶是优选的。
[0004]Grigaite等人,Nucleic Acid Research 2002,vol 30e123描述了AarI,它是一种具有7个核苷酸识别序列的IIS型核酸内切酶。遗憾地,这种核酸内切酶具有星号活性,并且不能将DNA彻底切割。AarI的DNA或蛋白质序列或缓冲要求都不为人所知,因此改进这种酶的选项不可得。因此,需要另外的改进的限制性核酸内切酶,它能识别7个核苷酸以形成4碱基悬链,并能彻底切割。
[0005]Golden Gate组装方法的另一个方面是它对T4连接酶的依赖。用T4 DNA连接酶检测到了连接各种互补悬链的偏倚(Potapov等人,ACS Synthetic Biology,7,2665

2674(2018);Nilsson等人,Nucleic Acids Res.10:1425

1437(1982);Goffin等人,Nucleic Acids Res.15:8755

8771(1987);Wu等人,Gene,76:245

254(1989);Harada等人,Nucleic Acids Res.,21,2287

2291(1993);Showalter等人,Chem Rev.106:340

360(2006);Engler
等人,PlosOne e5553(2009);Engler等人,Methods Mol.Biol.,729:167

181(2011);Engler等人,Methods Mol.Biol.,1116,119

131(2014))。这种偏倚伴随着因连接的DNA中错配序列的连接而产生的不太完美保真度,对于有序组装反应中的大量片段来说,这成为重要问题。对于大片段组装来说,选择悬链组的通用规则还没有被确定。相反,对于每种单独的情况,组装设计可以通过计算机工具来实现,该工具可以比较退火的悬链连接数据,以提供优化的悬链组或评估现有的悬链组。因为大的片段组的组装的用途增加,所以的确需要完善现有的计算机工具来进行数据优化组装设计。

技术实现思路

[0006]提供了一种合成自互补寡核苷酸,其特征在于双链区和单链环,其中双链区含有(New England Biolabs,Inc.)的识别序列,具有不可连接的3

和5

端,并且不能被PaqCI裂解。本文所定义的PaqCI包括与野生型相比氨基酸修饰不超过10%并保留DNA识别特异性和裂解特性的变体。寡核苷酸可由以下任何一个或多个特征进一步限定:双链区的长度为10

50个碱基对;寡核苷酸的长度小于110个核苷酸;寡核苷酸的3

端不是3

羟基;寡核苷酸的5

端不是5

磷酸和/或识别序列为CACCTGC;和在寡核苷酸中仅出现一次。
[0007]提供了一种反应混合物,其包括上述合成自互补寡核苷酸和PaqCI限制性核酸内切酶或其变体,其氨基酸序列与SEQ ID NO:1具有至少90%的氨基酸序列一致性,其中PaqCI在本文中限定为包括与野生型相比氨基酸修饰不超过10%并保留DNA识别特异性和裂解特性的变体。反应混合物的特征可包括以下一个或多个特征:PaqCI与合成自互补寡核苷酸的比在1单位PaqCI:0.75pmole至9pmole的寡核苷酸的范围内;包括双链DNA底物和/或连接酶;DNA底物含有PaqCI的一个或多个识别序列,并且可被PaqCI裂解以产生4碱基悬链;DNA底物中的识别序列为CACCTGC;DNA连接酶选自T4 DNA连接酶、T3DNA连接酶、T7 DNA连接酶、PBCV

1DNA连接酶和hLig3;PaqCI与连接酶的比为2.5

20个PaqCI单位比200

800个连接酶单位;反应混合物包括多个质粒或PCR产物,这些质粒或PCR产物包含的片段每个侧边都有PaqCI的结合位点,并且其中通过PaqCI或其变体对质粒或PCR产物的裂解产生具有不同的4碱基悬链的片段。
[0008]提供了一种方法,包括以下步骤:(a)获得反应混合物,其包括(i)如上所述的合成寡核苷酸;(ii)PaqCI;(ii本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种包括双链区和单链环的合成自互补寡核苷酸,其中所述双链区含有PaqCI的识别序列、具有不可连接的3

和5

端并且不能被PaqCI切割。2.根据权利要求1所述的寡核苷酸,其中所述双链区的长度是10

50个碱基对。3.根据权利要求1

2中任一项所述的寡核苷酸,其中所述寡核苷酸的长度小于110个核苷酸。4.根据权利要求1

3中任一项所述的寡核苷酸,其中所述寡核苷酸的3

端不是3

羟基。5.根据权利要求1

4中任一项所述的寡核苷酸,其中所述寡核苷酸的5

端不是5

磷酸。6.根据权利要求1

5中任一项所述的寡核苷酸,其中所述识别序列是(5
’‑
CACCTGC
‑3’
/3
’‑
GCAGGTG
‑5’
)。7.一种反应混合物,其包括:(a)根据权利要求1

6中任一项所述的合成自互补寡核苷酸;和(b)PaqCI或其变体,其具有与SEQ ID NO:1具有至少90%氨基酸序列同一性的氨基酸序列。8.根据权利要求7所述的反应混合物,其中PaqCI与所述合成自互补寡核苷酸的比在1单位PaqCI:0.75pmole

9pmole寡核苷酸的范围内。9.根据权利要求7或8所述的反应混合物,进一步包括双链DNA底物,其中所述底物含有PaqCI的识别序列并且可被PaqCI切割以产生4碱基悬链。10.根据权利要求9所述的反应混合物,其中所述DNA底物中的识别序列是(5
’‑
CACCTGC
‑3’
/3
’‑
GCAGGTG
‑5’
)。11.根据权利要求7

10中任一项所述的反应混合物,进一步包括DNA连接酶。12.根据权利要求11所述的反应混合物,其中所述DNA连接酶选自T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、PBCV

1DNA连接酶和人类连接酶3(hLig3)。13.根据权利要求7

12中任一项所述的反应混合物,进一步包括含有片段的多个质粒或PCR产物,每个片段的侧翼是PaqCI的结合位点,并且其中通过PaqCI或其变体切割所述质粒或PCR产物产生具有不同的4碱基悬链的片段。14.根据权利要求7至13中任一项所述的反应混合物,其中所述PaqCI与连接酶的比为2.5

20个PaqCI单位比200

800个连接酶单位。15.一种方法,其包括:(a)获得反应混合物,其包括:(i)根据权利要求1

6中任一项所述的合成寡核苷酸;(ii)PaqCI;(iii)连接酶;和(iv)DNA底物库,每个底物具有至少一个PaqCI识别序列和切割位点;(b)用PaqCI切割所述DNA底物库,以生成具有4碱基悬链的片段;和(c)将互补的4碱基悬链连接在一起以产生片段的有序组装物。16.根据权利要求15所述的方法,其中所述库中的DNA底物选自下列中的一种或多种:PCR产物、质粒、基因组或染色体。17.根据权利要求15或16所述的方法,其中(c)进一步包括将所述有序组装物连接到目的载体或病毒基因组中。
18.根据权利要求17所述的方法,其中所述目的载体为质粒或染色体。19.根据权利要求15

18中任一项所述的方法,其中所述连接酶选自:T4 DNA连接酶、T3 DNA连接酶、T7 DNA连接酶、PBCV

1和人类连接酶3(hLig3)。20.根据权利要求15至19中任一项所述的方法,其中有10

100个具有独特序列的DNA底物,并且所述有序组装物包括在步骤(c)中连接在一起的10

100个片段。21.根据权利要求20所述的方法,其中有至少20个具有独特序列的DNA底物,并且所述有序组装物包括至少20个在步骤(c)中连接在一起的片段。22.根据权利要求15

21中任一项所述的方法,其中所述反应混合物进一步包括以下一种或多种:DNA修复酶、脱腺苷酶和/或群集剂。23.根据权利要求22所述的方法,其中所述群集剂是分子量在600

8000的范围内的聚乙二醇(PEG)。24.根据权利要求22所述的方法,其中所述脱腺苷酶是酵母脱腺苷酶。25.根据权利要求22所述的方法,其中所述DNA修复酶是EndoMS。26.根据权利要求15

25中任一项所述的方法,其中步骤(a)进一步包括使用计算机工具确定反应混合物的4碱基悬链组,其中:(i)所述计算机工具由数据集生成所述DNA库的4碱基悬链组的优化的保真度和/或频率得分,其中所述优化的保真度和/或频率得分源自互补序列退火的数据;和来自不同的4碱基悬链的连接酶活性的数据;和/或(ii)所述计算机工具在计算机序列中提供断点以生成在有序组装物中经由优化的4碱基悬链连接的片段序列。27.一种试剂盒,其包括:根据权利要求1所述的合成自互补寡核苷酸,和PaqCI。28.根据权利要求27所述的试剂盒,进一步包括连接酶。29.根据权利要求27或28所述的试剂盒,进一步包括选自修复酶、脱腺苷酶和群集剂的辅助因子。30.根据权利要求27至29中任一项所述的试剂盒,包括从具有4碱基悬链的组件片段合成大DNA的说明书。31.根据权利要求27

30中任一项所述的试剂盒,其中所述PaqCI和活化剂与连接酶组合在单个容器中或存在于单独的容器中。32.根据权利要求27

31中任一项所述的试剂盒,其中所述寡核苷酸、连接酶和PaqCI变体中的至少一种被冻干或固定在固体基底比如二维或三维表面上。33.根据权利要求27

32中任一项所述的试剂盒,其中所述群集剂是聚乙二醇(PEG)并且具有在600

8000的范围内的分子量。34.根据权利要求27

33中任一项所述的试剂盒,其中所述修复酶包括错配的特异性核酸内切酶。35.一种为在选定的连接条件下进行的有序组装反应选择悬链组的计算机实施的方法,其包括:(a)接收:(i)用于组装反应的期望的悬链数量和(ii)所述悬链的长度;(b)从悬链表中选择悬链组,其中选择的悬链组具有(i)中接收的期望的悬链数量和(ii)中接收的悬链的长度;
(c)从多种不同的连接酶选择连接酶,用于以减小的偏倚连接所述悬链;(d)对于组中的每个单条悬链,计算所选择的连接酶的连接保真度得分,其中每个单条悬链的连接保真度得分表示相对于组中的所有悬链及其互补序列,所述单条悬链及其互补序列独立地连接到完全互补的悬链的频率;(e)基于步骤(d)中所输出的计算的每个单条悬链的连接保真度得分,计算所述悬链组的整体连接保真度得分;(f)迭代(b)

(e),直到计算了多个整体连接保真度得分,每个得分针对不同的悬链组;和(g)提供具有选定连接酶的适合整体连接保真度得分的悬链组。36.根据权利要求35所述的方法,其中在(b)中选择的所述悬链组中的每个单条悬链在所述组中是唯一的,与所述组中的另一条悬链不互补,并且不是回文的。37.根据权利要求35或36所述的方法,其中(c)中计算连接保真度得分进一步包括查阅不同连接酶的连接频率表和偏倚表,所述表包括连接事件和/或错配事件数量的单个实验限定的测量值。38.根据权利要求35

37中任一项所述的方法,进一步包括:计算相对于在所述单条悬链和所述组中所有悬链及其互补序列与所述单条悬链的互补序列和所述组中所有悬链及其互补序列之间发生的连接事件总数,在每个单条悬链及其互补序列之间发生的连接事件和/或错配事件的数量。39.根据权利要求35

38中任一项所述的方法,其中所述悬链组对应于用于有序组装成靶标多核苷酸的多个双链多核苷酸片段每一端上的各单条悬链,其中各单条悬链是由2

5个核苷酸组成的单链序列,使得每个多核苷酸片段的每一端具有不同的悬链,并且其中片段组装的顺序是在多核苷酸一端的悬链与相邻多核苷酸一端的互补悬链退火的产物。40.根据权利要求35

39中任一项所述的方法,其中(a)进一步包括,接收:(iv)组装物的核苷酸序列;和(v)(iv)的所述核苷酸序列可以被酶切的一组区间,并在所述区间中确定其长度与(ii)中输入的悬链长度相同的非冗余子序列组,其中每个子序列具有悬链;并且所述方法进一步包括:(h)将具有适合整体保真度得分...

【专利技术属性】
技术研发人员:G
申请(专利权)人:新英格兰生物实验室公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1