从头合成的基因文库制造技术

技术编号:14809578 阅读:87 留言:0更新日期:2017-03-15 02:07
本文提供了具有低错误率的从头合成的核酸大文库。此外,本文描述了用于制备高质量结构单元如寡核苷酸的装置。较长的核酸可使用微流体组装件平行合成。此外,本文的方法允许快速构建高质量长基因的大文库。本文进一步描述了用于制备高质量长核酸的大文库的装置。

【技术实现步骤摘要】
【国外来华专利技术】交叉引用本申请要求2013年8月5日提交的美国临时申请号61/862445和2013年8月5日提交的美国临时申请号61/862457的权益,这些申请通过引用并入本文。
技术介绍
具有高保真度和低成本的高效化学基因合成在生物技术和医学以及基础生物医学研究中发挥核心作用。从头基因合成是基础生物学研究和生物技术应用的强大工具。尽管已知用于以小规模合成相对较短片段的各种方法,但这些技术在可放大性、自动化、速度、精确度和成本方面却不尽人意。需要用于保证所需基因的成功合成并适于自动化的简单、可重现、可放大、不易出错并具成本效益的方法的装置。
技术实现思路
如上所述,迫切需要能够以较少的错误快速而高效地合成大基因文库或相对较长的寡核苷酸片段的方法、装置和系统。类似地,还需要能够以微流体规模划分(partition)和混合液体试剂以供平行进行大量可单独寻址的反应的方法。本专利技术解决了这些需求,并且还提供了相关的优势。在一方面,本专利技术提供了如本文所述的基因文库。该基因文库包含基因的集合。在一些实施方案中,该集合包含至少100种不同的预选合成基因,所述预选合成基因可具有至少0.5kb的长度,并且相比于包含这些基因的预定序列具有小于1/3000bp的错误率。在另一方面,本专利技术还提供了包含基因的集合的基因文库。该集合可包含至少100种不同的预选合成基因,其每一种可具有至少0.5kb的长度。至少90%的预选合成基因相比于包含这些基因的预定序列可包含小于1/3000bp的错误率。所需的预定序列可通过任何方法提供,通常由用户,例如由用户使用计算机化的系统输入数据来提供。在不同的实施方案中,将合成的核酸与这些预定序列进行比较,在一些情况下通过对合成的核酸的至少一部分进行测序,例如使用下一代测序方法。在一些涉及本文所述的任何基因文库的实施方案中,至少90%的预选合成基因相比于包含这些基因的预定序列包含小于1/5000bp的错误率。在一些实施方案中,至少0.05%的预选合成基因无错误。在一些实施方案中,至少0.5%的预选合成基因无错误。在一些实施方案中,至少90%的预选合成基因相比于包含这些基因的预定序列包含小于1/3000bp的错误率。在一些实施方案中,至少90%的预选合成基因无错误或基本上无错误。在一些实施方案中,预选合成基因相比于包含这些基因的预定序列包含小于1/3000bp的缺失率。在一些实施方案中,预选合成基因相比于包含这些基因的预定序列包含小于1/3000bp的插入率。在一些实施方案中,预选合成基因相比于包含这些基因的预定序列包含小于1/3000bp的置换率。在一些实施方案中,如本文所述的基因文库进一步包含每一种合成基因的至少10个拷贝。在一些实施方案中,如本文所述的基因文库进一步包含每一种合成基因的至少100个拷贝。在一些实施方案中,如本文所述的基因文库进一步包含每一种合成基因的至少1000个拷贝。在一些实施方案中,如本文所述的基因文库进一步包含每一种合成基因的至少1000000个拷贝。在一些实施方案中,如本文所述的基因的集合包含至少500种基因。在一些实施方案中,所述集合包含至少5000种基因。在一些实施方案中,所述集合包含至少10000种基因。在一些实施方案中,预选合成基因为至少1kb。在一些实施方案中,预选合成基因为至少2kb。在一些实施方案中,预选合成基因为至少3kb。在一些实施方案中,预定序列相比于预选合成基因还包含小于20bp。在一些实施方案中,预定序列相比于预选合成基因还包含小于15bp。在一些实施方案中,合成基因中的至少一种与任何其他合成基因至少0.1%不同。在一些实施方案中,合成基因中的每一种与任何其他合成基因至少0.1%不同。在一些实施方案中,合成基因中的至少一种与任何其他合成基因至少10%不同。在一些实施方案中,合成基因中的每一种与任何其他合成基因至少10%不同。在一些实施方案中,合成基因中的至少一种与任何其他合成基因至少有2个碱基对不同。在一些实施方案中,合成基因中的每一种与任何其他合成基因至少有2个碱基对不同。在一些实施方案中,如本文所述的基因文库进一步包含小于2kb的合成基因,其相比于这些基因的预选序列有小于1/20000bp的错误率。在一些实施方案中,可传送基因的子集共价连接在一起。在一些实施方案中,基因的集合的第一子集编码具有一种或多种代谢终产物的第一代谢途径的组分。在一些实施方案中,如本文所述的基因文库进一步包含所述一种或多种代谢终产物的选择,从而构建基因的集合。在一些实施方案中,所述一种或多种代谢终产物包括生物燃料。在一些实施方案中,基因的集合的第二子集编码具有一种或多种代谢终产物的第二代谢途径的组分。在一些实施方案中,基因文库在小于100m3的空间中。在一些实施方案中,基因文库在小于1m3的空间中。在一些实施方案中,基因文库在小于1m3的空间中。在另一方面,本专利技术还提供了构建基因文库的方法。该方法包括以下步骤:在第一时间点之前在计算机可读非暂时性介质中输入至少第一基因列表和第二基因列表,其中所述基因为至少500bp并且当编译成联合列表(jointlist)时,该联合列表包含至少100种基因;在第二时间点之前合成所述联合列表中超过90%的基因,从而构建具有可传送(deliverable)基因的基因文库。在一些实施方案中,所述第二时间点与第一时间点相隔少于一个月。在实施如本文提供的构建基因文库的任何方法中,如本文所述的方法进一步包括在第二时间点传送至少一种基因。在一些实施方案中,所述基因中的至少一种与所述基因文库中的任何其他基因至少0.1%不同。在一些实施方案中,所述基因中的每一种与所述基因文库中的任何其他基因至少0.1%不同。在一些实施方案中,所述基因中的至少一种与所述基因文库中的任何其他基因至少10%不同。在一些实施方案中,所述基因中的每一种与所述基因文库中的任何其他基因至少10%不同。在一些实施方案中,所述基因中的至少一种与所述基因文库中的任何其他基因至少有2个碱基对不同。在一些实施方案中,所述基因中的每一种与所述基因文库中的任何其他基因至少有2个碱基对不同。在一些实施方案中,至少90%的可传送基因无错误。在一些实施方案中,所述可传送基因包含小于1/3000的错误率,这导致生成偏离联合基因列表中的基因序列的序列。在一些实施方案中,至少90%的可传送基因包含小于1/3000bp的错误率,这导致生成偏离联合基因列表中的基因序列的序列。在一些实施方案中,可传送基因的子集中的基因共价连接在一起。在一些实施方案中,...

【技术保护点】
一种基因文库,其包含基因的集合,其中所述集合包含至少50种不同的预选合成基因,这些预选合成基因各自具有至少0.5kb的长度,并且相比于包含这些基因的预定序列具有小于1/3000bp的错误率。

【技术特征摘要】
【国外来华专利技术】2013.08.05 US 61/862,445;2013.08.05 US 61/862,4571.一种基因文库,其包含基因的集合,其中所述集合包含至少50种不同的预选合成基
因,这些预选合成基因各自具有至少0.5kb的长度,并且相比于包含这些基因的预定序列具
有小于1/3000bp的错误率。
2.一种基因文库,其包含基因的集合,其中所述集合包含各自具有至少0.5kb长度的至
少50种不同的预选合成基因,其中至少90%的预选合成基因相比于包含这些基因的预定序
列包含小于1/3000bp的错误率。
3.根据权利要求1或2所述的基因文库,其中至少90%的预选合成基因相比于包含这些
基因的预定序列包含小于1/5000bp的错误率。
4.根据权利要求1或2所述的基因文库,其中至少0.05%的预选合成基因无错误。
5.根据权利要求1或2所述的基因文库,其中所述集合包含至少75种不同的预选合成基
因。
6.根据权利要求1或2所述的基因文库,其中所述集合包含至少100种不同的预选合成
基因。
7.根据权利要求1或2所述的基因文库,其中所述预选合成基因相比于包含这些基因的
预定序列包含小于1/3000bp的缺失率。
8.根据权利要求1或2所述的基因文库,其进一步包含每一种合成基因的至少1000000
个拷贝。
9.根据权利要求1或2所述的基因文库,其中所述集合包含至少500种基因。
10.根据权利要求1或2所述的基因文库,其中所述预选合成基因为至少1kb。
11.根据权利要求1或2所述的基因文库,其中所述合成基因中的每一种与任何其他合
成基因至少1%不同。
12.根据权利要求1或2所述的基因文库,其中所述基因文库在小于10cm3的空间中。
13.一种构建基因文库的方法,其包括:
(a)在第一时间点之前在计算机可读非暂时性介质中输入至少第一基因列表和第二基
因列表,其中所述基因为至少500bp并且其中当编译成联合列表时,该联合列表包含至少
100种基因;
(b)在第二时间点之前合成所述联合列表中超过90%的基因,从而构建具有可传送基
因的基因文库;
其中所述第二时间点与第一时间点相隔少于一个月。
14.根据权利要求13所述的方法,其进一步包括在第二时间点传送至少一种基因。
15.根据权利要求13所述的方法,其中所述基因中的每一种与所述基因文库中的任何
其他基因至少1%不同。
16.根据权利要求13所述的方法,其中至少90%的可传送基因包含小于1/3000bp的错
误率,这导致生成偏离联合基因列表中的基因序列的序列。
17.根据权利要求13所述的方法,其中所述联合列表包含至少500种基因。
18.根据权利要求13所述的方法,其中所述基因为至少1kb。
19.根据权利要求13所述的方法,其中所述第二时间点与第一时间点相隔少于5天。
20.根据权利要求13所述的方法,其中所述第二时间点与第一时间点相隔少于2天。
21.一种构建基因文库的方法,其包括:
(a)在第一时间点在计算机可读非暂时性介质中输入基因列表,其中所述列表包含至
少100种基因并且其中所述基因为至少500bp;
(b)合成所述基因列表中超过90%的基因,从而构建具有可传送基因的基因文库;以及
(c)在第二时间点传送所述可传送基因,其中所述第二时间点与第一时间点相隔少于
一个月。
22.一种在基底上合成n-聚体寡核苷酸的方法,其包括:
(a)提供具有解析座位的基底,该解析座位用适合于核苷酸偶联的化学部分功能化;以

(b)根据座位特异性预定序列,使至少两个结构单元与各自位于其中一个解析座位上
的多个生长寡核苷酸链以每小时至少10个核苷酸的速率偶联,从而合成n个碱基对长的多
个寡核苷酸。
23.根据权利要求22所述的方法,其进一步包括使至少两个结构单元与各自位于其中
一个解析座位上的多个生长寡核苷酸链以每小时至少12个核苷酸的速率偶联。
24.根据权利要求22所述的方法,其进一步包括使至少两个结构单元与各自位于其中
一个解析座位上的多个生长寡核苷酸链以每小时至少15个核苷酸的速率偶联。
25.根据权利要求22所述的方法,其中至少一个解析座位包含以小于1/500bp的错误率
偏离座位特异性预定序列的n-聚体寡核苷酸。
26.根据权利要求22所述的方法,其中所述基底上的多个寡核苷酸以小于1/500bp的错
误率偏离各自的座位特异性预定序列。
27.根据权利要求22所述的方法,其中所述结构单元包含腺嘌呤、鸟嘌呤、胸腺嘧啶、胞
嘧啶或尿苷基团或修饰的核苷酸。
28.根据权利要求22所述的方法,其中n为至少100。
29.根据权利要求22所述的方法,其中所述基底包含至少100个解析座位,并且其中所
述多个生长寡核苷酸中的至少两个彼此不同。
30.根据权利要求22所述的方法,其进一步包括在偶联之前真空干燥所述基底。
31.根据权利要求22所述的方法,其中所述结构单元包含封闭基团。
32.根据权利要求31所述的方法,其中所述封闭基团包含酸不稳定的DMT。
33.根据权利要求32所述的方法,其中所述酸不稳定的DMT包含4,4'-二甲氧基三苯甲
基。
34.根据权利要求29所述的方法,其中所述基底包含提供所述基底的第一表面与所述
基底的第二表面之间流体连通的至少1000个通孔。
35.根据权利要求29所述的方法,其中所述基底包含提供所述基底的第一表面与所述
基底的第二表面之间流体连通的至少10,000个通孔。
36.一种在具有功能化表面的基底上合成寡核苷酸的方法,其包括:
(a)通过至少一个喷墨泵向多个座位中的第一座位施加至少一滴第一试剂;
(b)向所述基底施加负压;以及
(c)通过至少一个喷墨泵向所述第一座位施加至少一滴第二试剂。
37.根据权利要求36所述的方法,其中所述基底周围的压力可降至小于1毫托。
38.一种构建基因文库的方法,其包括:
(a)在第一时间点在计算机可读非暂时性介质中输入基因列表,其中所述列表包含至
少100种基因并且其中所述基因为至少500bp;
(b)合成所述基因列表中超过90%的基因,从而构建具有可传送基因的基因文库;
(c)制备代表所述基因文库的测序文库;
(d)获得序列信息;
(e)基于所述序列信息选择所述可传送基因的至少一个子集;以及
(f)在第二时间点传送所选择的可传送基因,其中所述第二时间点与第一时间点相隔
少于一个月。
39.根据权利要求38所述的方法,其中所述第二时间点与第一时间点相隔少于5天。
40.根据权利要求38所述的方法,其中所述第二时间点与第一时间点相隔少于2天。
41.一种核酸扩增方法,其包括:
(a)提供包含n个环化单链核酸的样品,所述n个环化单链核酸各自包含不同的靶序列;
(b)提供可与所述n个环化单链核酸中的m个上的至少一个衔接子杂交序列杂交的第一
衔接子;
(c)提供适合于使用所述m个环化单链核酸作为模板延伸第一衔接子的条件,从而生成
m个单链扩增子核酸,其中所述m个单链扩增子核酸中的每一个均包含来自其模板的靶序列
的多个复制物;
(d)提供可与第一衔接子杂交的第一辅助寡核苷酸;以及
(e)在适合于第一作用物在多个切割位点处切割所述m个单链扩增子核酸的条件下提
供第一作用物,从而生成所述m个环化单链核酸中的靶序列的多个单链复制物。
42.根据权利要求41所述的方法,其中n或m至少为2。
43.根据权利要求41所述的方法,其中n或m至少为25。
44.根据权利要求41所述的方法,其中m小于n。
45.根据权利要求41所述的方法,其中包含所述n个环化单链核酸的样品通过以下步骤
形成:提供各自包含不同靶序列中的一个的至少n个线性单链核酸,并使所述n个线性单链
核酸环化,从而生成所述n个环化单链核酸。
46.根据权利要求45所述的方法,其中所述第一衔接子可与所述n个线性单链核酸的两
端同时杂交。
47.根据权利要求45所述的方法,其中所述n个线性单链核酸中的不同靶序列的侧翼为
第一和第二衔接子杂交序列。
48.根据权利要求45所述的方法,其中所述至少n个线性单链核酸通过从头寡核苷酸合
成而生成。
49.根据权利要求47所述的方法,其中所述n个线性单链核酸中的每一个中的第一衔接
子杂交序列相差不超过两个核苷酸碱基。
50.根据权利要求47所述的方法,其中所述第一或第二衔接子杂交序列为至少5个核苷
酸长。
51.根据权利要求47所述的方法,其中所述第一或第二衔接子杂交序列为至多75个核
苷酸长。
52.根据权利要求46所述的方法,其中当第一衔接子与所述线性单链核酸的两端同时
杂交时,所述n个线性单链核酸的末端与第一衔接子上的相邻碱基配对。
53.根据权利要求41所述的方法,其中所述多个切割位点的位置使得所述衔接子杂交
序列从m个环化单链核酸复制物的至少5%的剩余序列部分上断裂下来。
54.根据权利要求41所述的方法,其中除了至少一个衔接子杂交序列,所述m个环化单
链核酸复制物的至少5%的序列保持未切割。
55.根据权利要求41所述的方法,其中所述多个切割位点的位置在所述至少一个衔接
子杂交序列的外部。
56.根据权利要求41所述的方法,其中所述多个切割位点的位置不依赖于所述靶序列。
57.根据权利要求41所述的方法,其中所述多个切割位点的位置由第一衔接子或第一
辅助寡核苷酸的序列内的至少一个序列元件来决定。
58.根据权利要求57所述的方法,其中所述序列元件包含限制性内切核酸酶的识别位
点。
59.根据权利要求41所述的方法,其中所述第一辅助寡核苷酸或第一衔接子寡核苷酸
包含IIS型限制性内切核酸酶的识别位点。
60.根据权利要求41所述的方法,其中所述识别位点远离所述切割位点至少3个核苷
酸。
61.根据权利要求41所述的方法,其中所述多个切割位点在单链和双链核酸的连接处。
62.根据权利要求61所述的方法,其中所述双链核酸包含第一衔接子和第一辅助寡核
苷酸。
63.根据权利要求61所述的方法,其中所述单链核酸基本由m个不同的靶序列组成。
64.根据权利要求63所述的方法,其中所述m个不同的靶序列具有至多95%的逐对相似
性。
65.根据权利要求63所述的方法,其中所述m个不同的靶序列具有至多90%的逐对相似
性。
66.根据权利要求63所述的方法,其中所述m个不同的靶序列具有至多80%的逐对相似
性。
67.根据权利要求63所述的方法,其中所述m个不同的靶序列具有至多50%的逐对相似
性。
68.根据权利要求41所述的方法,其中生成m个单链扩增子核酸包括链置换扩增。
69.根据权利要求41所述的方法,其中所述第一辅助寡核苷酸包含亲和标记物。
70.根据权利要求69所述的方法,其中所述亲和标记物包括生物素或生物素衍生物。
71.根据权利要求41所述的方法,其进一步包括从所述样品中分离双链核酸。
72.根据权利要求71所述的方法,其中所述分离包括亲和纯化、层析或凝胶纯化。
73.根据权利要求41所述的方法,其中所述第一作用物包括限制性内切核酸酶。
74.根据权利要求73所述的方法,其中所述第一作用物包括至少两种限制性内切核酸
酶。
75.根据权利要求73或74所述的方法,其中所述第一作用物包括IIS型限制性内切核酸
酶。
76.根据权利要求41所述的方法,其中所述第一作用物包括切口内切核酸酶。
77.根据权利要求76所述的方法,其中所述第一作用物包括至少两种切口内切核酸酶。
78.根据权利要求41所述的方法,其中所述第一作用物包括至少一种选自下组的酶:
MlyI、SchI、AlwI、BccI、BceAI、BsmAI、BsmFI、FokI、HgaI、PleI、SfaNI、BfuAI、BsaI、BspMI、
BtgZI、EarI、BspQI、SapI、SgeI、BceFI、BslFI、BsoMAI、Bst71I、FaqI、AceIII、BbvII、BveI、
LguI、BfuCI、DpnII、FatI、MboI、MluCI、Sau3AI、Tsp509I、BssKI、PspGI、StyD4I、Tsp45I、
AoxI、BscFI、Bsp143I、BssMI、BseENII、BstMBI、Kzo9I、NedII、Sse9I、TasI、TspEI、AjnI、
BstSCI、EcoRII、MaeIII、NmuCI、Psp6I、MnlI、BspCNI、BsrI、BtsCI、HphI、HpyAV、MboII、
AcuI、BciVI、BmrI、BpmI、BpuEI、BseRI、BsgI、BsmI、BsrDI、BtsI、EciI、MmeI、NmeAIII、
Hin4II、TscAI、Bce83I、BmuI、BsbI、BscCI、NlaIII、Hpy99I、TspRI、FaeI、Hin1II、Hsp92II、
SetI、TaiI、TscI、TscAI、TseFI、Nb.BsrDI、Nb.BtsI、AspCNI、BscGI、BspNCI、EcoHI、FinI、
TsuI、UbaF11I、UnbI、Vpak11AI、BspGI、DrdII、Pfl1108I、UbaPI、Nt.AlwI、Nt.BsmAI、
Nt.BstNBI和Nt.BspQI。
79.根据权利要求74所述的方法,其中所述至少两种限制性内切核酸酶包括MlyI和
BciVI,或BfuCI和MlyI。
80.根据权利要求41所述的方法,其进一步包括:

【专利技术属性】
技术研发人员:威廉·巴尼亚伊比尔·詹姆士·佩克安德烈斯·费尔南德斯陈思远皮埃尔·尹德穆勒
申请(专利权)人:特韦斯特生物科学公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1