用于高通量测序的快速文库构建制造技术

技术编号:24105371 阅读:23 留言:0更新日期:2020-05-09 16:27
本发明专利技术描述了用于高通量多核苷酸测序应用例如下一代测序(NGS)应用的构建文库的快速方法,该方法能够在单个反应管中进行。寡核苷酸探针在其5'或3'末端或两者上包含化学活性基团,以在其与绽裂模板片段的单链末端杂交后促进其5'或3'末端或两者的切割。探针末端的切割露出了杂交片段末端的单链区域。将对这些末端具有特异性的接头与杂交的探针/模板片段连接,并将平末端片段与杂交探针/模板片段的平末端(如果存在的话)连接,以生成所述文库的接头连接片段。

Rapid library construction for high throughput sequencing

【技术实现步骤摘要】
【国外来华专利技术】用于高通量测序的快速文库构建
本专利技术的领域涉及用于高通量多核苷酸测序的测序文库的构建。
技术介绍
高通量筛选可以通过同时检测数百万个小尺寸范围(100-800bp)的DNA分子来快速确定DNA聚合物的核苷酸序列。短读长测序的局限性在于,即使通过最佳管道(pipeline),基因组DNA随机断裂成数百万个非常小的片段也会导致计算组装错误。重复区域和复杂的重排和复制,大规模插入或删除通常被错误地包含或缺少。最常用的高通量测序平台在时间和试剂方面都是资源密集型的,而这限制了现有测序方法的能力,例如用于从头进行基因组组装的下一代测序(NGS)方法以及校正在大的基因组尺寸的生物中尤为普遍的重排、复制或插入的基因组分配。但是,通过开发将构建测序文库的多个步骤整合到单个反应管中的方法,可以显著改善与高通量测序方法相关的时间和试剂成本。本文描述了这种改进。
技术实现思路
本专利技术涉及用于高通量核苷酸测序方法例如下一代测序(NGS)应用的文库的构建。根据本专利技术的方法构建的文库含有寡核苷酸探针杂交的模板序列片段的测序接头连接的双链体。本专利技术的探针可在其5'或3'末端或两者上包含化学活性基团,以在其杂交后促进其5'或3'末端或两者的切割,从而显示杂交片段末端的单链区域。将对这些末端具有特异性的接头和杂交的探针/模板片段连接,并将平末端片段与杂交的探针/模板片段的平末端(如果存在的话)连接,以生成文库的接头连接的片段。本专利技术用于产生测序文库的方法可以在单个反应管中以相对较少的步骤进行,并且并入到用于制备测序文库的试剂盒中是理想的。附图说明图1显示了用于NGS的文库的构建原理图。纯化的DNA在小于12分钟的时间内被破碎,并直接用于文库构建。文库构建遵循独特的方法来生成DNA末端,该DNA末端源自用于接头连接的初始DNA模板。文库构建花了不到13分钟,并且可以直接用于PCR反应。文库构建不需要纯化步骤,尽管可能需要使用最后的磁珠纯化步骤来清理PCR步骤之后文库产物的制备或尺寸选择。在单管中执行简单的三步路线。图2A显示了在37℃下DNA破碎时间的优化。将50ng高分子量纯化的大肠杆菌DNA用于酶促反应,孵育时间:5分钟(泳道B);5.5分钟(泳道C);6分钟(泳道D);6.5分钟(泳道E)。破碎产物在2%TBE琼脂糖凝胶上以100bp的阶梯进行电泳(泳道A)。图2B显示了在37℃下DNA破碎时间的优化。将50ng高分子量纯化的大肠杆菌DNA用于酶促反应,孵育时间:6.5分钟(泳道B);6.75分钟(泳道C);7分钟(泳道D);7.25分钟(泳道E)。破碎产物在2%TBE琼脂糖凝胶上以100bp的阶梯进行电泳(泳道A)。图2C显示了在42℃下3分钟和4分钟的DNA破碎时间的优化。将50ng高分子量纯化的大肠杆菌DNA用于酶促反应,孵育时间:在0.1mMEDTA中3分钟(泳道B和C)或4分钟(泳道G和H);在1mMEDTA中3分钟(泳道D和E)或4分钟(泳道I和J)。破碎产物在2%TBE琼脂糖凝胶上以100bp的阶梯进行电泳(泳道A、F和K)。图2D显示在42℃下5分钟的DNA破碎时间优化。将50ng高分子量纯化的大肠杆菌DNA用于酶促反应,孵育时间5分钟,DNA储存在0.1mMEDTA(泳道B和C)或1mMEDTA(泳道D和E)中。破碎产物在2%TBE琼脂糖凝胶上以100bp的阶梯进行电泳(泳道A和F)。图2E显示了在37℃下2-5分40秒内对大的DNA插入进行DNA破碎时间的优化。50ng高分子量纯化的人类女性DNA用于随机酶促破碎。破碎产物在2%TBE琼脂糖凝胶上以100bp的阶梯进行电泳(泳道L)。泳道A:孵育2分钟;泳道B:3分钟;泳道C:4分钟;泳道D:5分40秒。图2F显示了在37℃孵育5分40秒,随后65℃孵育5分钟下不同酶输入对1ng人类女性DNA破碎的优化。破碎产物在2%TBE琼脂糖凝胶上电泳,并用SYBRGoldTM染色。泳道L:100bp的阶梯;泳道A:0.2μl酶;泳道B:0.3μl;泳道C:0.4μl;泳道D:0.5μl。图2G显示了图2F的倒影图,泳道L:100bp的阶梯;泳道A:0.2μl酶;泳道B:0.3μl;泳道C:0.4μl;泳道D:0.5μl。图2H显示了按照制造商的推荐使用超声破碎的DNA。第1行:百日咳博德特氏菌(B.pertussis);第2行:大肠杆菌;第3行:艰难梭状芽孢杆菌(C.difficile)。图3A显示了在2%TBE琼脂糖凝胶上以100bp的阶梯在不同探针杂交温度下产生的文库构建产物(泳道L)。使用50ng高分子量纯化的人类女性DNA进行反应,并在37℃下酶促5分40秒。在热循环仪中进行探针杂交1分40秒。泳道A:4℃的探针孵育温度;泳道B:22℃;泳道C:40℃;泳道D:55℃;泳道E:64℃;泳道F:71℃;泳道G:80.4℃;和泳道H:95℃。使用0.85XAmpureTMXP磁珠对最终文库进行尺寸选择。图3B是图3A中产物的文库构建产率的图,由QubitTM荧光计测定,在低温和高温下,文库产率下降,而探针杂交的最佳范围在40-70℃之间。图4A显示了使用依次进行的T4DNA聚合酶和UDG/T4DNA连接酶反应产生的文库构建产物。使用50ng高分子量纯化的大肠杆菌DNA进行反应,并在37℃下酶促破碎5分40秒。最终的文库产物以100bp的阶梯在2%TBE琼脂糖凝胶上电泳(泳道A和D)。泳道B:文库未经尺寸选择。泳道C:文库经尺寸选择。图4B显示了使用同时进行的T4DNA聚合酶和UDG/T4DNA连接酶反应产生的文库构建产物。使用50ng(泳道B)或25ng(泳道C)的高分子量纯化大肠杆菌进行反应,并在37℃下酶促破碎5分40秒。最终的文库产物(泳道B和C)未经尺寸选择,并以100bp的阶梯在2%TBE琼脂糖凝胶上电泳(泳道A)。图5显示了由50ng源自百日咳博德特氏菌、大肠杆菌和艰难梭状芽孢杆菌的纯化高分子量DNA产生的池化细菌文库的痕量分析。x轴表示碱基对的长度,y轴表示荧光单位(FU)。生成文库以产生更大的文库插入大小,这由300-1500bp的生物分析仪片段长度分布范围说明。图6显示了使用快速运行的HiSeqTM2500在100bp和150bp配对末端测序中的百日咳博德特氏菌、大肠杆菌和艰难梭状芽孢杆菌测序文库的Phred平均质量分数的合成图。使用MuiltiQC得到Phred平均质量分数。深灰色实线是第一个配对末端的读长,浅实线是第二个配对末端的读长。浅灰色虚线表示Phred分数为30,黑色实线表示Phred分数为20。大部分第一对末端读长的平均分数都高于30。第二对末端读长的平均值高于30,并且随测序长度降低到20以上。该图还说明了文库的测序复杂性很高,因此不会导致低的Phred分数。图7A显示了使用由百日咳博德特氏菌、大肠杆菌和艰难梭状芽孢杆菌的基因组产生的文库进行每次测序运行时的比对读长(mappedreads)的百分比。发现超过99本文档来自技高网...

【技术保护点】
1.制备高通量测序文库的方法,其包含以下步骤:/nA.从多个多核苷酸中产生双链片段;/nB.使片段的末端绽裂以暴露单链区域;/nC.使寡核苷酸探针与单链区域杂交以形成双链双链体,其中探针包含可切割的:/n(1)5'化学活性基团;/n(2)3'化学活性基团;或/n(3)5'和3'化学活性基团;以及/n其中所述探针的长度至少等于绽裂片段的暴露的单链区域;/nD.使所述双链双链体与至少一种切割剂接触以切割化学活性基团,以在双链双链体中产生单链3'悬突、单链5'悬突,或单链3'和5悬突;以及/nE.将至少两组双链DNA接头连接至所述双链双链体,其中/n(1)第一组接头中的接头包括以下中的至少一种:/ni.与双链双链体的3'单链悬突的悬突末端互补的3'悬突,如果存在的话;或者/nii.与双链双链体的5'单链悬突的悬突末端互补的5'悬突,如果存在的话,/n和/n(2)第二组接头中的接头包括以下中的至少一种:/ni.与双链双链体的3'单链悬突的悬突末端互补的3'悬突,如果存在的话;/nii.与双链双链体的5'单链悬突的悬突末端互补的5'悬突,如果存在的话,或者/niii.连接到双链双链体的平末端的平末端,如果存在的话。/n...

【技术特征摘要】
【国外来华专利技术】20170717 US 62/533,4831.制备高通量测序文库的方法,其包含以下步骤:
A.从多个多核苷酸中产生双链片段;
B.使片段的末端绽裂以暴露单链区域;
C.使寡核苷酸探针与单链区域杂交以形成双链双链体,其中探针包含可切割的:
(1)5'化学活性基团;
(2)3'化学活性基团;或
(3)5'和3'化学活性基团;以及
其中所述探针的长度至少等于绽裂片段的暴露的单链区域;
D.使所述双链双链体与至少一种切割剂接触以切割化学活性基团,以在双链双链体中产生单链3'悬突、单链5'悬突,或单链3'和5悬突;以及
E.将至少两组双链DNA接头连接至所述双链双链体,其中
(1)第一组接头中的接头包括以下中的至少一种:
i.与双链双链体的3'单链悬突的悬突末端互补的3'悬突,如果存在的话;或者
ii.与双链双链体的5'单链悬突的悬突末端互补的5'悬突,如果存在的话,

(2)第二组接头中的接头包括以下中的至少一种:
i.与双链双链体的3'单链悬突的悬突末端互补的3'悬突,如果存在的话;
ii.与双链双链体的5'单链悬突的悬突末端互补的5'悬突,如果存在的话,或者
iii.连接到双链双链体的平末端的平末端,如果存在的话。


2.根据权利要求1所述的制备高通量测序文库的方法,其中:所述探针包含5'化学活性基团;
所述至少一种切割剂切割5'化学活性基团;
所述第一组接头中的接头包含与双链双链体的3'单链悬突的悬突末端互补的3'悬突;
所述第二组接头包含连接至双链双链体的平末端的平末端。


3.根据权利要求1所述的制备高通量测序文库的方法,其中:所述探针包含3'化学活性基团;
所述至少一种切割剂切割3'化学活性基团;
所述第一组接头中的接头包含与双链双链体的所述5'单链悬突的悬突末端互补的5'悬突;
所述第二组接头包含连接至双链双链体的平末端的平末端。


4.根据权利要求1所述的制备高通量测序文库的方法,其中:所述探针包含3'和5'化学活性基团;
至少一种切割剂切割3'化学活性基团,并且至少一种切割剂切割5'化学活性基团;
所述第一组接头中的接头包含与双链双链体的5'单链悬突的悬突末端互补的5'悬突;
所述第二组接头包含与双链双链体的3'单链悬突的悬突末端互补的3'悬突。


5.根据权利要求1所述的方法,其中双链多核苷酸片段是随机产生的。


6.根据权利要求5所述的方法,其中双链多核苷酸片段是酶促产生的。


7.根据权利要求5所述的方法,其中双链多核苷酸片段是通过超声破碎产生的。


8.根据权利要求5所述的方法,其中双链多核苷酸片段的长度为50-1000个碱基对(bp)。


9.根据权利要求8所述的方法,其中双链多核苷酸片段的长度为1...

【专利技术属性】
技术研发人员:J·邓纳姆
申请(专利权)人:希昆斯生物科学公司
类型:发明
国别省市:美国;US

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1