转座酶竞争物控制系统技术方案

技术编号:20595358 阅读:64 留言:0更新日期:2019-03-16 11:04
公开了一种片段化DNA的方法,包括使靶DNA样品在适合转座体活性的条件下与以下接触:(a)包含活性转座体的组合物,以及(b)包含非活性转座体的组合物,其中(b)组合物中非活性转座体的量与(a)组合物中活性转座体的量的比率决定了平均片段尺寸和插入偏倚水平。

Transposable Enzyme Competitor Control System

A method for fragmenting DNA is disclosed, including making target DNA samples in contact with the following conditions suitable for transposon activity: (a) compositions containing active transposons and (b) compositions containing inactive transposons, in which (b) the ratio of inactive transposons in compositions to the amount of active transposons in compositions determines the average fragment size and insertion bias level.

【技术实现步骤摘要】
【国外来华专利技术】转座酶竞争物控制系统
本公开涉及分子生物学领域;并且,更具体地使用转座酶作为片段化DNA的分子工具。相关申请本申请要求2016年4月19日提交的美国临时申请号62/324,683的优先权和权益,其内容通过引用整体并入本文。通过引用并入序列表在2017年4月18日创建并且大小为80KB的文本文件名为“RMSI-007-001WO_ST25”的内容通过引用整体并入本文。
技术介绍
基于转座酶的DNA测序文库的产生面临许多挑战,这些挑战在本公开之前尚未解决。技术挑战涉及克服这样的事实:单个转座体仅能够进行单次插入切割事件,并且该复合物随后不会被释放以插入和切割其他地方。因此,现有技术难以控制插入尺寸。该方法对DNA输入量敏感并且存在显着的插入位点偏倚。这种偏倚是由以下事实引起的:尽管转座体可以插入不同的位点,但它对多种DNA序列显示出多种偏好,达到可以确定共有的优选序列的程度。因此,插入模式是半随机的,并且转座体能够被认为是序列特异性的DNA结合复合物,尽管其具有高度不完全的序列识别。
技术实现思路
本公开提供了基于转座体的文库制备系统,其克服了本领域长期以来未满足的对于片段化DNA方法的需要,片段化DNA方法与现有方法相比保持了所需的平均片段尺寸,同时降低了插入偏倚。而且,无论使用多少量的DNA,本公开的方法都同样有效。本公开的方法涉及表达转座酶(Tnp),并用转座酶结合末端序列(ES)DNA(也称为“臂”)激活(也称为“负载”)以产生转座体。ES序列通常但不一定是“嵌合”序列,因为它不是天然ES,而是每个插入序列(IS)存在的两个天然ES(内部和外部)的组合。臂可以携带序列特异性序列或衔接子。将转座体和靶DNA接触导致“标签片段化”,该术语旨在描述同时的DNA片段化和测序衔接子插入。本公开的方法包括使“活性”和“非活性”转座体的混合物与靶DNA接触。非活性转座体能够与DNA结合,但不能切割任何DNA链。具体地,本公开提供了片段化DNA的方法,包括使靶DNA样品在适合转座体活性的条件下与以下接触:(a)包含活性转座体的组合物,以及(b)包含非活性转座体的组合物;其中(b)组合物中的非活性转座体的量与(a)组合物中的活性转座体的量的比率决定了平均片段尺寸和插入偏倚水平。在本公开方法的某些实施方式中,(a)组合物中的活性转座体和(b)组合物中的非活性转座体的组合占据大于50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%的输入DNA的转座体结合位点。在本公开方法的某些实施方式中,(a)组合物中的活性转座体和(b)组合物中的非活性转座体的组合占据100%的输入DNA的转座体结合位点。在本公开方法的某些实施方式中,非活性转座体和活性转座体优先结合靶DNA内的共有序列。在某些实施方式中,非活性转座体和活性转座体以完全互补性结合共有序列。在某些实施方式中,非活性转座体和活性转座体以不完全互补性结合共有序列。本公开的靶DNA内的示例性共有序列可包含富含A/T和/或富含C/G的序列。在某些实施方式中,本公开的靶DNA内的共有序列可包含富含A/T的序列,其在每个末端侧接G/C对。本公开的靶DNA内的示例性共有序列可包含至少2、3、4、5、6、7、8、9或10个连续相同核苷酸的序列。本公开的靶DNA内的示例性共有序列可包含至少2、3、4、5、6、7、8、9或10个非连续相同核苷酸的序列。在本公开方法的某些实施方式中,非活性转座体和/或活性转座体可以与靶DNA内的非优选的、半随机的或随机的序列结合,例如,当全部或大部分优选结合位点被占用时。当本专利技术的非活性转座体和/或活性转座体与靶DNA内的非优选的、半随机的或随机的序列结合时,靶DNA内的非优选的、半随机的或随机的序列可能不具有任何序列相似性或同一性。在本公开方法的某些实施方式中,输入DNA的量或靶DNA的量是未知的。靶DNA的数量可能无关紧要的,因为即使(a)组合物中活性转座体和(b)组合物中非活性转座体的组合占据小于100%的输入DNA或目标DNA的转座体结合位点,该方法也将是有效的。在本公开方法的某些实施方式中,非活性转座体是活性转座体的修饰形式。该修饰可以抑制非活性转座体切割靶DNA的能力并保留非活性转座体结合靶DNA的能力。在本公开方法的某些实施方式中,非活性转座体可以包含编码非活性转座体的转座酶的氨基酸序列中的突变。示例性突变可以发生在非活性转座体的转座酶的催化结构域内的位置。例如,非活性转座酶可以是野生型或过度活跃的Tn5衍生的转座酶,并且突变可以发生在选自D97、D188和E326的催化三联体内的位置(参见Davies等人(2000)Science289:77–85)。替代地,非活性转座酶可能涉及野生型或过度活跃的Tn5衍生的转座酶(例如Tn5转座酶的序列或剪接变体,或者具有但源自另外物种或类型的转座子或插入元件的保守序列的转座酶,或者衍生自插入序列IS4家族的任何成员的转座酶)并且突变可以发生在催化三联体内的位置,催化三联体是选自由D97、D188和E326组成的组的三联体的功能等同物。在某些实施方式中,过度活跃的Tn5转座酶可以由包含以下(催化三联体加粗并下划线)的氨基酸序列编码:在本公开方法的某些实施方式中,非活性转座体是活性转座体的修饰形式。该修饰可以抑制非活性转座体切割靶DNA的能力并保留非活性转座体结合靶DNA的能力。在本公开方法的某些实施方式中,非活性转座酶可以包含编码非活性转座体的转座酶的氨基酸序列中的突变。示例性突变可以发生在非活性转座体的转座酶的催化结构域内的位置。例如,非活性转座酶可以是与Tn5-Tnp不同的酶,诸如源自潮汐异希瓦氏菌(Alishewanellaaestuarii)(TnAa-Tnp)的转座酶,并且突变可以发生在选自由D90、D190和E323组成组的催化三联体内的位置。在某些实施方式中,TnAa转座酶可以由包含以下(催化三联体加粗并下划线)的氨基酸序列编码:过度活跃Tn5衍生的转座酶和TnAa衍生的转座酶的比对揭示了催化三联体的残基在转座酶之间是高度保守的。类似的比对可用于鉴定其他转座酶中功能等同的催化三联体。TnAa衍生的转座酶和过度活跃Tn5衍生的转座酶(催化三联体加粗并下划线)的比对如下:比对的氨基酸残基下方的符号表示该位置的保守程度。星号,“*”表示具有单个完全保守残基的位置。“:”(冒号)表示具有强烈相似性质的基团之间的保守性——在GonnetPAM250矩阵中评分>0.5。“。”(句号)表示弱相似性质的基团之间的保守性——在GonnetPAM250矩阵中评分=<0.5。短划线“-”表示对齐间距。以下为TnAa(SEQIDNO:3)和HyperTn(SEQIDNO:4)的比对。本公开的非活性转座体可以是本公开的活性转座体的修饰形式。该修饰可以抑制非活性转座体切割靶DNA的能力并保留非活性转座体结合靶DNA的能力。本公开的非活性转座体可包含修饰的DNA臂。在某些实施方式中,修饰的DNA臂可以是嵌合DNA臂。本公开的示例性修饰的DNA臂包括但不限于以下中的一种或多种:臂转移链末端核苷酸上的3'-磷酸代替3'-OH,臂转移链末端核苷酸处的双脱氧核苷酸,空间抑制链本文档来自技高网...

【技术保护点】
1.一种片段化DNA的方法,包括使靶DNA样品在适合于转座体活性的条件下与以下接触:(a)包含活性转座体的组合物,以及(b)包含非活性转座体的组合物,其中,所述(b)组合物中所述非活性转座体的量与所述(a)组合物中所述活性转座体量的比率决定了平均片段尺寸和插入偏倚水平。

【技术特征摘要】
【国外来华专利技术】2016.04.19 US 62/324,6831.一种片段化DNA的方法,包括使靶DNA样品在适合于转座体活性的条件下与以下接触:(a)包含活性转座体的组合物,以及(b)包含非活性转座体的组合物,其中,所述(b)组合物中所述非活性转座体的量与所述(a)组合物中所述活性转座体量的比率决定了平均片段尺寸和插入偏倚水平。2.根据权利要求1所述的方法,其中,所述(a)组合物中所述活性转座体和所述(b)组合物中所述非活性转座体的组合占据大于50%的输入DNA的转座体复合物结合位点。3.根据权利要求1所述的方法,其中,所述(a)组合物中所述活性转座体和所述(b)组合物中所述非活性转座体的组合占据大于75%的输入DNA的转座体复合物结合位点。4.根据权利要求1所述的方法,其中,所述(a)组合物中所述活性转座体和所述(b)组合物中所述非活性转座体的组合占据大于90%的输入DNA的转座体复合物结合位点。5.根据权利要求1所述的方法,其中,所述(a)组合物中所述活性转座体和所述(b)组合物中所述非活性转座体的组合占据大于99%的输入DNA的转座体复合物结合位点。6.根据权利要求1-5中任一项所述的方法,其中,所述输入或靶DNA的量是未知的。7.根据权利要求1-6中任一项所述的方法,其中,所述非活性转座体和所述活性转座体优先结合所述靶DNA内的共有序列。8.根据权利要求7所述的方法,其中,所述非活性转座体和所述活性转座体以完全互补性结合所述共有序列。9.根据权利要求7所述的方法,其中,所述非活性转座体和所述活性转座体以不完全互补性结合所述共有序列。10.根据权利要求1-9中任一项所述的方法,其中,所述非活性转座体是所述活性转座体的修饰形式。11.根据权利要求10所述的方法,其中,所述修饰抑制所述非活性转座体切割所述靶DNA的能力并保持所述非活性转座体结合所述靶DNA的能力。12.根据权利要求11所述的方法,其中,所述非活性转座体包含编码非活性转座酶的氨基酸序列中的突变。13.根据权利要求12所述的方法,其中,所述突变发生在所述非活性转座酶的催化结构域内的位置。14.根据权利要求12所述的方法,其中,所述非活性转座酶是Tn5转座酶的过度活跃形式,并且所述突变发生在催化三联体内的位置,所述催化三联体选自由D97、D188和E326组成的组。15.根据权利要求14所述的方法,其中,所述突变发生在催化三联体内的位置,所述催化三联体是选自由D97、D188和E326组成的组的三联体的功能等同物。16.根据权利要求14或15所述的方法,其中,Tn5的过度活跃转座酶由氨基酸序列编码,所述氨基酸序列包括:MITSALHRAADWAKSVFSSAALGDPRRTARLVNVAAQLAKYSGKSITISSEGSKAAQEGAYRFIRNPNVSAEAIRKAGAMQTVKLAQEFPELLAIEDTTSLSYRHQVAEELGKLGSIQDKSRGWWVHSVLLLEATTFRTVGLLHQEWWMRPDDPADADEKESGKWLAAAATSRLRMGSMMSNVIAVCDREADIHAYLQDKLAHNERFVVRSKHPRKDVESGLYLYDHLKNQPELGGYQISIPQKGVVDKRGKRKNRPARKASLSLRSGRITLKQGNITLNAVLAEEINPPKGETPLKWLLLTSEPVESLAQALRVIDIYTHRWRIEEFHKAWKTGAGAERQRMEEPDNLERMVSILSFVAVRLLQLRESFTPPQALRAQGLLKEAEHVESQSAETVLTPDECQLLGYLDKGKRKRKEKAGSLQWAYMAIARLGGFMDSKRTGIASWGALWEGWEALQSKLDGFLAAKDLMAQGIKI(SEQIDNO:15)。17.根据权利要求12所述的方法,其中,所述非活性转座酶源自转座酶TnAa,并且所述突...

【专利技术属性】
技术研发人员:马丁·冉妮科威廉·布尔恩埃里克·范德沃特J·谢阿布雷·德比尔格里达·尤伊斯保罗·麦克尤恩
申请(专利权)人:卡帕生物系统公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1