转座酶组合物、制备方法和筛选方法技术

技术编号:24018482 阅读:45 留言:0更新日期:2020-05-02 04:20
本公开内容提供了用于高通量筛选多个转座酶以鉴别影响转座酶的期望特征的罕见突变的组合物和方法。提供了促进本公开内容的高通量筛选方法的本公开内容的组合物。

Transposase composition, preparation method and screening method

【技术实现步骤摘要】
【国外来华专利技术】转座酶组合物、制备方法和筛选方法相关申请的交叉引用本申请要求2017年8月30日提交的临时申请USSN62/552,214的权益,其内容通过引用整体并入本文。序列表的并入命名为“RMSI-010_001WOSeqListing_ST25.txt”的文本文件(其创建于2018年8月28日且大小为60.4KB)的内容特此通过引用以其整体并入。
本公开内容涉及分子生物学的领域;且更具体地涉及能够实现突变的和诱变处理的转座酶的快速且有效高通量筛选的分子工具。背景在本领域中存在长期感觉到但是未得到满足的对分子工具的需要,所述分子工具能够实现突变的和诱变处理的转座酶的快速且有效高通量筛选以鉴别为转座酶作为分子工具的应用带来期望特征的罕见突变。本公开内容提供了系统和方法来解决这些长期感觉到但是未得到满足的需要。
技术实现思路
本公开内容提供了筛选多个转座酶的方法,所述方法包括:(a)在足以诱导包含第一末端序列的第一寡核苷酸的转座的条件下使第一转座酶与第一核酸样品接触,由此产生具有所述第一末端序列的第一多个插入位点的第一转座的核酸样品;(b)在足以诱导包含第二末端序列的第二寡核苷酸的转座的条件下使第二转座酶与第二核酸样品接触,由此产生具有第二多个插入位点的第二转座的核酸样品,第二转座酶具有与第一转座酶相差至少一个氨基酸的氨基酸序列;(c)对第一转座的核酸样品的第一多个插入位点的至少一部分测序,由此产生第一组测序读出,所述第一组测序读出中的每一个包含所述第一末端序列的插入位点之一;(d)对所述第二转座的核酸样品的第二多个插入位点的至少一部分测序,由此产生第二组测序读出,所述第二组测序读出中的每一个包含所述第二末端序列的插入位点之一;(e)将所述第一组测序读出与所述第二组测序读出对比;和(f)基于对比的步骤(e),指定所述第二转座酶显著不同于所述第一转座酶的概率。在本公开内容的筛选多个转座酶的方法的某些实施方案中,对比的步骤(e)包括:为所述第一组测序读出计算在每个核苷酸位置处的每种可能核苷酸碱基的频率,由此产生第一组频率值;为所述第二组测序读出计算在每个核苷酸位置处的每种可能核苷酸碱基的频率,由此产生第二组频率值;为在每个核苷酸位置处的每种可能核苷酸碱基计算所述第一组频率值和所述第二组频率值之间的绝对差异,由此产生绝对差异值的组;和将所述绝对差异值中的每一个平均化,由此确定基序间距离。在本公开内容的筛选多个转座酶的方法的某些实施方案中,对比的步骤(e)包括:为所述第一组测序读出测量或确定在每个核苷酸位置处的每种可能核苷酸碱基的频率,由此产生第一组频率值;为所述第二组测序读出测量或确定在每个核苷酸位置处的每种可能核苷酸碱基的频率,由此产生第二组频率值;为在每个核苷酸位置处的每种可能核苷酸碱基测量或确定所述第一组频率值和所述第二组频率值之间的绝对差异,由此产生绝对差异值的组;和将所述绝对差异值中的每一个平均化,由此确定基序间距离。在本公开内容的筛选多个转座酶的方法的某些实施方案中,指定的步骤(f)包括:产生由模拟的随机序列读出定义的基序间距离概率图;和基于在步骤(e)中确定的基序间距离中的每一个和所述基序间距离概率图,指定所述第二转座酶显著不同于所述第一转座酶的概率值。在本公开内容的筛选多个转座酶的方法的某些实施方案中,对比的步骤(e)包括:在与第一转座的核酸样品中的第一多个插入位点对应的位置处,计算在第一参照核酸样品内的确定长度的区段处的覆盖的第一测序深度;在与第二转座的核酸样品中的第二多个插入位点对应的位置处,计算在第一参照核酸样品内的确定长度的区段处的覆盖的第二测序深度;和将所述覆盖的第一测序深度与所述覆盖的第二测序深度对比。在本公开内容的筛选多个转座酶的方法的某些实施方案中,对比的步骤(e)包括:在与第一转座的核酸样品中的第一多个插入位点对应的位置处,测量或确定在第一参照核酸样品内的确定长度的区段处的覆盖的第一测序深度;在与第二转座的核酸样品中的第二多个插入位点对应的位置处,测量或确定在第一参照核酸样品内的确定长度的区段处的覆盖的第二测序深度;和将所述覆盖的第一测序深度与所述覆盖的第二测序深度对比。在本公开内容的筛选多个转座酶的方法的某些实施方案中,指定的步骤(f)包括:执行Mann-Whitney检验(关于平均值差异)、Kolmogorov-Smirnoff检验(关于不同的分布形状)、参数检验、非参数检验、形状差异的目检和基于百分位数的度量计算中的至少一种。在本公开内容的筛选多个转座酶的方法的某些实施方案中,对比的步骤(e)包括:在与第一转座的核酸样品中的第一多个插入位点对应的位置处,计算在第一参照核酸样品中的确定长度的核酸区段的第一GC含量分数;在与第二转座的核酸样品中的第二插入位点对应的位置处,计算在第一参照核酸样品中的确定长度的核酸区段的第二GC含量分数;和鉴别所述第一GC含量分数和所述第二GC含量分数之间的差异。在本公开内容的筛选多个转座酶的方法的某些实施方案中,对比的步骤(e)包括:在与第一转座的核酸样品中的第一多个插入位点对应的位置处,测量或确定在第一参照核酸样品中的确定长度的核酸区段的第一GC含量分数;在与第二转座的核酸样品中的第二插入位点对应的位置处,测量或确定在第一参照核酸样品中的确定长度的核酸区段的第二GC含量分数;和鉴别所述第一GC含量分数和所述第二GC含量分数之间的差异。在本公开内容的筛选多个转座酶的方法的某些实施方案中,指定的步骤(f)包括:执行Mann-Whitney检验(关于平均值差异)、Kolmogorov-Smirnoff检验(关于不同的分布形状)、参数检验、非参数检验、形状差异的目检和基于百分位数的度量计算中的至少一种。本公开内容提供了一种包含核酸和编码转座酶的独特核酸序列的组合物,所述核酸从5'至3'包含:(a)第一转座子末端序列,(b)唯一标识符(UID)条形码,和(c)第二转座子末端序列,其中所述核酸能够转座。在某些实施方案中,所述核酸从5'至3'进一步包含位于所述唯一标识符(UID)条形码和所述第二转座子末端序列之间的选择标记。在某些实施方案中,所述UID条形码与所述编码转座酶的独特核酸序列有关。在本公开内容的组合物的某些实施方案中,包含元件(a)至(c)的核酸不包含所述编码转座酶的独特核酸序列。在某些实施方案中,第一载体包含含有元件(a)至(c)的核酸,且第二载体包含所述编码转座酶的独特核酸序列。在本公开内容的组合物的某些实施方案中,包含元件(a)至(c)的核酸进一步包含所述编码转座酶的独特核酸序列。在某些实施方案中,所述编码转座酶的独特核酸序列位于所述第一转座子末端序列的5'。在某些实施方案中,载体包含含有元件(a)至(c)的核酸和所述编码转座酶的独特核酸序列。在本公开内容的组合物的某些实施方案中,所述UID条形码包含5-200个碱基对,包括端点。在某些实施方案中,所述UID条形码包含10-100个碱基对,包括端点。在某些实施方案中,所述UID条形码包含10-50本文档来自技高网...

【技术保护点】
1.一种筛选多个转座酶的方法,所述方法包括:/n(a) 在足以诱导包含第一末端序列的第一寡核苷酸的转座的条件下使第一转座酶与第一核酸样品接触,由此产生具有所述第一末端序列的第一多个插入位点的第一转座的核酸样品;/n(b) 在足以诱导包含第二末端序列的第二寡核苷酸的转座的条件下使第二转座酶与第二核酸样品接触,由此产生具有第二多个插入位点的第二转座的核酸样品,所述第二转座酶具有与第一转座酶相差至少一个氨基酸的氨基酸序列;/n(c) 对所述第一转座的核酸样品的第一多个插入位点的至少一部分测序,由此产生第一组测序读出,所述第一组测序读出中的每一个包含所述第一末端序列的插入位点之一;/n(d) 对所述第二转座的核酸样品的第二多个插入位点的至少一部分测序,由此产生第二组测序读出,所述第二组测序读出中的每一个包含所述第二末端序列的插入位点之一;/n(e) 将所述第一组测序读出与所述第二组测序读出对比;和/n(f) 基于对比的步骤(e),指定所述第二转座酶显著不同于所述第一转座酶的概率。/n

【技术特征摘要】
【国外来华专利技术】20170830 US 62/5522141.一种筛选多个转座酶的方法,所述方法包括:
(a)在足以诱导包含第一末端序列的第一寡核苷酸的转座的条件下使第一转座酶与第一核酸样品接触,由此产生具有所述第一末端序列的第一多个插入位点的第一转座的核酸样品;
(b)在足以诱导包含第二末端序列的第二寡核苷酸的转座的条件下使第二转座酶与第二核酸样品接触,由此产生具有第二多个插入位点的第二转座的核酸样品,所述第二转座酶具有与第一转座酶相差至少一个氨基酸的氨基酸序列;
(c)对所述第一转座的核酸样品的第一多个插入位点的至少一部分测序,由此产生第一组测序读出,所述第一组测序读出中的每一个包含所述第一末端序列的插入位点之一;
(d)对所述第二转座的核酸样品的第二多个插入位点的至少一部分测序,由此产生第二组测序读出,所述第二组测序读出中的每一个包含所述第二末端序列的插入位点之一;
(e)将所述第一组测序读出与所述第二组测序读出对比;和
(f)基于对比的步骤(e),指定所述第二转座酶显著不同于所述第一转座酶的概率。


2.根据权利要求1所述的方法,其中所述对比的步骤(e)包括:
为所述第一组测序读出计算在每个核苷酸位置处的每种可能核苷酸碱基的频率,由此产生第一组频率值;
为所述第二组测序读出计算在每个核苷酸位置处的每种可能核苷酸碱基的频率,由此产生第二组频率值;
为在每个核苷酸位置处的每种可能核苷酸碱基计算所述第一组频率值和所述第二组频率值之间的绝对差异,由此产生绝对差异值的组;和
将所述绝对差异值中的每一个平均化,由此确定基序间距离。


3.根据权利要求2所述的方法,其中所述指定的步骤(f)包括:
产生由模拟的随机序列读出定义的基序间距离概率图;和
基于在步骤(e)中确定的基序间距离中的每一个和所述基序间距离概率图,指定所述第二转座酶显著不同于所述第一转座酶的概率值。


4.根据权利要求1所述的方法,其中对比的步骤(e)包括:
在与第一转座的核酸样品中的第一多个插入位点对应的位置处,计算在第一参照核酸样品内的确定长度的区段处的覆盖的第一测序深度;
在与第二转座的核酸样品中的第二多个插入位点对应的位置处,计算在第一参照核酸样品内的确定长度的区段处的覆盖的第二测序深度;和
将所述覆盖的第一测序深度与所述覆盖的第二测序深度对比。


5.根据权利要求4所述的方法,其中所述指定的步骤(f)包括:
执行关于平均值差异的Mann-Whitney检验、关于不同分布形状的Kolmogorov-Smirnoff检验、参数检验、非参数检验、形状差异的目检和基于百分位数的度量计算中的至少一种。


6.根据权利要求1所述的方法,其中对比的步骤(e)包括:
在与第一转座的核酸样品中的第一多个插入位点对应的位置处,计算在第一参照核酸样品中的确定长度的核酸区段的第一GC含量分数;
在与第二转座的核酸样品中的第二插入位点对应的位置处,计算在第一参照核酸样品中的确定长度的核酸区段的第二GC含量分数;和
鉴别所述第一GC含量分数和所述第二GC含量分数之间的差异。


7.根据权利要求6所述的方法,其中所述指定的步骤(f)包括:
执行关于平均值差异的Mann-Whitney检验、关于不同分布形状的Kolmogorov-Smirnoff检验、参数检验、非参数检验、形状差异的目检和基于百分位数的度量计算中的至少一种。


8.一种包含核酸和编码转座酶的独特核酸序列的组合物,所述核酸从5'至3'包含:
(a)第一转座子末端序列,
(b)唯一标识符(UID)条形码,和
(c)第二转座子末端序列,
其中所述核酸能够转座。


9.根据权利要求8所述的组合物,其中所述核酸从5'至3'进一步包含位于所述唯一标识符(UID)条形码和所述第二转座子末端序列之间的选择标记。


10.根据权利要求8或9所述的组合物,其中所述UID条形码与所述编码转座酶的独特核酸序列有关。


11.根据权利要求8-10中的任一项所述的组合物,其中包含元件(a)至(c)的核酸不包含所述编码转座酶的独特核酸序列。


12.根据权利要求11所述的组合物,其中第一载体包含含有元件(a)至(c)的核酸,且第二载体包含所述编码转座酶的独特核酸序列。


13.根据权利要求8-10中的任一项所述的组合物,其中包含元件(a)至(c)的核酸进一步包含所述编码转座酶的独特核酸序列。


14.根据权利要求13所述的组合物,其中所述编码转座酶的独特核酸序列位于所述第一转座子末端序列的5'。


15.根据权利要求8-14中的任一项所述的组合物,其中所述UID条形码包含5-200个碱基对,包括端点。


16.根据权利要求8-14中的任一项所述的组合物,其中所述UID条形码包含10-100个碱基对,包括端点。


17.根据权利要求8-14中的任一项所述的组合物,其中所述UID条形码包含10-50个碱基对,包括端点。


18.根据权利要求8-14中的任一项所述的组合物,其中所述UID条形码包含15-25个碱基对,包括端点。


19.根据权利要求8-14中的任一项所述的组合物,其中所述UID条形码包含4-25个碱基对,包括端点。


20.根据权利要求8-19中的任一项所述的组合物,其中所述UID条形码与编码转座酶的独特核酸序列相关。


21.根据权利要求8-20中的任一项所述的组合物,其中所述转座酶是野生型转座酶。


22.根据权利要求21所述的组合物,其中所述野生型转座酶分离或衍生自任何物种。


23.根据权利要求21或22所述的组合物,其中所述野生型转座酶是野生型TnAa-转座酶。


24.根据权利要求23所述的组合物,其中所述野生型TnAa-转座酶包含SEQIDNO:2的氨基酸序列。


25.根据权利要求21或22所述的组合物,其中所述野生型转座酶是野生型Tn5-转座酶。


26.根据权利要求25所述的组合物,其中所述野生型Tn5-转座酶包含SEQIDNO:17的氨基酸序列。


27.根据权利要求8-20中的任一项所述的组合物,其中所述转座酶是突变型转座酶。


28.根据权利要求27所述的组合物,其中所述突变型转座酶具有与野生型转座酶相比增加的转座酶活性。


29.根据权利要求27或28所述的组合物,其中所述突变型转座酶具有与野生型转座酶相比减少的插入位点偏倚。


30.根据权利要求27-29中的任一项所述的组合物,其中所述突变型转座酶包含至少一个已知的或天然存在的突变。


31.根据权利要求27-29中的任一项所述的组合物,其中所述突变型转座酶是突变型TnAa-转座酶。


32.根据权利要求31所述的组合物,其中所述突变型TnAa-转座酶包含P47K或M50A。


33.根据权利要求31所述的组合物,其中所述突变型TnAa-转座酶包含P47K。


34.根据权利要求33所述的组合物,其中所述突变型TnAa-转座酶包含SEQIDNO:5的氨基酸序列。


35.根据权利要求31所述的组合物,其中所述突变型TnAa-转座酶包含M50A。


36.根据权利要求35所述的组合物,其中所述突变型TnAa-转座酶包含SEQIDNO:4的氨基酸序列。


37.根据权利要求31所述的组合物,其中所述突变型TnAa-转座酶包含P47K和M50A。


38.根据权利要求37所述的组合物,其中所述突变型TnAa-转座酶包含SEQIDNO:3的氨基酸序列。


39.根据权利要求27-29中的任一项所述的组合物,其中所述突变型转座酶是突变型Tn5-转座酶。


40.根据权利要求27-29中的任一项所述的组合物,其中所述突变型转座酶包含在如下位置处的突变,所述位置在功能上等同于Tn5转座酶中的位置30、40、41、47、54、56、62、97、110、188、212、319、322、326、330、333、342、344、345、348、372、438、445、462或466,根据SEQIDNO:17的序列的编号。


41.根据权利要求39所述的组合物,其中所述突变型Tn5-转座酶包含在位置30、40、41、47、54、56、62、97、110、188、212、319、322、326、330、333、342、344、345、348、372、438、445、462或466处的突变,根据SEQIDNO:17的序列的编号。


42.根据权利要求39或41所述的组合物,其中所述突变型Tn5-转座酶包含R30Q、K40Q、Y41H、T47P、E54K、E54V、M56A、R62Q、D97A、E110K、D188A、K212M、Y319A、R322A、R322K、E326A、K330A、K330R、K333A、K333R、R342A、R344A、E345K、N348A、L372P、S438A、K438A、S445A、G462D或A466D,根据SEQIDNO:17的序列的编号。


43.根据权利要求39所述的组合物,其中所述突变型Tn5-转座酶包含E54K、M56A或L372P,根据SEQIDNO:17的序列的编号。


44.根据权利要求39所述的组合物,其中所述突变型Tn5-转座酶包含E54K、M56A和L372P,根据SEQIDNO:17的序列的编号。


45.根据权利要求44所述的组合物,其中所述突变型Tn5-转座酶包含SEQIDNO:1的氨基酸序列。


46.根据权利要求39所述的组合物,其中所述突变型Tn5-转座酶包含K212M,根据SEQIDNO:17的序列的编号。


47.根据权利要求8-20中的任一项所述的组合物,其中所述转座酶是诱变处理过的转座酶。


48.根据权利要求47所述的组合物,其中所述诱变处理过的转座酶包含至少一个非天然存在的突变。


49.根据权利要求47或48所述的组合物,其中编码诱变处理过的转座酶的独特核酸序列或编码诱变处理过的转座酶的序列已经:
(a)暴露于诱变剂或
(b)进行随机诱变、定位诱变、或它们的组合。


50.根据权利要求49所述的组合物,其中已经诱变处理过的,编码诱变处理过的转座酶的独特核酸序列或编码诱变处理过的转座酶的序列是编码野生型转座酶的序列。


51.根据权利要求50所述的组合物,其中所述编码野生型转座酶的序列或所述野生型转座酶分离或衍生自任何物种。


52.根据权利要求50或51所述的组合物,其中所述野生型转座酶是野生型TnAa-转座酶。


53.根据权利要求52所述的组合物,其中所述野生型TnAa-转座酶包含SEQIDNO:2的氨基酸序列。


54.根据权利要求50或51所述的组合物,其中所述野生型转座酶是野生型Tn5-转座酶。


55.根据权利要求54所述的组合物,其中所述野生型Tn5-转座酶包含SEQIDNO:17的氨基酸序列。


56.根据权利要求49所述的组合物,其中已经诱变处理过的,编码诱变处理过的转座酶的独特核酸序列或编码诱变处理过的转座酶的序列是编码突变型转座酶的序列。


57.根据权利要求56所述的组合物,其中所述编码突变型转座酶的序列或所述突变型转座酶分离或衍生自任何物种。


58.根据权利要求56或57所述的组合物,其中所述突变型转座酶具有与野生型转座酶相比增加的转座酶活性。


59.根据权利要求56、57或58所述的组合物,其中所述突变型转座酶具有与野生型转座酶相比减少的插入位点偏倚。


60.根据权利要求56-59中的任一项所述的组合物,其中所述突变型转座酶包含至少一个已知的或天然存在的突变。


61.根据权利要求56-60中的任一项所述的组合物,其中所述突变型转座酶是突变型TnAa-转座酶。


62.根据权利要求61所述的组合物,其中所述突变型TnAa-转座酶包含根据SEQIDNO:2的序列的P47K或M50A。


63.根据权利要求61所述的组合物,其中所述突变型TnAa-转座酶包含根据SEQIDNO:2的序列的P47K。


64.根据权利要求63所述的组合物,其中所述突变型TnAa-转座酶包含SEQIDNO:5的氨基酸序列。


65.根据权利要求61所述的组合物,其中所述突变型TnAa-转座酶包含根据SEQIDNO:2的序列的M50A。


...

【专利技术属性】
技术研发人员:DT沙博尔特B福尔霍尔姆W布尔恩M拉尼克S胡迪R阿利MS贝里
申请(专利权)人:卡帕生物系统公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利