用于分子探针的数据驱动设计、合成和应用的系统和方法技术方案

技术编号：19873467 阅读：39 留言：0更新日期：2018-12-22 16:11

本发明专利技术公开了用于设计和合成从样品的靶基因组捕获代表性基因组变体样本的探针的方法和系统。该方法包括提供多重序列比对(MSA)，设计多个代表性子序列，以及可选地合成核酸探针。设计步骤可以包括在MSA中指定多个间隔，移动每个MSA子集的起始位置，在每个调整的子集内聚类对齐的子序列，以及确定每个简化的MSA子集的代表性序列。本发明专利技术公开内容还包括使用本发明专利技术探针设计从样品中分离靶基因组亚区的多个核酸变体的方法，以及所述探针组合物。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于分子探针的数据驱动设计、合成和应用的系统和方法相关申请的交叉引用本申请要求2016年3月1日提交的美国临时申请No.62/302,078的权益，其公开内容通过引用整体并入本文。
本专利技术提供了用于分子探针的合理设计、合成和应用的方法和系统。关于序列表的声明与本申请相关的序列表以文本格式而非纸件提供，并且通过引用结合到本说明书中。包含序列表的文本文件的名称是57930_Sequence_Final_2017-02-28.txt。文本文件大小为2KB，于2017年2月28日创建，并随同本说明书一并提交。
技术介绍
一种捕获已知DNA片段(stretches)的早期手段是Southernblotting。该技术的变体，包括捕获RNA的Northernblotting，已经用于包括微阵列和液相杂交在内的许多现代应用。尽管DNA捕获概念已经经过更新并应用于许多其他专利技术中，但自20世纪70年代早期以来，基于互补DNA序列的探针作为“诱饵”的使用并没有改变。该常规探针设计取决于单个模板，其可以是参考序列或多数决定规则共有序列(其通常根据靶基因组区域的可获得的序列数据通过计算得到)。这种设计方法自Southernblotting/Northernblotting出现以来基本保持不变，其依赖于探针-靶分子结合来指示靶核酸的存在。虽然该方法简单，但这种设计方法并不总是理想的，因为它可能会引入靶标序列捕获偏差。靶标序列捕获偏差发生在当探针优先与和探针更相似的核酸结合，而非与其他序列结合时。在目的是捕获高度可变核酸的代表性池的应用中，传统设计的探针是次优的。例如，流感基...

【技术保护点】
以下权利要求书要求保护本专利技术的实施方式的排他的权利和特权。一种用于分离靶基因组结构域的多个核酸变体的探针的合成方法，包括：(a)提供所观察到的所述靶基因组结构域的变体的核酸序列的多重序列比对(MSA)；(b)设计多个代表性子序列，包括：(i)在MSA的长度内指定多个间隔，其中每个间隔由具有所观察到的变体的比对的核酸子序列的MSA子集组成，其中每个MSA子集有不同的起始位置；(ii)将MSA内每个MSA子集的起始位置独立地在指定方向上移动指定核酸数的位置，以提供经调整的MSA子集，其具有所述观察到的变体的比对的经调整的核酸子序列；(iii)可选地，独立地评估每个经调整的MSA子集是否符合终止标准，如果经调整的MSA不符合终止标准，则重复步骤(ii)；(iv)独立地在每个经调整的MSA子集内对比对的核酸子序列进行聚类，以提供对应于每个经调整的MSA子集的简化的MSA子集；和(v)确定每个简化的MSA子集的代表性子序列；以及(c)合成对应于每个简化的MSA子集的至少一个核酸探针，其中每个核酸探针包含代表相应的提纯的MSA子集的代表性子序列或其互补序列。

【技术特征摘要】
【国外来华专利技术】2016.03.01 US 62/302,0781.以下权利要求书要求保护本发明的实施方式的排他的权利和特权。一种用于分离靶基因组结构域的多个核酸变体的探针的合成方法，包括：(a)提供所观察到的所述靶基因组结构域的变体的核酸序列的多重序列比对(MSA)；(b)设计多个代表性子序列，包括：(i)在MSA的长度内指定多个间隔，其中每个间隔由具有所观察到的变体的比对的核酸子序列的MSA子集组成，其中每个MSA子集有不同的起始位置；(ii)将MSA内每个MSA子集的起始位置独立地在指定方向上移动指定核酸数的位置，以提供经调整的MSA子集，其具有所述观察到的变体的比对的经调整的核酸子序列；(iii)可选地，独立地评估每个经调整的MSA子集是否符合终止标准，如果经调整的MSA不符合终止标准，则重复步骤(ii)；(iv)独立地在每个经调整的MSA子集内对比对的核酸子序列进行聚类，以提供对应于每个经调整的MSA子集的简化的MSA子集；和(v)确定每个简化的MSA子集的代表性子序列；以及(c)合成对应于每个简化的MSA子集的至少一个核酸探针，其中每个核酸探针包含代表相应的提纯的MSA子集的代表性子序列或其互补序列。2.根据权利要求1所述的方法，其中，根据设定的空间限制，在MSA的长度内指定多个间隔。3.根据权利要求2所述的方法，其中，所述指定的间隔在所述MSA的长度上均匀分布。4.根据权利要求2所述的方法，其中，在MSA的长度内的所述多个间隔被指定在MSA内保守性高于平均水平的区域中。5.根据权利要求1所述的方法，其中，所述多个代表性子序列中的至少两个是非重叠的。6.根据权利要求1所述的方法，其中，步骤(b)(i)中的所述多个间隔是随机指定的。7.根据权利要求1所述的方法，其中，步骤(b)(i)中的指定包括从所述多个指定的间隔中提取MSA子集，以在每个指定的间隔内提供比对的核酸子序列。8.根据权利要求1所述的方法，其中，每个MSA子集的起始位置是位于子集的5'端或3'端的位置。9.根据权利要求1所述的方法，其中，每个MSA子集起始位置移动的所述指定的核酸数的位置不超过相应MSA子集的长度。10.根据权利要求1所述的方法，其中，每个MSA子集的起始位置向5'端方向移位。11.根据权利要求1所述的方法，其中，每个MSA子集的起始位置向3'端方向移位。12.根据权利要求1所述的方法，其中，用于独立移动每个MSA子集的所述指定的核酸数的位置和/或所述指定的方向增加在所述经调整的MSA子集内的保守位置的数量。13.根据权利要求1所述的方法，其中，由步骤(b)(ii)的移位产生的经调整的MSA子集满足设定的空间限制。14.根据权利要求1所述的方法，其中，用于独立移位每个MSA子集的所述指定的核酸数的位置和/或所述指定方向增加所述保守位置在所述经调整的MSA子集的中心区域内的设置。15.根据权利要求1所述的方法，其中，步骤(b)(iii)的终止标准包括移位迭代的预设数量，经调整的MSA子集内的保守位置的预设百分比，用于定位保守位置的预设阈值等。16.根据权利要求1所述的方法，其中，步骤(b)(iv)中的聚类包括使用距离度量按照相似性对每个经调整的MSA子集的经调整的核酸子序列进行分组，以为每个经调整的MSA提供一组或多组经调...

【专利技术属性】
技术研发人员：詹晟曦，郭思明，穆罕默德·A·卡迪尔，
申请(专利权)人：方馨基因组学公司，
类型：发明
国别省市：加拿大,CA

全部详细技术资料下载我是这个专利的主人