单分子探针多重靶向捕获文库的构建方法及应用技术

技术编号:26684177 阅读:32 留言:0更新日期:2020-12-12 02:25
本发明专利技术涉及分子检测的技术领域,特别涉及单分子探针多重靶向捕获文库的构建方法及应用;包括以下步骤:根据靶目标区域序列设计并合成分子倒置探针;针对捕获的目标区域,靶序列互补区域探针A和靶序列互补区域探针B可特异性与目标区域模板互补结合,形成含有一个核苷酸至几百个核苷酸缺口的环状结构;然后加入4种游离的核苷酸,在DNA聚合酶的作用下以靶目标序列为模板填补缺口,DNA连接酶催化探针区域两端的3’,5’‑磷酸二酯键,形成完整的环化探针;用PCR扩增直接产生靶向区域的测序文库,此时的PCR扩增产物即为测序文库。本发明专利技术在传统的MIP技术基础上做了优化和改进,用于肿瘤相关的低频变异和甲基化的检测。

【技术实现步骤摘要】
单分子探针多重靶向捕获文库的构建方法及应用
本专利技术涉及分子检测的
,特别涉及单分子探针多重靶向捕获文库的构建方法及应用。
技术介绍
癌症(Cancer),又称恶性肿瘤(MalignantTumor),是一类由于控制细胞生长增殖机制异常,引起细胞代谢紊乱,无限增殖并且侵袭周围正常组织的复杂疾病的集合。根据国家癌症中心最新一期的全国癌症数据表明,2015年恶性肿瘤发病约392.9万人,死亡约233.8万人。研究发现:肿瘤主要是由于环境或自身原因导致遗传物质损伤,变异以及染色体结构变异引起。同时,在肿瘤发生过程中,伴随着DNA甲基化、组蛋白修饰等表观遗传修饰的改变,而且这些修饰是可逆的,这就为肿瘤诊断和治疗提供了一个新途径。基因变异及DNA甲基化,具有作为肿瘤诊断和预后的生物分子标志物的潜在用途。因此,寻找肿瘤相关的驱动基因与变异位点、检测DNA甲基化等表观遗传修饰,对于研究肿瘤的发生发展、以及肿瘤的诊断与治疗都具有重大的意义。随着高通量测序技术(NextGenerationSequencing)的出现,人们对癌症的研究有了突飞猛进的发展。科研人员通过全基因组测序、转录组测序和单细胞测序等方法发现了几百个与癌症发生发展相关的驱动基因和突变热点并完成详细注释,为精确检测,科学用药和个性化治疗提供坚实的理论基础。尽管如此,针对基因组DNA低频率变异,启动子区域CpG区域甲基化程度等检测依然存在较大局限性。低频变异的检测方法主要包括全基因组测序、全外显子测序和靶向捕获深度测序等,但由于高昂的价格,很难适用普遍检测。同样,目前肿瘤样品DNA甲基化的检测方法,例如,全基因组甲基化测序(WholeGnomeBisulfitesequencing,WGBS)和亚硫酸盐处理后PCR扩增测序等,存在样品投入多、制备繁琐和费用较高等缺点,灵敏度和特异性也有待提高。因此,需要开发一种方便、经济且灵敏度和特异性都较高的检测肿瘤相关低频变异和甲基化的方法。分子倒置探针(MolecularInversionProbe,MIP)技术是最新发展起来的一种用于目标序列捕获的分子生物技术,该技术通过设计特异的探针对已知特定目的基因组序列进行捕获,将目标区域富集后再进行高通量测序,其具有特异性强、重复性好、操作简单、费用低廉且对DNA完整度要求不高等特点,避免了全基因组研究费用高、分析困难等问题,并且弥补了靶向捕获技术的不足(捕获效率有限,约50%~60%)。常见的杂交捕获技术,只有60~120nt的探针,捕获的区域一般是60~240bp,超过240bp的后,捕获效率很低;因此所需要的DNA和DNA文库起始量也高,一般需要500ng的DNA文库投入量;不同的探针捕获效率不一,造成捕获的产物均一性很差;此外,寡核苷酸探针的特异性较差,可能与部分目标片段的非靶向区域杂交,易造成数据浪费和测序成本的增加;传而多重PCR扩增子目标区域富集技术,可在一个反应体系中同时扩增多个目的片段,但扩增子越多,不均一性越高,同时,此技术具有较强的GC偏好性;对于GC不均一的靶向区域,富集效果也不均一;传统的MIP技术存在等位基因捕获不均一和低频变异检出效果差的困难。为此,提出单分子探针多重靶向捕获文库的构建方法及应用。
技术实现思路
本专利技术的目的在于提供单分子探针多重靶向捕获文库的构建方法及应用,该方法在特异靶向序列探针和通用引物之间添加单分子标记序列,能够用较短的随机序列有效的产生更多的分子组合标记,降低了假阳性比率,提高了对低频变异的检出率,达到降噪的效果;另外,该方法的双端探针设计,除了能够捕获更大的目标区域,也对目标区域存在高GC的情况,可以在其目标区域两端设计探针,避开中心区域,有效克服高GC区域无法设计探针的困难;同时,该方法分子将倒置探针和靶目标区域序列结合成环,通过PCR扩增直接形成可测序文库,采用“先捕获后建库”的理念,提高检测准确性,避免DNA打断步骤,既简化流程又能减少DNA损失。为了实现上述目的,本专利技术的技术方案如下:单分子探针多重靶向捕获文库的构建方法,包括以下步骤:(1)根据靶目标区域序列设计并合成分子倒置探针,所述分子倒置探针中每个MIP依次包括以下组分:靶序列互补区域探针A-单分子标记序列a-通用引物识别序列1-连接序列-通用引物识别序列2-单分子标记序列b-靶序列互补区域探针B;(2)针对捕获的目标区域,靶序列互补区域探针A和靶序列互补区域探针B可特异性与目标区域模板互补结合,形成含有一个核苷酸至几百个核苷酸缺口的环状结构;(3)然后加入4种游离的核苷酸,所述4种游离的核苷酸为dATP、dTTP、dGTP和dCTP,在DNA聚合酶的作用下以靶目标序列为模板填补缺口,DNA连接酶催化探针区域两端的3’,5’-磷酸二酯键,形成完整的环化探针;核酸外切酶降解反应体系中未反应的探针和线性基因组DNA序列,只保留环形探针;用PCR扩增直接产生靶向区域的测序文库,此时的PCR扩增产物即为测序文库;其中,所述PCR扩增的正向引物包括Illumina测序接头和正向通用引物,所述PCR扩增的反向引物包括Illumina测序接头和反向通用引物。具体的,所述每个MIP中靶序列互补区域探针A和B是针对靶目标区域的特异性序列,与模板靶序列区域互补;所述靶序列互补区域探针A和靶序列互补区域探针B之间的距离为1~500bp;所述靶序列互补区域探针A和靶序列互补区域探针B的长度分别为14~35个碱基对;所述单分子标记序列a和单分子标记序列b在每一个MIP中的序列是不同的;所述单分子标记序列a和单分子标记序列b的长度分别为4~12个碱基对。优选的,所述靶序列互补区域探针A和靶序列互补区域探针B之间的距离为90~200bp,其中解链温度为55℃~65℃,GC含量为35%~75%。具体的,所述通用引物识别序列1和通用引物识别序列2不与靶目标区域的任何序列互补,所述通用引物识别序列1和通用引物识别序列2的长度分别为14~30个碱基对,所述通用引物识别序列1和通用引物识别序列2分别与PCR扩增的正向引物和反向引物之间有部分或全部互补。优选的,所述通用引物识别序列1包括5'-CTTCAGCTTCCCGATTACGG-3'(SEQIDNO.1)的核苷酸序列,所述通用引物识别序列2包括5'-GCACGATCCGACGGTAGTGT-3'(SEQIDNO.2)的核苷酸序列。具体的,所述连接序列是人工合成的随机序列或序列取自非靶标序列,用于连接靶序列互补区域探针A-单分子标记序列a-通用引物识别序列1和通用引物识别序列2-单分子标记序列b-靶序列互补区域探针B,形成一个完整的MIP;所述连接序列的长度为0~20个碱基对。具体的,所述每个MIP包括(N1-8)CTTCAGCTTCCCGATTACGG(I0-20)GCACGATCCGACGGTAGTGT(N8-16)(SEQIDNO.3)的核苷酸序列,其中(N1-8)为单分子标记序列a,(I0-20)为连接序列,(N8-16)为单分子标记序列b。<本文档来自技高网
...

【技术保护点】
1.单分子探针多重靶向捕获文库的构建方法,其特征在于,包括以下步骤:/n(1)根据靶目标区域序列设计并合成分子倒置探针,所述分子倒置探针中每个MIP依次包括以下组分:靶序列互补区域探针A-单分子标记序列a-通用引物识别序列1-连接序列-通用引物识别序列2-单分子标记序列b-靶序列互补区域探针B,所述通用引物识别序列1和通用引物识别序列2不与靶目标区域的任何序列互补,所述通用引物识别序列1和通用引物识别序列2的长度分别为14~30个碱基对,所述通用引物识别序列1和通用引物识别序列2分别与PCR扩增的正向引物和反向引物之间有部分或全部互补;/n(2)针对捕获的目标区域,靶序列互补区域探针A和靶序列互补区域探针B可特异性与目标区域模板互补结合,形成含有一个核苷酸至几百个核苷酸缺口的环状结构;/n(3)然后加入4种游离的核苷酸,所述4种游离的核苷酸为dATP、dTTP、dGTP和dCTP,在DNA聚合酶的作用下以靶目标序列为模板填补缺口,DNA连接酶催化探针区域两端的3’,5’-磷酸二酯键,形成完整的环化探针;核酸外切酶降解反应体系中未反应的探针和线性基因组DNA序列,只保留环形探针;用PCR扩增直接产生靶向区域的测序文库,此时的PCR扩增产物即为测序文库;其中,所述PCR扩增的正向引物包括Illumina测序接头和正向通用引物,所述PCR扩增的反向引物包括Illumina测序接头和反向通用引物。/n...

【技术特征摘要】
1.单分子探针多重靶向捕获文库的构建方法,其特征在于,包括以下步骤:
(1)根据靶目标区域序列设计并合成分子倒置探针,所述分子倒置探针中每个MIP依次包括以下组分:靶序列互补区域探针A-单分子标记序列a-通用引物识别序列1-连接序列-通用引物识别序列2-单分子标记序列b-靶序列互补区域探针B,所述通用引物识别序列1和通用引物识别序列2不与靶目标区域的任何序列互补,所述通用引物识别序列1和通用引物识别序列2的长度分别为14~30个碱基对,所述通用引物识别序列1和通用引物识别序列2分别与PCR扩增的正向引物和反向引物之间有部分或全部互补;
(2)针对捕获的目标区域,靶序列互补区域探针A和靶序列互补区域探针B可特异性与目标区域模板互补结合,形成含有一个核苷酸至几百个核苷酸缺口的环状结构;
(3)然后加入4种游离的核苷酸,所述4种游离的核苷酸为dATP、dTTP、dGTP和dCTP,在DNA聚合酶的作用下以靶目标序列为模板填补缺口,DNA连接酶催化探针区域两端的3’,5’-磷酸二酯键,形成完整的环化探针;核酸外切酶降解反应体系中未反应的探针和线性基因组DNA序列,只保留环形探针;用PCR扩增直接产生靶向区域的测序文库,此时的PCR扩增产物即为测序文库;其中,所述PCR扩增的正向引物包括Illumina测序接头和正向通用引物,所述PCR扩增的反向引物包括Illumina测序接头和反向通用引物。


2.根据权利要求1所述的单分子探针多重靶向捕获文库的构建方法,其特征在于,所述每个MIP中靶序列互补区域探针A和B是针对靶目标区域的特异性序列,与模板靶序列区域互补;所述靶序列互补区域探针A和靶序列互补区域探针B之间的距离为1~500bp;所述靶序列互补区域探针A和靶序列互补区域探针B的长度分别为14~35个碱基对;所述单分子标记序列a和单分子标记序列b在每一个MIP中的序列是不同的;所述单分子标记序列a和单分子标记序列b的长度分别为4~12个碱基对。


3.根据权利要求2所述的单分子探针多重靶向捕获文库的构建方法,其特征在于,所述靶序列互补区域探针A和靶序列互补区域探针B之间的距离为90~200bp,其中解链温度为55℃~65℃,GC含量为35%~75%。


4.根据权利要求1所述的单分子探针多重靶向捕获文库的构建方法,其特征在于,所述通用引...

【专利技术属性】
技术研发人员:段小红张腾龙杨春燕杨文娟李旋王东亮周启明
申请(专利权)人:北京求臻医学检验实验室有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1