当前位置: 首页 > 专利查询>北京大学专利>正文

一种利用模糊核酸测序信息进行比对及变异鉴定的方法和系统技术方案

技术编号:18227985 阅读:25 留言:0更新日期:2018-06-16 18:19
本发明专利技术提供一种通过测序获得的模糊序列信息进行比对以及变异鉴定的方法:将待测的核苷酸片段固定,通过测序反应,获得模糊序列信息;模糊序列信息和参考基因组进行比对;同时可以对于变异进行鉴定。本发明专利技术提供的方法不需要完整的核酸碱基序列,仅通过多碱基反应液测序获得的模糊信息就可以进行比对和发现变异,不仅节省了测序的费用,还加快了比对的速度,降低了成本。 1

【技术实现步骤摘要】
一种利用模糊核酸测序信息进行比对及变异鉴定的方法和系统
本专利技术涉及一种利用模糊的核酸测序信息进行比对及变异鉴定的方法和系统,属于基因测序领域。
技术介绍
高通量测序技术又被称为下一代测序技术(NGS),是近年发展起来的新型测序技术。高通量测序技术是对于传统的测序技术的一次革命性改变,同时对几万到几百万的核酸分子进行同时测序。高通量测序中会产生大量的数据。数据的处理和利用是高通量测序的重要组成部分。高通量测序技术可以发现基因变异,为临床诊断、筛查等提供依据。基因变异包括单核苷酸变异(SNV)、拷贝数变异(CNV)、染色体倍数变异、DNA修饰的变异(如DNA甲基化)等。临床诊断上要求能够以较低廉的价格,快速准确地检测基因变异。然而现有基于高通量测序技术的基因变异检测方法均需要先得到完整的DNA序列,然后寻找变异,从而提高了时间和价格成本。本专利技术提供一种模糊比对的方法,可以利用模糊的核酸序列快速的进行比对并且寻找变异。
技术实现思路
本专利技术提供一种获得DNA序列的部分信息,将该部分信息比对到参考基因组上,并利用该部分信息发现/鉴定基因变异的方法。本专利技术提供一种通过测序获得的模糊序列信息进行比对以及变异鉴定的方法:将待测的核苷酸片段固定,通过测序反应,获得模糊序列信息;模糊序列信息和参考基因组进行比对;其中,所述的测序反应的反应液中包含两种或者两种以上不同碱基的核苷酸底物分子。本专利技术所述的测序反应的反应液中包含两种或者两种以上的不同碱基的核苷酸底物分子。当其进行测序反应的时候,每次获得的是对应于测序反应液中核苷酸底物分子的序列信息。该信息可能含有两种或者两种以上的碱基数量信息,并不是确定的序列信息,是模糊的序列信息。根据本专利技术优选的实施方式,利用5’端多磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子进行测序;所述的荧光切换性质指的是测序后荧光信号相比测序反应前有明显改变。根据本专利技术优选的实施方式,所述的测序是边成边测序方法。根据本专利技术优选的实施方式,还包括将模糊序列信息和参考基因组用相同方式进行编码,然后进行比对。根据本专利技术优选的实施方式,还包括将模糊序列信息或参考基因组进行编码,然后进行比对。在该编码的过程中,可能涉及到了碱基排列次序的改变,也可以用其它字母或符号的替代,以相同形式并且有利于比对为原则。根据本专利技术优选的实施方式,还包括将参考基因组进行编码,更改其次序信息,然后与模糊序列信息进行比对。根据本专利技术优选的实施方式,将参考基因组进行编码,更改其次序信息,然后与模糊序列信息的编码进行比对。根据本专利技术优选的实施方式,所述的模糊序列信息指的是不能由该序列信息得出核苷酸序列的完整碱基序列信息。根据本专利技术优选的实施方式,所述的完整碱基序列信息指的是以A、G、T、C为编码的核酸序列信息,或者可以获得以A、G、U、C为编码的核酸序列信息;其中碱基可以是甲基化的碱基。根据本专利技术优选的实施方式,所述的模糊序列信息可以是使用M、K、R、Y、W、S、B、D、H、V字母表示的简并序列。根据本专利技术优选的实施方式,所述的模糊序列信息可以是简并序列信息和非简并序列信息的结合。根据本专利技术优选的实施方式,还包括将参考基因组进行编码,然后将模糊序列信息的编码和参考基因组编码进行比对根据本专利技术优选的实施方式,所述的模糊序列信息进行编码以及参考基因组进行编码得到的是相同表示方式的编码。根据本专利技术优选的实施方式,所述的测序是3端不封闭的测序方法。根据本专利技术优选的实施方式,测序所用的反应液包含两种或两种以上不同碱基的核苷酸底物分子。根据本专利技术优选的实施方式,测序所用的反应液中的两种或两种以上不同碱基的核苷酸底物分子用相同或者不相同的荧光分子标记。根据本专利技术优选的实施方式,测序所用的反应液是一套反应液组,每套反应液中包含两种或者两种以上的反应液。根据本专利技术优选的实施方式,所述的测序反应液是一套反应液组,每套反应液组包括两个反应液,每个反应液包含两种不同碱基的核苷酸;其中一个反应液中的核苷酸可以和待测核苷酸序列上的两种碱基互补,另一个反应液中的核苷酸可以和待测核酸序列上的另外两种碱基互补。根据本专利技术优选的实施方式,利用Smith-Waterman算法、Bowtie、BWA或SOAP,将编码后的模糊序列信息比对到编码后的参考基因组上.根据本专利技术优选的实施方式,利用常见的发现基因变异的方法,优选mutect、strelka、control-freec、cns-seq中的一种或多种,从比对的结果中发现变异的基因。根据本专利技术优选的实施方式,将测序获得的模糊序列信息中,模糊序列信息编码成其可能的碱基序列信息中的一种.根据本专利技术优选的实施方式,将测序获得的模糊序列信息中,所有模糊序列信息编码成数字。根据本专利技术优选的实施方式,模糊序列信息进行编码以及参考基因组进行编码先后次序是可以调换的。根据本专利技术优选的实施方式,利用5’端多磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子进行测序;所述的荧光切换性质指的是测序后荧光信号相比测序反应前有明显改变。根据本专利技术优选的实施方式,所述的荧光切换性质指的是每一步的测序反应后,荧光信号相比于测序反应前有明显增强或者有明显减弱或者发射光频率范围有明显改变。根据本专利技术优选的实施方式,所述的5’端多磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子,指的是5’末端磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子。根据本专利技术优选的实施方式,利用5’多磷酸末端或中间磷酸修饰有具有荧光切换性质荧光团的核苷酸底物分子进行测序;所述的荧光切换性质指的是测序后荧光信号强度相比测序反应前有明显上升;每轮测序使用一套反应液组,每套反应液组包括两个反应液,每个反应液包含两种不同碱基的核苷酸底物分子;其中一个反应液中的核苷酸底物分子可以和待测核苷酸序列上的两种碱基互补,另一个反应液中的核苷酸底物分子可以和待测核酸序列上的另外两种碱基互补;首先,将待测的核苷酸序列片段固定在反应室中,然后通入一套反应液组中的一个反应液;使用酶将具有荧光切换性质荧光团的核苷酸底物上面的荧光团释放,从而导致荧光切换;然后通入同一套反应液组中的第二个反应液;使用酶将具有荧光切换性质的荧光团的核苷酸底物上面的荧光团释放,从而导致荧光切换;两个反应液循环加入,通过荧光信息获得待测核苷酸底物的模糊编码信息。本专利技术提供一种测序试剂,其特征在于,将待测的核苷酸片段固定,通过测序试剂与固定的核苷酸片段反应,获得模糊序列信息;其中,所述的测序反应的反应液中包含两种或者两种以上不同碱基的核苷酸底物分子。根据本专利技术优选的实施方式,利用5’端多磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子测序试剂进行测序;所述的荧光切换性质指的是测序后荧光信号相比测序反应前有明显改变。根据本专利技术优选的实施方式,所述的反应试剂中的两种或两种以上不同碱基的核苷酸底物分子用相同或者不相同的荧光分子标记。根据本专利技术优选的实施方式,所述的反应试剂是一套反应液组,每套反应液中包含两种或者两种以上的反应液。根据本专利技术优选的实施方式,所述的测序反应试剂是一套反应液组,每套反应液组包括两个反应液,每个反应液包含两种不同碱基的核苷酸;其中一个反应液中的核苷酸可以和待测核苷酸序列上的两种碱基互补,另一个反应液中的核苷酸可以和待测本文档来自技高网...

【技术保护点】
1.一种通过测序获得的模糊序列信息进行比对以及变异鉴定的方法,其特征在于,

【技术特征摘要】
1.一种通过测序获得的模糊序列信息进行比对以及变异鉴定的方法,其特征在于,将待测的核苷酸片段固定,通过测序反应,获得模糊序列信息;模糊序列信息和参考核酸序列进行比对;其中,所述的测序反应的反应液中包含两种或者两种以上不同碱基的核苷酸底物分子。2.根据权利要求1所述的方法,其特征在于,利用5’端在多磷酸上修饰有荧光切换性质的荧光团的核苷酸底物分子进行测序;所述的荧光切换性质指的是测序后荧光信号相比测序反应前有明显改变。3.根据前面任一项权利要求所述的方法,其特征在于,所述的测序是边合成边测序方法。4.根据前面任一项权利要求所述的方法,其特征在于,还包括将模糊序列信息和参考核酸序列用相同方式进行编码,然后进行比对。5.根据前面任一项权利要求所述的方法,其特征在于,还包括将模糊序列信息或参考核酸序列进行编码,然后进行比对。6.根据前面任一项权利要求所述的方法,其特征在于,还包括将参考核酸序列进行编码,更改其次序信息,然后与模糊序列信息进行比对。7.根据权利要求4所述的方法,其特征在于,将参考核酸序列进行编码,更改其次序信息,然后与模糊序列信息的编码进行比对。8.根据前面任一项权利要求所述的方法,其特征在于,所述的模糊序列信息指的是不能由该序列信息得出核苷酸序列的完整碱基序列信息。9.根据权利要求8所述的方法,其特征在于,所述的完整碱基序列信息指的是以A、G、T、C为编码的核酸序列信息,或者以A、G、U、C为编码的核酸序列信息;其中碱基可以是甲基化的碱基。10.根据前面任一项权利要求所述的方法,其特征在于,所述的模糊序列信息可以是使用M、K、R、Y、W、S、B、D、H、V字母表示的简并序列。11.根据前面任一项权利要求所述的方法,其特征在于,所述的模糊序列信息可以是简并序列信息和非简并序列信息的结合。12.根据前面任一项权利要求所述的方法,其特征在于,还包括将参考核酸序列进行编码,然后将模糊序列信息的编码和参考核酸序列编码进行比对。13.根据权利要求12所述的方法,其特征在于,所述的模糊序列信息进行编码以及参考核酸序列进行编码得到的是相同表示方式的编码。14.根据前面任一项权利要求所述的方法,其特征在于,所述的测序是3端不封闭的测序方法。15.根据前面任一项权利要求所述的方法,其特征在于,所述的测序反应液包含两种或两种以上不同碱基的核苷酸底物分子。16.根据权利要求15所述的方法,其特征在于,所述的反应液中的两种或两种以上不同碱基的核苷酸底物分子用相同或者不相同的荧光分子标记。17.根据权利要求16所述的方法,其特征在于,所述的反应液是一套反应液组,每套反应液中包含两种或者两种以上的反应液。18.根据前面任一项权利要求所述的方法,其特征在于,所述的测序反应液是一套反应液组,每套反应液组包括两个反应液,每个反应液包含两种不同碱基的核苷酸;其中一个反应液中的核苷酸可以和待测核苷酸序列上的两种碱基互补,另一个反应液中的核苷酸可以和待测核酸序列上的另外两种碱基互补。19.根据前面任一项权利要求所述的方法,其特征在于,利用Smith-Waterman算法、Bowtie、BWA或SOAP,将编码后的模糊序列信息比对到编码后的参考核酸序列上.20.根据前面任一项权利要求所述的方法,其特征在于,利用常见的发现基因变异的方法,优选mutect、strelka、control-freec、cns-seq中的一种或多种,从比对的结果中发现变异的基因。21.根据前面任一项权利要求所述的方法,其特征在于,将测序获得的模糊序列信息,编码成其可能的碱基序列信息中的一种。22.根据前面任一项权利要求所述的方法,其特征在于,将测序获得的模糊序列信息中,所有模糊序列信息编码成数字。23.根据权利要求12所述的方法,其特征在于,将模糊序列信息以及参考核酸序列同时或先后进行编码。24.根据权利要求2所述的方法,其特征在于,所述的荧光切换性质指的是每一步的测序反应后,荧光信号相比于测序反应前有明显增强,或者有明显减弱,或者发射光频率范围有明显改变。25.根据前面任一项权利要求所述的方法,其特征在于,所述的5’端多磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子,指的是5’末端磷酸修饰有荧光切换性质的荧光团的核苷酸底物分子。26.根据前面任一项权利要求所述的方法,其特征在于,利用5’多磷酸末端或中间磷酸修饰有具有荧光切换性质荧光团的核苷酸底物分子进行测序;所述的荧光切换性质指的是测序后荧光信号强度相比测序反应前有明显上升;每轮测序使用一套反应液组,每套反应液组包括两个反应液,每个反应液包含两种不同碱基的核苷酸底物分子;其中一个反应液中的核苷酸底物分子可以和待测核苷酸序列上的两种碱基互补,另一个反应液中的核苷酸底物分子可以和待测核酸序列上的另外两种碱基互补;首先,将待测...

【专利技术属性】
技术研发人员:周文雄陈子天康力乔朔段海峰黄岩谊
申请(专利权)人:北京大学赛纳生物科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1