当前位置: 首页 > 专利查询>北京大学专利>正文

测序结果中序列数据错误的检测和校正方法技术

技术编号:15691302 阅读:248 留言:0更新日期:2017-06-24 04:23
本发明专利技术提供了一种测序结果中序列数据错误的检测和校正的方法。测序反应液中包含至少两种不同碱基的核苷酸底物分子;获得简并的基因编码信息。两个或者两个以上简并的编码信息相互对比,本领域技术人员可以判断该位置的编码是否出现相互矛盾的情况。应用本发明专利技术所述的方法进行校正,任何对于测序方法的可以降低原始测序数据错误率的微小改进,都可以明显的降低校正以后的编码数据的错误率。

Method for detecting and correcting sequence data errors in sequencing results

The present invention provides a method for detecting and correcting sequence data errors in sequencing results. The sequence reaction solution contains nucleotide substrates of at least two different bases, and degenerate gene coding information is obtained. The coding information of two or more than two is compared with each other, and the technical personnel in the field can judge whether the coding of the position is contradictory or not. With the method of the present invention for correction, any minor improvement for the sequencing method that can reduce the error rate of the original sequencing data can significantly reduce the error rate of the corrected coded data.

【技术实现步骤摘要】
测序结果中序列数据错误的检测和校正方法
本专利技术涉及测序反应结果中序列数据错误的检测和校正方法,属于基因测序领域。
技术介绍
近年来,随着人们对于基因的认识越来越深入,基因测序对于医学以及生物学带来了巨大的变革。传统的测序方法主要包括SangerDNA测序法、限制性酶切长度多态性、单链构象多态性和基于基因芯片的寡核苷酸探针杂交法等。测序过程中,由于种种的原因,例如CD采光不准、流体异动、环境光、杂DNA、信号校正系统误差、测序反应液不纯等原因,测序结果出现错误是不可避免的。DNA作为遗传物质,储存了生物的遗传信息,该特性亦使得DNA被用作一般信息的存储介质。在利用DNA存储信息时,需要将信息编码成DNA序列,然后利用基因测序的方法读取该信息。为了避免编码和/或读取中的错误,通常会在编码过程中引入冗余信息,并利用该冗余信息在读取中进行信号校正。例如乔治·彻奇等人使用里德-所罗门码来将信息编码成DNA序列,并使用Illumina测序平台来读取DNA序列上的信息。DNA编码-读取技术还被应用于组合化学等领域中。在以往的DNA编码技术中,每个碱基的类型通常与其他位置上的碱基无关(无记忆型编本文档来自技高网...
测序结果中序列数据错误的检测和校正方法

【技术保护点】
一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到三条或者三条以上相互正交的核酸简并序列数据,三条或者三条以上正交的核酸简并序列对比,可以检测到序列中的错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。

【技术特征摘要】
1.一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到三条或者三条以上相互正交的核酸简并序列数据,三条或者三条以上正交的核酸简并序列对比,可以检测到序列中的错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。2.一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到三条或者三条以上使用M、K、R、Y、W、S、B、D、H、V字母表示的简并序列,三条或者三条以上简并的序列对比,可以检测序列错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。3.一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到两条或者两条以上的使用M、K、R、Y、W、S、B、D、H、V字母表示的简并序列,获得一个以A、G、T、C为编码的核酸序列信息,或者可以获得以A、G、U、C为编码的核酸序列信息;利用测序反应中由不同核苷酸碱基上连接的不同官能团导致的光或电信号作为冗余信息,可以检测序列错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。4.一种利用核酸序列的记忆性检测和校正测序结果中序列数据错误的方法,对同一核酸序列进行测序,获得三条或者三条以上相互正交的核酸简并序列数据;将简并序列综合对比,利用核酸序列的记忆性检测序列错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列;所述简并序列中,每个序列信号表示了部分基因序列信息,并且从其中一个简并序列上的信号,并不能推定另外一个简并序列上同一位置的信号。5.一种测序结果中序列数据错误的检测和校正方法,其特征在于,将待测核酸片段固定,通入反应液进行测序反应,每轮测序得到一条简并的核酸序列;至少经过N轮测序,获得N条简并的核酸序列;N条简并的序列综合对比,可以检测序列出现错误的位置;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列;其中,所述的反应液中,含有两种或者两种以上不同碱基的核苷酸底物分子;所述N为大于等于2的正整数。6.根据权利要求5所述的方法,其特征在于,通过N-1条简并的核酸序列对比,可以获得一个以A、G、T、C为编码的核酸序列信息,或者可以获得以A、G、U、C为编码的核酸序列信息;利用N条简并的序列综合对比,可以检测序列出现错误的位置,所述N为大于等于3的正整数。7.根据权利要求5所述的方法,其特征在于,通过N条简并的核酸序列对比,可以获得一个以A、G、T、C为编码的核酸序列信息,或者可以获得以A、G、U、C为编码的核酸序列信息;利用两种或两种以上的连接到碱基的官能团所提供的发光信息可以检测序列出现的错误的位置,所述N为大于等于2的正整数。8.一种测序结果中序列数据错误的检测和校正方法,其特征在于:将待测核酸片段固定,通入反应液进行测序反应;测序所用的核苷酸底物分子反应液根据碱基不同分成三组,每组反应液包含两个不同的反应液,每个反应液中含有两种不同碱基的核苷酸底物分子,两个反应液中核苷酸上的碱基种类没有交集;每轮测序使用一组反应液,每组反应液中的两个反应液循环进入;使用三组反应液进行三轮测序,得到三条简并的序列;三条简并的序列综合对比,可以检测序列出现错误的位置;进一步,...

【专利技术属性】
技术研发人员:黄岩谊陈子天周文雄
申请(专利权)人:北京大学赛纳生物科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1