The present invention provides a method for detecting and correcting sequence data errors in sequencing results. The sequence reaction solution contains nucleotide substrates of at least two different bases, and degenerate gene coding information is obtained. The coding information of two or more than two is compared with each other, and the technical personnel in the field can judge whether the coding of the position is contradictory or not. With the method of the present invention for correction, any minor improvement for the sequencing method that can reduce the error rate of the original sequencing data can significantly reduce the error rate of the corrected coded data.
【技术实现步骤摘要】
测序结果中序列数据错误的检测和校正方法
本专利技术涉及测序反应结果中序列数据错误的检测和校正方法,属于基因测序领域。
技术介绍
近年来,随着人们对于基因的认识越来越深入,基因测序对于医学以及生物学带来了巨大的变革。传统的测序方法主要包括SangerDNA测序法、限制性酶切长度多态性、单链构象多态性和基于基因芯片的寡核苷酸探针杂交法等。测序过程中,由于种种的原因,例如CD采光不准、流体异动、环境光、杂DNA、信号校正系统误差、测序反应液不纯等原因,测序结果出现错误是不可避免的。DNA作为遗传物质,储存了生物的遗传信息,该特性亦使得DNA被用作一般信息的存储介质。在利用DNA存储信息时,需要将信息编码成DNA序列,然后利用基因测序的方法读取该信息。为了避免编码和/或读取中的错误,通常会在编码过程中引入冗余信息,并利用该冗余信息在读取中进行信号校正。例如乔治·彻奇等人使用里德-所罗门码来将信息编码成DNA序列,并使用Illumina测序平台来读取DNA序列上的信息。DNA编码-读取技术还被应用于组合化学等领域中。在以往的DNA编码技术中,每个碱基的类型通常与其他位置上的 ...
【技术保护点】
一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到三条或者三条以上相互正交的核酸简并序列数据,三条或者三条以上正交的核酸简并序列对比,可以检测到序列中的错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。
【技术特征摘要】
1.一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到三条或者三条以上相互正交的核酸简并序列数据,三条或者三条以上正交的核酸简并序列对比,可以检测到序列中的错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。2.一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到三条或者三条以上使用M、K、R、Y、W、S、B、D、H、V字母表示的简并序列,三条或者三条以上简并的序列对比,可以检测序列错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。3.一种测序结果中序列数据错误的检测和校正方法,其特征在于,对同一核酸序列进行测序,得到两条或者两条以上的使用M、K、R、Y、W、S、B、D、H、V字母表示的简并序列,获得一个以A、G、T、C为编码的核酸序列信息,或者可以获得以A、G、U、C为编码的核酸序列信息;利用测序反应中由不同核苷酸碱基上连接的不同官能团导致的光或电信号作为冗余信息,可以检测序列错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列。4.一种利用核酸序列的记忆性检测和校正测序结果中序列数据错误的方法,对同一核酸序列进行测序,获得三条或者三条以上相互正交的核酸简并序列数据;将简并序列综合对比,利用核酸序列的记忆性检测序列错误;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列;所述简并序列中,每个序列信号表示了部分基因序列信息,并且从其中一个简并序列上的信号,并不能推定另外一个简并序列上同一位置的信号。5.一种测序结果中序列数据错误的检测和校正方法,其特征在于,将待测核酸片段固定,通入反应液进行测序反应,每轮测序得到一条简并的核酸序列;至少经过N轮测序,获得N条简并的核酸序列;N条简并的序列综合对比,可以检测序列出现错误的位置;进一步在对比出现错误的位置,通过修改至少一个序列,可以获得校正的序列;其中,所述的反应液中,含有两种或者两种以上不同碱基的核苷酸底物分子;所述N为大于等于2的正整数。6.根据权利要求5所述的方法,其特征在于,通过N-1条简并的核酸序列对比,可以获得一个以A、G、T、C为编码的核酸序列信息,或者可以获得以A、G、U、C为编码的核酸序列信息;利用N条简并的序列综合对比,可以检测序列出现错误的位置,所述N为大于等于3的正整数。7.根据权利要求5所述的方法,其特征在于,通过N条简并的核酸序列对比,可以获得一个以A、G、T、C为编码的核酸序列信息,或者可以获得以A、G、U、C为编码的核酸序列信息;利用两种或两种以上的连接到碱基的官能团所提供的发光信息可以检测序列出现的错误的位置,所述N为大于等于2的正整数。8.一种测序结果中序列数据错误的检测和校正方法,其特征在于:将待测核酸片段固定,通入反应液进行测序反应;测序所用的核苷酸底物分子反应液根据碱基不同分成三组,每组反应液包含两个不同的反应液,每个反应液中含有两种不同碱基的核苷酸底物分子,两个反应液中核苷酸上的碱基种类没有交集;每轮测序使用一组反应液,每组反应液中的两个反应液循环进入;使用三组反应液进行三轮测序,得到三条简并的序列;三条简并的序列综合对比,可以检测序列出现错误的位置;进一步,...
【专利技术属性】
技术研发人员:黄岩谊,陈子天,周文雄,
申请(专利权)人:北京大学,赛纳生物科技北京有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。