The invention relates to a mathematical reconstruction algorithm for long-chain molecular sequences, especially a mathematical sequence reconstruction method for long-chain molecules used for DNA sequencing, protein amino acid sequencing or other long-chain structural chemical substance detection. The method includes: 1) providing at least two DNA molecular chains, 2) breaking fragmented sequences to form X gene libraries, 3) base pairs of gene libraries. Sequencing the fragments to obtain the information of Library fragments, 4) arranging and splicing the fragments of Library fragments to obtain the possibility set, 5) finding the intersection, 6) judging the number of elements in the intersection and screening to obtain the correct gene sequence map; the present invention belongs to the mathematical algorithm technology, which can realize the determination and reconstruction of gene sequence, as well as the aggregation of proteins, polysaccharides or other single structures. Sequence determination and reconstruction can improve the accuracy of current gene sequencing, and the present invention is not based on probability speculation, but on rigorous mathematical algorithm, with high accuracy of structure determination.
【技术实现步骤摘要】
一种用于长链分子的数学序列重建方法
本专利技术涉及一种长链分子序列数学重建算法,尤指一种用于基因DNA序列测定、蛋白质氨基酸序列测定或其他长链结构化学物质检测的一种用于长链分子的数学序列重建方法。
技术介绍
在生物学和材料学中都涉及到序列的检测,即对某一链的各种基团排列进行测定,如蛋白质的序列测定,DNA的序列测定,多糖的序列测定等等,以DNA测序为例,来阐述序列测定中面对的瓶颈,在分子生物学研究中,DNA的序列分析是进一步研究和改造目的基因的基础。目前用于测序的技术主要有Sanger等(1977)专利技术的双脱氧链末端终止法和Maxam和Gilbert(1977)专利技术的化学降解法,这二种方法在原理上差异很大,但都是根据核苷酸在某一固定的点开始,随机在某一个特定的碱基处终止,产生A,T,C,G四组不同长度的一系列核苷酸,然后在尿素变性的PAGE胶上电泳进行检测,从而获得DNA序列;Sanger测序法属第一代测序技术,是测序技术发展的源头,此技术是通过核苷酸在某一固定的点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,然后在尿素变性的PAGE胶上电泳进行检测,从而获得可见DNA碱基序列的一种方法;第一代测序技术的主要特点是测序读长可达1000bp,准确性高达99.999%,但其测序成本高,通量低等方面的缺点,严重影响了其真正大规模的应用。因而第一代测序技术并不是最理想的测序方法。经过不断的技术开发和改进,以Roche公司的454技术、illumina公司的Solexa,Hiseq技 ...
【技术保护点】
1.一种用于长链分子的数学序列重建方法,其特征在于,所述的测序方法主要包括以下步骤:1)提供一个个体中至少两个待测DNA分子链,或者对某个体的DNA链用PCR仪进行增殖,设DNA分子数量为X,X为≥2的自然数;2)将所述X个DNA分子打断成碎片序列,形成X个基因文库;3)对X个基因文库的基因片段进行测序,获得X个基因文库的片段信息集合;4)将X个基因文库的碎片进行全排列拼接,获取可能性集合;5)对可能性集合求交集;6)判断交集中的元素数量,通过精确的元素数量等式,筛选得到正确的基因序列图谱。
【技术特征摘要】
1.一种用于长链分子的数学序列重建方法,其特征在于,所述的测序方法主要包括以下步骤:1)提供一个个体中至少两个待测DNA分子链,或者对某个体的DNA链用PCR仪进行增殖,设DNA分子数量为X,X为≥2的自然数;2)将所述X个DNA分子打断成碎片序列,形成X个基因文库;3)对X个基因文库的基因片段进行测序,获得X个基因文库的片段信息集合;4)将X个基因文库的碎片进行全排列拼接,获取可能性集合;5)对可能性集合求交集;6)判断交集中的元素数量,通过精确的元素数量等式,筛选得到正确的基因序列图谱。2.根据权利要求1所述的一种用于长链分子的数学序列重建方法,其特征在于,当所述步骤5)的交集只有一个时,所得结果为所测试分子的序列结构;否则,重复所述步骤1)-5)进行测试和计算。3.根据权利要求1所述的一种用于长链分子的数学序列重建方法,其特征在于,所述步骤3)中,设X个基因文库分别为基因...
【专利技术属性】
技术研发人员:胡洪超,舒绪刚,
申请(专利权)人:仲恺农业工程学院,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。