一种自动DNA序列验证的方法及系统技术方案

技术编号:37988080 阅读:12 留言:0更新日期:2023-06-30 10:02
本发明专利技术公开了一种自动DNA序列验证的方法,本发明专利技术的方法采用流程化、自动化的设计,减少各环节中的人为失误,同时使得每一批次结果标准统一;此外,可满足大数据的需求,极大提高效率。效率。效率。

【技术实现步骤摘要】
一种自动DNA序列验证的方法及系统


[0001]本专利技术属于基因
,尤其涉及一种自动DNA序列验证的方法及系统。

技术介绍

[0002]自20年前人类基因组计划完成之后,生物技术的发展突飞猛进,尤其是在基因与健康方面,其中基因序列的获得以及序列验证成为重要一环。基因序列的获得易于实现,但是后续大批量的序列验证费时费力。
[0003]目前序列验证的技术方案是:1)批量获得基因样本(一般利用PCR从基因组扩增得到);2)利用一代测序(Sanger测序)获得基因样本的部分序列(大概800bp);3)将步骤2)得到的序列和目的序列进行比对:如果能比对上,则此样本初筛正确,设计引物测通剩余序列;如果不能比对上,则剔除此样本并终止后续实验;4)将此样本的所有序列片段进行拼接组装;5)将步骤4)得到的拼接序列和目的序列进行比对,判断基因样本的结果(正确、缺失、突变、插入)。
[0004]该技术方案的缺陷包括:每个步骤手动操作完成,费时费力,人为参与流程过多,导致每批结果标准不统一;通量小,无法满足大数据的要求。

技术实现思路

[0005]本专利技术的目的是提供一种自动DNA序列验证的方法及系统,剔除测序结果中质量值较低的序列,大大提高拼接结果的准确性以及拼接成功率,同时根据序列特性,统一引物设计的参数,大大提高引物集合中每条引物测序的成功率,整个流程可以自动化完成,实现了高效率、高通量、高准确率的目的。
[0006]为实现上述目的,采用以下技术方案:
[0007]一种自动DNA序列验证的方法,所述方法包括以下步骤:
[0008]1)根据目标DNA序列从样本基因组中扩增获得目标DNA样本;
[0009]2)对所述目标DNA样本设计引物,进行Sanger测序;
[0010]3)将步骤2)得到的前端测序序列和所述目标DNA序列进行比对,获得比对上的前端测序序列;
[0011]4)对所述目标DNA序列的剩余序列设计引物以测通所述目标DNA序列,获得引物集合;
[0012]5)使用步骤4)得到的所述引物集合对所述目标DNA样本进行Sanger测序,获得序列片段;
[0013]6)将步骤2)得到的所述前端测序序列和步骤5)得到的所述序列片段进行拼接组装,获得全长序列;
[0014]7)将步骤6)得到的所述全长序列和所述目标DNA序列进行比对,判断所述目标DNA样本是否正常、缺失、突变、插入。
[0015]进一步地,所述方法的3)、7)步骤中的所述比对使用BLAST。
[0016]进一步地,所述方法的1)步骤后、2)步骤前还包括“使用BLAST对所述目标DNA序列进行建库”步骤。
[0017]进一步地,所述方法的2)和4)步骤中的所述设计引物使用Primer3。
[0018]进一步地,所述方法的6)步骤中的所述拼接组装使用CAP3。
[0019]进一步地,所述方法的3)步骤中的所述比对上的前端测序序列是相似度≥80%、匹配长度≥600bp的序列。
[0020]进一步地,所述方法的2)和4)步骤中的所述设计引物的参数设置为55℃≤Tm≤70℃、30%≤GC含量≤60%、550bp≤引物间隔≤750bp、18bp≤引物长度≤25bp。
[0021]一种自动DNA序列验证的系统,所述系统包括:
[0022]输入信息获取模块,用于根据目标DNA序列从样本基因组中扩增获得目标DNA样本;
[0023]第一Sanger测序模块,用于对所述目标DNA样本设计引物,进行Sanger测序;
[0024]第一序列比对模块,用于将第一Sanger测序模块得到的前端测序序列和所述目标DNA序列进行比对,获得比对上的前端测序序列;
[0025]引物设计模块,用于对所述目标DNA序列的剩余序列设计引物以测通所述目标DNA序列,获得引物集合;
[0026]第二Sanger测序模块,用于使用引物设计模块得到的所述引物集合对所述目标DNA样本进行Sanger测序,获得序列片段;
[0027]序列拼接模块,用于将第一Sanger测序模块得到的所述前端测序序列和第二Sanger测序模块得到的所述序列片段进行拼接组装,获得全长序列;
[0028]第二序列比对模块,用于将序列拼接模块得到的所述全长序列和所述目标DNA序列进行比对,判断所述目标DNA样本是否正常、缺失、突变、插入。
[0029]一种自动DNA序列验证的终端设备,所述终端设备包括存储器、与所述存储器连接的处理器、以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器运行所述计算机程序时实现如上述的方法的步骤。
[0030]采用上述方案,本专利技术的有益效果是:整个过程采用流程化、自动化的设计,减少各环节中的人为失误,同时使得每一批次结果标准统一;此外,可满足大数据的需求,极大提高效率。
附图说明
[0031]图1示出了本专利技术第一实施例提供的自动DNA序列验证的方法的流程示意图。
[0032]图2示出了本专利技术第二实施例提供的自动DNA序列验证的系统的流程示意图。
[0033]图3示出了本专利技术第三实施例提供的自动DNA序列验证的终端设备示意图。
具体实施方式
[0034]在下文中,将结合附图对本专利技术进行详细的描述。需理解,以下描述仅以示例方式来对本专利技术进行说明,而无意于对本专利技术的范围进行限制,本专利技术的保护范围以随附权利要求为准。并且,本领域技术人员理解,在不背离本专利技术的精神和主旨的情况下,可以对本专利技术的技术方案进行修改。若并未特别指明,实施例中所用的技术手段为本领域技术人员
所熟知的常规手段。
[0035]除非另有说明,否则本申请中使用的科学和技术名词具有本领域技术人员所通常理解的含义。为了更好地理解本专利技术,下面提供相关术语的定义和解释。
[0036]在本文中,术语“Sanger测序”与“一代测序”具有同样的含义,并可互换使用。Sanger测序是根据核苷酸在某一固定的点开始,随机在某一个特定的碱基处终止,并且在每个碱基后面进行荧光标记,产生以A、T、C、G结束的四组不同长度的一系列核苷酸,然后在尿素变性的PAGE胶上电泳进行检测,从而获得可见DNA碱基序列的一种方法。
[0037]在本文中,术语“前端测序序列”是指测序得到的目标DNA样本的5

至3

方向的序列,例如约前400、500、600、700或800bp序列,在一般情况下,Sanger测序可以测得1000bp长度的序列,但是仅有前800bp左右的序列可以保证其准确性,因此,在本专利技术中,第一次Sanger测序获得的前端测序序列为高准确性的约前400、500、600、700或800bp序列。
[0038]在本文中,术语“比对”,其英文为“alignment”,指一条测序读出序列与一条参考序列之间的对应结果,一条测序读出序列可以同时具有多个比对本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种自动DNA序列验证的方法,其特征在于,所述方法包括以下步骤:1)根据目标DNA序列从样本基因组中扩增获得目标DNA样本;2)对所述目标DNA样本设计引物,进行Sanger测序;3)将步骤2)得到的前端测序序列和所述目标DNA序列进行比对,获得比对上的前端测序序列;4)对所述目标DNA序列的剩余序列设计引物以测通所述目标DNA序列,获得引物集合;5)使用步骤4)得到的所述引物集合对所述目标DNA样本进行Sanger测序,获得序列片段;6)将步骤2)得到的所述前端测序序列和步骤5)得到的所述序列片段进行拼接组装,获得全长序列;7)将步骤6)得到的所述全长序列和所述目标DNA序列进行比对,判断所述目标DNA样本是否正常、缺失、突变、插入。2.根据权利要求1所述的方法,其特征在于,所述方法的3)、7)步骤中的所述比对使用BLAST。3.根据权利要求2所述的方法,其特征在于,所述方法的1)步骤后、2)步骤前还包括“使用BLAST对所述目标DNA序列进行建库”步骤。4.根据权利要求1

3中任一项所述的方法,其特征在于,所述方法的2)和4)步骤中的所述设计引物使用Primer3。5.根据权利要求1

4中任一项所述的方法,其特征在于,所述方法的6)步骤中的所述拼接组装使用CAP3。6.根据权利要求1

5中任一项所述的方法,其特征在于,所述方法的3)步骤中的所述比对上的前端测序序列是相似度≥80%、匹配长度≥600bp的序列。7.根据权利要求1

【专利技术属性】
技术研发人员:马石金许树涛赵春德
申请(专利权)人:天津擎科生物技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1