Sanger基因测序结果快速判读方法、系统及介质技术方案

技术编号:39185230 阅读:5 留言:0更新日期:2023-10-27 08:32
本发明专利技术属于基因测序领域,提供了一种Sanger基因测序结果快速判读方法、系统及介质。其中,Sanger基因测序结果快速判读方法包括获取Sanger基因测序文件,基于所述测序文件提取每个测序位点的四个碱基的信号值,判断每个测序位点的纯合或杂合状态,生成主要序列和次要序列;获取配置文件信息,根据靶位点的锚定序列在主序列中定位靶位点的位置,进而确定出靶位点的纯合或杂合状态并提取出主要序列和次要序列中的靶位点碱基,得到靶位点的基因型;根据靶位点的基因型及靶位点的位置,输出基因型或氨基酸报告。基因型或氨基酸报告。基因型或氨基酸报告。

【技术实现步骤摘要】
Sanger基因测序结果快速判读方法、系统及介质


[0001]本专利技术属于基因测序领域,尤其涉及一种Sanger基因测序结果快速判读方法、系统及介质。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]Sanger基因测序是一种广泛应用于生命科学各研究领域的基因型鉴定方法。其原理是利用一种DNA聚合酶来延伸结合在待定序列模板上的引物,直到掺入一种链终止核苷酸为止。每个反应含有A、T、C、G四种碱基的脱氧核苷酸三磷酸(dNTP),并混入对应A、T、C、G四种碱基的双脱氧核苷三磷酸(ddNTP),由于ddNTP缺乏延伸反应所需要的3
’‑
OH基团,使得DNA延伸反应停止在当前ddNTP处。由于dNTP或ddNTP是随机结合到序列模板上的,整个反应体系中形成一组起始点相同,终止点不同的长短不一的链终止产物混合物,通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X

光胶片放射自显影或非同位素标记进行检测。
[0004]Sanger测序技术(双脱氧链终止法)是应用广泛的第一代DNA测序技术的典型代表。尽管Sanger测序被广泛用于人类分子诊断和动物育种,但Sanger测序的软件包随着时间的推移进展甚微。在临床实验室中,最广泛使用的软件包是商业软件,如Sequencher(Gene Codes,美国密歇根州安娜堡)、Mutation Surveyor(SoftGenetics,宾夕法尼亚州州立学院)和SeqScape(Thermo Fisher Scientific,美国马萨诸塞州沃尔瑟姆)。大多数免费软件包都已经过时,并且在功能和运行平台方面存在较多限制。
[0005]测序公司返回的测序结果是ABI格式的文件,该文件记录了一个序列的四个碱基的峰值图。使用带有可视化窗口的软件,用户需要打开测序文件来查看基本峰值图和基本序列。打开文件后,用户可以在软件搜索框中输入包含检测位点(或与检测位点相邻)的序列,也可以用肉眼识别该序列,从测序峰图的序列中找到检测位点并识别检测基因型。
[0006]目前,Sanger测序结果识别均采用手动截屏识别方法,但是该方法仅适用于处理少量Sanger测序结果,当遇到异常测序峰(将正常杂合双峰测量为两个单峰)时,可能会错误地识别基因型。当测试样本很多,并且每个样本都有多个检测点时,例如:临床确认测试中的样本量从数百到数千不等,每个样本有多个检测位点(通常在10到20个之间),手动截图识别过程将耗时、效率低下,并且容易出错。

技术实现思路

[0007]为了解决上述
技术介绍
中存在的技术问题,本专利技术提供一种Sanger基因测序结果快速判读方法、系统及介质,其可自动化、快速处理大量检测样本的Sanger测序结果,不再需要人工肉眼定位靶位点位置和判读基因型,并且能直接给出靶位点基因型或对应氨基酸的报告,大幅提高了工作效率,同时避免了可能存在的人为失误。
[0008]为了实现上述目的,本专利技术采用如下技术方案:
[0009]本专利技术的第一个方面提供一种Sanger基因测序结果快速判读方法。
[0010]一种Sanger基因测序结果快速判读方法,其包括:
[0011]获取Sanger基因测序文件,基于所述测序文件提取每个测序位点的四个碱基的信号值,判断每个测序位点的纯合或杂合状态,生成主要序列和次要序列;
[0012]获取配置文件信息,根据靶位点的锚定序列在主序列中定位靶位点的位置,进而确定出靶位点的纯合或杂合状态并提取出主要序列和次要序列中的靶位点碱基,得到靶位点的基因型;
[0013]根据靶位点的基因型及靶位点的位置,输出基因型或氨基酸报告。
[0014]作为一种实施方式,所述主要序列由每个测序位点的信号值顺序排第一位的碱基组成,所述次要序列则由每个测序位点的信号值顺序排第二位的碱基组成。
[0015]作为一种实施方式,对每一个测序位点的四个碱基的信号值进行从大到小排序,根据排第二位碱基信号值与排第一位碱基信号值的比例,判断每一个测序位点是纯合状态还是杂合状态。
[0016]作为一种实施方式,若排第二位碱基信号值与排第一位碱基信号值的比例小于预设比例阈值,则判断该测序位点为纯合位点,对应碱基为顺序排第一位碱基;
[0017]若排第二位碱基信号值与排第一位碱基信号值的比例大于或等于预设比例阈值,则判断该测序位点为杂合位点,对应碱基为顺序排第一位碱基和顺序排第二位碱基。
[0018]作为一种实施方式,对每一个测序位点的四个碱基的信号值进行从大到小排序之前还包括:
[0019]每一个测序位点的四个碱基的信号值进行归一化处理。
[0020]作为一种实施方式,根据锚定序列信息在主要序列中定位靶位点的位置,获取靶位点在主要序列中的坐标;
[0021]根据靶位点在主要序列中的坐标,获取该位点的纯合或杂合信息;
[0022]如果该位点为纯合,则该位点的基因型为主要序列中碱基的纯合型;
[0023]如果该位点为杂合,则该位点的基因型为主要序列中的碱基和次要序列中的碱基组成的杂合型。
[0024]作为一种实施方式,如果靶位点的位置处于非编码区,则直接报告基因型;
[0025]如果靶位点的位置处于编码区,则首先报告密码子的基因型,然后报告密码子基因型对应的氨基酸。
[0026]本专利技术的第二个方面提供一种Sanger基因测序结果快速判读系统。
[0027]一种Sanger基因测序结果快速判读系统,其包括:
[0028]序列生成模块,其用于获取Sanger基因测序文件,基于所述测序文件提取每个测序位点的四个碱基的信号值,判断每个测序位点的纯合或杂合状态,生成主要序列和次要序列;
[0029]基因型确定模块,其用于获取配置文件信息,根据靶位点的锚定序列在主序列中定位靶位点的位置,进而确定出靶位点的纯合或杂合状态并提取出主要序列和次要序列中的靶位点碱基,得到靶位点的基因型;
[0030]结果输出模块,其用于根据靶位点的基因型及靶位点的位置,输出基因型或氨基
酸报告。
[0031]本专利技术的第三个方面提供一种计算机可读存储介质。
[0032]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述所述的Sanger基因测序结果快速判读方法中的步骤。
[0033]本专利技术的第四个方面提供一种电子设备。
[0034]一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述所述的Sanger基因测序结果快速判读方法中的步骤。
[0035]与现有技术相比,本专利技术的有益效果是:
[0036]本专利技术的Sanger基因测序结果快速判读方法和系统,通过提取测序文件的每个位点的四个碱基的信号值,判断每个位点的纯合或杂合状态生成主要序列和次要序本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种Sanger基因测序结果快速判读方法,其特征在于,包括:获取Sanger基因测序文件,基于所述测序文件提取每个测序位点的四个碱基的信号值,判断每个测序位点的纯合或杂合状态,生成主要序列和次要序列;获取配置文件信息,根据靶位点的锚定序列在主序列中定位靶位点的位置,进而确定出靶位点的纯合或杂合状态并提取出主要序列和次要序列中的靶位点碱基,得到靶位点的基因型;根据靶位点的基因型及靶位点的位置,输出基因型或氨基酸报告。2.如权利要求1所述的Sanger基因测序结果快速判读方法,其特征在于,所述主要序列由每个测序位点的信号值顺序排第一位的碱基组成,所述次要序列则由每个测序位点的信号值顺序排第二位的碱基组成。3.如权利要求1或2所述的Sanger基因测序结果快速判读方法,其特征在于,对每一个测序位点的四个碱基的信号值进行从大到小排序,根据排第二位碱基信号值与排第一位碱基信号值的比例,判断每一个测序位点是纯合状态还是杂合状态。4.如权利要求3所述的Sanger基因测序结果快速判读方法,其特征在于,若排第二位碱基信号值与排第一位碱基信号值的比例小于预设比例阈值,则判断该测序位点为纯合位点,对应碱基为顺序排第一位碱基;若排第二位碱基信号值与排第一位碱基信号值的比例大于或等于预设比例阈值,则判断该测序位点为杂合位点,对应碱基为顺序排第一位碱基和顺序排第二位碱基。5.如权利要求3所述的Sanger基因测序结果快速判读方法,其特征在于,对每一个测序位点的四个碱基的信号值进行从大到小排序之前还包括:每一个测序位点的四个碱基的信号值进行归一化处理。6.如权利要求1所述的Sanger基因测序结果快速判读方法,其特征在于...

【专利技术属性】
技术研发人员:王金鹏黄金明鞠志花王秀革高亚平刘文浩杨春红肖遥张亚冉魏晓超姜强张桂香刘丑生邱小田李姣李广栋
申请(专利权)人:全国畜牧总站
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1