一种个体化突变位点引物设计的方法及系统技术方案

技术编号:35925785 阅读:15 留言:0更新日期:2022-12-10 11:18
本发明专利技术提供的个体化突变位点引物设计的方法及系统,涉及生物信息学技术领域;其方法包括:获取验证位点,确定引物扩增的目标区域;结合人类参考基因组数据、dbSNP数据、人群频率数据库和本地人群频率库以及个体基因组突变数据,对目标区域进行检索、定位和标记,获得个体样本突变位点标记后的目标序列;根据目标序列,设计个体化突变位点引物;根据预设质控标准,评估设计的个体化突变位点引物是否合格,并输出质控合格的个体化突变位点引物;质控不合格则更换目标区域或人群频率数据库再设计引物。本发明专利技术引入个体样本突变设计引物,有效提高引物设计的成功率。提高引物设计的成功率。提高引物设计的成功率。

【技术实现步骤摘要】
一种个体化突变位点引物设计的方法及系统


[0001]本专利技术涉及生物信息学
,具体涉及一种个体化突变位点引物设计的方法及系统。

技术介绍

[0002]伴随着现代医学的快速发展,聚合酶链式反应(PCR)已经成为高通量测序中必不可少的一环,而引物作为PCR扩增中引导DNA自然复制的关键因素,决定着PCR扩增的成功率;引物的目标特异性、熔点、长度、错配率都决定了是否能够扩增出理想的DNA目标区域。
[0003]目前引物设计的思路都是对指定产物序列标记SNP位点,然后应用一些现有软件和算法得到合适的引物,最后再对于得到的引物进行评估,如果有多个结果则从中选择一个引物。这一方法有以下几个方面的弊端:
[0004](1)SNP位点具有地区特异性,如果单纯的指定一个人群频率数据库,有可能并不适用于当地SNP位点出现的情况,甚至有可能会因为标记了过多的SNP位点,导致无法设计出合适的引物。(2)没有考虑个体的突变位点,如果在指定的引物扩增区域中出现多个个体的突变位点,可能会由于错配率过高而导致扩增失败或者引物错误地扩增到其它区域。
[0005]因此,研究人员迫切需要一种新的技术方案,能够有效精确地根据实验需求,设计出具有个体化特异性的引物。

技术实现思路

[0006]本专利技术目的在于提供一种个体化突变位点引物设计的方法及系统,灵活选择符合当地人群特点的数据库,同时引入个体突变的情况进行引物设计,充分提高引物设计的成功率和实验室PCR扩增的成功率。
[0007]为达成上述目的,本专利技术提出如下技术方案:一种个体化突变位点引物设计的方法,包括:
[0008]获取验证位点,确定引物扩增的目标区域;
[0009]结合人类参考基因组数据、dbSNP数据、人群频率数据库和本地人群频率库以及个体基因组突变数据,对目标区域进行检索、定位和标记,获得个体样本突变位点标记后的目标序列;
[0010]根据目标序列,设计个体化突变位点引物;
[0011]根据预设质控标准,评估设计的个体化突变位点引物是否合格,并输出质控合格的个体化突变位点引物。
[0012]进一步的,所述确定引物扩增目标区域的具体过程为:
[0013]基于hg37版本的人类基因组数据或者是hg38版本的人类基因组数据指定验证位点;
[0014]指定验证位点扩增的上下游区间和目标区域;或,评估验证位点上下游区域的GC含量选择目标区域。
[0015]进一步的,所述获得个体样本突变位点标记后目标序列的具体过程为:
[0016]在人类参考基因组数据中检索目标区域,获得引物扩增序列;其中,人类参考基因组数据为人类基因组计划的hg37数据或hg38数据的FASTA文件;
[0017]结合dbSNP数据、人群频率数据库或本地人群频率库,根据IUPAC规则标记所述引物扩增序列中的SNP位点;
[0018]根据个体基因组突变数据和目标区域截取突变位点信息,标记个体样本突变位点至已标记SNP位点的引物扩增序列中,获得目标序列;其中,个体基因组突变数据为基于全基因组、全外显子或panel测序得到的vcf文件。
[0019]进一步的,所述预设质控标准的判定维度包括引物长度、GC含量、引物间距、退火温度和错配率。
[0020]进一步的,还包括评估个体样本突变位点对个体化突变位点引物的影响,确定引物是否合格;具体的,当个体化突变位点引物符合预设质控标准,且其上个体样本突变位点的占比不超过预设阈值,确定该引物合格;当个体化突变位点引物符合预设质控标准,且其上个体样本突变位点的占比超过预设阈值,确定该引物不合格。
[0021]本专利技术另一技术方案在于公开一种个体化突变位点引物设计的系统,该系统包括:
[0022]第一获取模块,用于获取验证位点,确定引物扩增的目标区域;
[0023]第二获取模块,用于结合人类参考基因组数据、dbSNP数据、人群频率数据库和本地人群频率库以及个体基因组突变数据,对目标区域进行检索、定位和标记,获得个体样本突变位点标记后的目标序列;
[0024]设计模块,用于根据目标序列,设计个体化突变位点引物;
[0025]第一评估模块,用于根据预设质控标准,评估设计的个体化突变位点引物是否合格;
[0026]输出模块,输出质控合格的个体化突变位点引物。
[0027]进一步的,所述第一获取模块确定引物扩增目标区域的执行单元包括:
[0028]指定单元,用于基于hg37版本的人类基因组数据或者是hg38版本的人类基因组数据指定验证位点;
[0029]指定选择单元,用于指定验证位点扩增的上下游区间和目标区域,或用于评估验证位点上下游区域的GC含量选择目标区域。
[0030]进一步的,所述第二获取模块获得个体样本突变位点标记后目标序列的执行单元包括:
[0031]检索单元,用于在人类参考基因组数据中检索目标区域,获得引物扩增序列;其中,人类参考基因组数据为人类基因组计划的hg37数据或hg38数据的FASTA文件;
[0032]第一标记单元,用于结合dbSNP数据、人群频率数据库或本地人群频率库,根据IUPAC规则标记所述引物扩增序列中的SNP位点;
[0033]第二标记单元,用于根据个体基因组突变数据和目标区域截取突变位点信息,标记个体样本突变位点至已标记SNP位点的引物扩增序列中,获得目标序列;其中,个体基因组突变数据为基于全基因组、全外显子或panel测序得到的vcf文件。
[0034]进一步的,所述评估模块评估依据的预设质控标准的判定维度包括引物长度、GC
含量、引物间距、退火温度和错配率。
[0035]进一步的,该系统还包括:
[0036]第二评估模块,用于评估个体样本突变位点对个体化突变位点引物的影响,确定引物是否合格;具体的,当个体化突变位点引物符合预设质控标准,且其上个体样本突变位点的占比不超过预设阈值,确定该引物合格;当个体化突变位点引物符合预设质控标准,且其上个体样本突变位点的占比超过预设阈值,确定该引物不合格。
[0037]由以上技术方案可知,本专利技术的技术方案获得了如下有益效果:
[0038]1)本方案在引物扩增序列中标记SNP位点时,灵活应用多种数据库,如dbSNP数据、人群频率数据库,有助于提高引物设计的成功率和准确性。
[0039]2)本方案将本地人群频率库应用到引物设计中,更有区域特点,有助于设计出更有针对性的引物。
[0040]3)本方案引入个体样本检测后的突变位点到引物设计中,有助于提高引物设计的成功率,减少错配率,进而提高实验室PCR扩增的成功率。
[0041]应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的专利技术主题的一部分。
[0042]结合附图从下面的描述中可以更加全面地理解本专利技术教导的前述和其他方面、实施例和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种个体化突变位点引物设计的方法,其特征在于,包括:获取验证位点,确定引物扩增的目标区域;结合人类参考基因组数据、dbSNP数据、人群频率数据库和本地人群频率库以及个体基因组突变数据,对目标区域进行检索、定位和标记,获得个体样本突变位点标记后的目标序列;根据目标序列,设计个体化突变位点引物;根据预设质控标准,评估设计的个体化突变位点引物是否合格,并输出质控合格的个体化突变位点引物。2.根据权利要求1所述的个体化突变位点引物设计的方法,其特征在于,所述确定引物扩增目标区域的具体过程为:基于hg37版本的人类基因组数据或者是hg38版本的人类基因组数据指定验证位点;指定验证位点扩增的上下游区间和目标区域;或,评估验证位点上下游区域的GC含量选择目标区域。3.根据权利要求1所述的个体化突变位点引物设计的方法,其特征在于,所述获得个体样本突变位点标记后目标序列的具体过程为:在人类参考基因组数据中检索目标区域,获得引物扩增序列;其中,人类参考基因组数据为人类基因组计划的hg37数据或hg38数据的FASTA文件;结合dbSNP数据、人群频率数据库或本地人群频率库,根据IUPAC规则标记所述引物扩增序列中的SNP位点;根据个体基因组突变数据和目标区域截取突变位点信息,标记个体样本突变位点至已标记SNP位点的引物扩增序列中,获得个体样本突变位点标记后的目标序列;其中,个体基因组突变数据为基于全基因组、全外显子或panel测序得到的vcf文件。4.根据权利要求1所述的个体化突变位点引物设计的方法,其特征在于,所述预设质控标准的判定维度包括引物长度、GC含量、引物间距、退火温度和错配率。5.根据权利要求1所述的个体化突变位点引物设计的方法,其特征在于,还包括评估个体样本突变位点对个体化突变位点引物的影响,确定引物是否合格;具体的,当个体化突变位点引物符合预设质控标准,且其上个体样本突变位点的占比不超过预设阈值,确定该引物合格;当个体化突变位点引物符合预设质控标准,且其上个体样本突变位点的占比超过预设阈值,确定该引物不合格。6.一种个体化突变位点引物设计的系统,其特征在于,包括:第一获取模块,用于获取验证位点,确定引物扩增的目标区域;第二获取模块,用...

【专利技术属性】
技术研发人员:范夕昊栗海波余伟师梁萌萌
申请(专利权)人:苏州赛美科基因科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1