群体频率与突变预测相结合的突变致病性检测方法及系统技术方案

技术编号:20450121 阅读:34 留言:0更新日期:2019-02-27 03:40
本发明专利技术公开了一种群体频率与突变预测相结合的突变致病性检测方法及系统,本发明专利技术的实施步骤包括:获取归一化后的突变预测检测结果A、群体频率检测结果B;将群体频率检测结果B通过预设的多项式拟合函数转换得到函数转换结果f(B),所述多项式拟合函数为将突变预测检测结果A作为函数值、群体频率检测结果B作为自变量进行拟合得到;将突变预测检测结果A、函数转换结果f(B)两者进行加权求和,得到群体频率与突变预测相结合的突变致病性检测结果。本发明专利技术实现了群体频率与突变预测两者的更科学地结合,能够提高突变致病性检测的准确度,具有致病性检测值准确率高、通用性好、扩展性高的优点。

【技术实现步骤摘要】
群体频率与突变预测相结合的突变致病性检测方法及系统
本专利技术涉及基因测序结果的解读技术,具体涉及一种群体频率与突变预测相结合的突变致病性检测方法及系统。
技术介绍
对基因测序的结果进行解读时,同一个基因往往存在多个基因突变,基因突变并不意味着疾病,但是基因突变可以作为致病性参考的指标。用户总是更关心致病性强的突变,如何准确检测突变的致病性,成为基因解读的关键。目前针对突变致病性检测方法可以分为突变预测和群体频率两种检测角度。(1)突变预测是基于个体的检测的角度,突变预测目前已经有多种突变预测方法,如SIFT、PolyPhen2、MutationTaster、DANN、CADD、primateAI等软件分别使用的方法,这些软件从不同的方面分析错义突变对蛋白质功能的影响,由此来预测突变可能的危害。例如,SIFT通过同源蛋白氨基酸的保守性实现突变预测;PolyPhen2通过分析突变对蛋白质折叠和蛋白质相互间作用实现突变预测;primateAI则对不同灵长类动物的基因突变数据进行学习,将结果用于人类突变预测等等。这六种突变预测软件的输出结果均可将转化为[0,1]区间内的取值,取值越高,则表示突变对蛋白质功能的影响更大,致病的可能性也越大。(2)群体频率MAF(MinorAlleleFrequency)是突变的群体频率,它从另一个维度探讨了突变的致病性,即突变在人群中越罕见,对应的群体频率值越小,则认为致病的可能性越大;相反,群体频率MAF的值越大,说明有较多的正常人群都具有这一突变,突变的致病性就越小。常见群体数据库有1000GenomesProject,ExomeVariantServer,TheExomeAggregationConsortium等,对应的群里频率值分别用1KGMAF、EVSMAF、ExACMAF表示。由于突变预测和群体频率两种检测角度截然不同,为了提高检测的准确度,可以将其进行综合。为了将群体频率结果和预测软件的结果进行组合,需要将群体频率的结果与突变预测的结果转化到具有相同分布和含义的区间内,目前常见的综合方式一般采用将所有结果取值归一化到[0,1]区间内再进行加权求和。但是,由于突变预测和群体频率两者的结果值对致病性的含义不同,不能直接利用加权平均的方式进行结果组合。例如群体频率MAF的值越小,致病的可能性越大,通常低于0.01才有较大的可能性致病,导致可能致病的结果取值区间范围非常小,如果直接与突变预测的结果进行加权平均,则无法突出群体频率MAF的值很小时对致病性的影响。因此,如何实现突变预测和群体频率两种检测角度的结合来提高突变致病性检测的准确度,已经成为一项亟待解决的关键技术问题。
技术实现思路
本专利技术要解决的技术问题:针对现有技术的上述问题,提供一种群体频率与突变预测相结合的突变致病性检测方法及系统,本专利技术将群体频率的值转化为突变预测值对应的区间,使它们的输出处于相同的取值范围具有相同的含义,然后利用加权求和的方法对它们的取值进行组合,形成突变的致病性检测结果,从而实现了群体频率与突变预测两者的更科学地结合,能够提高突变致病性检测的准确度,具有致病性检测值准确率高、通用性好、扩展性高的优点。为了解决上述技术问题,本专利技术采用的技术方案为:本专利技术提供一种群体频率与突变预测相结合的突变致病性检测方法,实施步骤包括:1)获取归一化后的突变预测检测结果A、群体频率检测结果B;2)将群体频率检测结果B通过预设的多项式拟合函数f(x)转换得到函数转换结果f(B),所述多项式拟合函数为将大量突变的突变预测检测结果A作为因变量、群体频率检测结果B作为自变量进行多项式拟合得到;3)将突变预测检测结果A、函数转换结果f(B)两者进行加权求和,得到群体频率与突变预测相结合的突变致病性检测结果。可选地,步骤1)中获取归一化后的突变预测检测结果A具体是指获取一种突变预测方法的检测结果进行归一化后作为突变预测检测结果A,或者获取两种或两种以上突变预测方法的检测结果分别进行归一化后再取平均值作为突变预测检测结果A。可选地,步骤1)中获取群体频率检测结果B具体是指获取一种群体频率检测方法的归一化检测结果作为群体频率检测结果B,或者获取两种或两种以上群体频率检测方法的归一化检测结果取平均值作为群体频率检测结果B。可选地,步骤2)中多项式拟合函数的函数表达式如式(1)所示;式(1)中,f(x)为转换函数,ai为i次项的拟合系数,n为拟合多项式函数f(x)的次数。可选地,步骤3)中将突变预测检测结果A、函数转换结果f(B)两者进行加权求和的函数表达式如式(2)所示;GTX_s=w1A+w2f(B)(2)式(2)中,GTX_s为得到的群体频率与突变预测相结合的突变致病性检测结果,A为突变预测检测结果A,f(B)为函数转换结果,w1和w2为权重系数。可选地,权重系数w1取值为0.7,权重系数w2取值为0.3。本专利技术还提供一种群体频率与突变预测相结合的突变致病性检测系统,包括计算机设备,所述计算机设备被编程以执行本专利技术前述群体频率与突变预测相结合的突变致病性检测方法的步骤,或者所述计算机设备的存储介质存储有被编程以执行本专利技术前述群体频率与突变预测相结合的突变致病性检测方法的计算机程序。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有被编程以执行本专利技术前述群体频率与突变预测相结合的突变致病性检测方法的计算机程序。本专利技术还提供一种群体频率与突变预测相结合的突变致病性检测系统,包括:归一化程序单元,用于获取归一化后的突变预测检测结果A、群体频率检测结果B;多项式拟合程序单元,用于将群体频率检测结果B通过预设的多项式拟合函数转换得到函数转换结果f(B),所述多项式拟合函数为将大量突变的突变预测检测结果A作为因变量、群体频率检测结果B作为自变量进行多项式拟合得到;加权求和程序单元,用于将突变预测检测结果A、函数转换结果f(B)两者进行加权求和,得到群体频率与突变预测相结合的突变致病性检测结果。可选地,所述多项式拟合程序单元所使用多项式拟合函数的函数表达式如式(1)所示;式(1)中,f(x)为转换函数,ai为i次项的拟合系数,n为拟合多项式函数f(x)的次数。和现有技术相比,本专利技术具有下述优点:1、本专利技术通过多项式拟合函数建立了群体频率的群体频率检测结果B与突变预测检测结果A之间的关系,使得突变预测检测结果A和函数转换结果f(B)的取值范围及其对应的含义一致,本专利技术将群体频率检测结果B的值转化为突变预测检测结果A对应的区间,使它们的输出处于相同的取值范围具有相同的含义,然后利用加权求和的方法对它们的取值进行组合形成突变的致病性检测结果,即能够利用加权平均的方式对两组不同类型的结果进行组合,从而得出突变的致病性检测值,具有致病性检测值准确率高的优点。2、本专利技术群体频率与突变预测相结合的突变致病性检测方法通过将群体频率与突变预测相结合,不局限于某一种群体频率检测方法、也不局限于某一种突变预测方法,群体频率方法与突变预测方法的数量可以根据需要进行灵活选择,不仅可以利用现有的,群体频率方法与突变预测方法,而且还可以适用于以后出现的新的群体频率方法与突变预测方法,具有通用性好、扩展性高的优点。附图说明图1为本专利技术实施例本文档来自技高网
...

【技术保护点】
1.一种群体频率与突变预测相结合的突变致病性检测方法,其特征在于实施步骤包括:1)获取归一化后的突变预测检测结果A、群体频率检测结果B;2)将群体频率检测结果B通过预设的多项式拟合函数f(x)转换得到函数转换结果f(B),所述多项式拟合函数为将大量突变的突变预测检测结果A作为因变量、群体频率检测结果B作为自变量进行多项式拟合得到;3)将突变预测检测结果A、函数转换结果f(B)两者进行加权求和,得到群体频率与突变预测相结合的突变致病性检测结果。

【技术特征摘要】
1.一种群体频率与突变预测相结合的突变致病性检测方法,其特征在于实施步骤包括:1)获取归一化后的突变预测检测结果A、群体频率检测结果B;2)将群体频率检测结果B通过预设的多项式拟合函数f(x)转换得到函数转换结果f(B),所述多项式拟合函数为将大量突变的突变预测检测结果A作为因变量、群体频率检测结果B作为自变量进行多项式拟合得到;3)将突变预测检测结果A、函数转换结果f(B)两者进行加权求和,得到群体频率与突变预测相结合的突变致病性检测结果。2.根据权利要求1所述的群体频率与突变预测相结合的突变致病性检测方法,其特征在于,步骤1)中获取归一化后的突变预测检测结果A具体是指获取一种突变预测方法的检测结果进行归一化后作为突变预测检测结果A,或者获取两种或两种以上突变预测方法的检测结果分别进行归一化后再取平均值作为突变预测检测结果A。3.根据权利要求1所述的群体频率与突变预测相结合的突变致病性检测方法,其特征在于,步骤1)中获取群体频率检测结果B具体是指获取一种群体频率检测方法的归一化检测结果作为群体频率检测结果B,或者获取两种或两种以上群体频率检测方法的归一化检测结果取平均值作为群体频率检测结果B。4.根据权利要求1所述的群体频率与突变预测相结合的突变致病性检测方法,其特征在于,步骤2)中多项式拟合函数的函数表达式如式(1)所示;式(1)中,f(x)为转换函数,ai为i次项的拟合系数,n为拟合多项式函数f(x)的次数。5.根据权利要求1所述的群体频率与突变预测相结合的突变致病性检测方法,其特征在于,步骤3)中将突变预测检测结果A、函数转换结果f(B)两者进行加权求和的函数表达式如式(2)所示;GTX_s=w1A+w2f(B)(2)式(2)中,GTX_s...

【专利技术属性】
技术研发人员:蒋艳凰赵强利宋卓李根张少伟余硕军马丑贤冯博伦
申请(专利权)人:人和未来生物科技长沙有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利