遗传变异致病性预测方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:32971772 阅读:16 留言:0更新日期:2022-04-09 11:39
本申请提供的遗传变异致病性预测方法、装置、存储介质及计算机设备,首先确定与待预测的基因变异位点对应的特征数据,接着通过遗传变异致病性预测模型来对该特征数据进行预测,并得到遗传变异致病性预测结果;由于遗传变异致病性预测模型是按照不同的致病性等级分类设计的多个目标预测子模型集成得到的,且每一目标预测子模型在训练时,都是以其对应的致病性等级分类的训练基因变异位点的特征数据作为训练样本,以训练基因变异位点的致病性等级分类作为样本标签进行训练的,同时训练样本包含了所有突变类型,因此,该遗传变异致病性预测模型适用于所有的突变类型,并能够根据输入的该基因变异位点的特征数据得到准确的遗传变异致病性预测结果。变异致病性预测结果。变异致病性预测结果。

【技术实现步骤摘要】
遗传变异致病性预测方法、装置、存储介质及计算机设备


[0001]本申请涉及基因检测
,尤其涉及一种遗传变异致病性预测方法、装置、存储介质及计算机设备。

技术介绍

[0002]随着高通量测序技术的逐渐成熟,成本不断下降,测序已成为临床研究和诊断的重要手段。经过多年的临床应用积累,各大公共基因组数据库已收集了大量变异位点信息,准确地解读这些变异位点是实现人类精准医疗的关键。
[0003]2015年,美国医学遗传学与基因组学学会(ACMG)发布了基因变异位点的分类及解读标准,将基因变异位点主要分为五大类:致病、可能致病、临床意义不明确、可能良性和良性,来评估变异位点的致病性和潜在风险。但是,目前常用的遗传变异致病性预测方法,主要针对的是错义突变或非同义突变,无法对所有的突变类型进行预测,且未考虑基因变异位点的细致分类,从而使得预测准确率不高。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中无法对所有的突变类型进行预测,从而使得预测准确率不高的技术缺陷。
[0005]本申请提供了一种遗传变异致病性预测方法,所述方法包括:
[0006]获取待预测的基因变异位点;
[0007]确定与所述待预测的基因变异位点对应的特征数据;
[0008]将所述特征数据输入至预先配置的遗传变异致病性预测模型,得到所述遗传变异致病性预测模型输出的遗传变异致病性预测结果;
[0009]其中,所述遗传变异致病性预测模型为按照不同的致病性等级分类设计的多个目标预测子模型集成得到的,且每一目标预测子模型以其对应的致病性等级分类的训练基因变异位点的特征数据作为训练样本,以所述训练基因变异位点的致病性等级分类作为样本标签训练得到的。
[0010]可选地,所述确定与所述待预测的基因变异位点对应的特征数据,包括:
[0011]调用本地注释文件,所述本地注释文件为预先从变异位点功能注释库中下载的注释文件;
[0012]在所述本地注释文件中查找与所述待预测的基因变异位点对应的特征数据;
[0013]若在所述本地注释文件中未查找到与所述待预测的基因变异位点对应的特征数据,则调用网页API接口,通过所述网页API接口获取与所述基因变异位点对应的特征数据。
[0014]可选地,所述将所述特征数据输入至预先配置的遗传变异致病性预测模型之前,还包括:
[0015]根据所述特征数据的缺失情况对所述特征数据添加衍生变量;
[0016]将所述衍生变量显示为缺失的特征数据进行补全;
[0017]对补全后的特征数据进行归一化处理。
[0018]可选地,每一目标预测子模型的训练过程,包括:
[0019]确定初始预测子模型,并获取所述初始预测子模型对应的致病性等级分类,以及所述致病性等级分类的训练基因变异位点的特征数据;
[0020]采用k折交叉验证的方式,将所述训练基因变异位点的特征数据划分为k个数据集,并进行k轮模型训练;
[0021]每轮模型训练时,选取其中一个数据集作为验证集,剩余数据集作为训练集,利用所述训练集中的特征数据对所述初始预测子模型进行训练,利用所述验证集中的特征数据对训练后的初始预测子模型进行验证,得到验证结果;
[0022]根据所述初始预测子模型对应的致病性等级分类,选取k轮模型训练的验证结果中预测准确率最高的模型作为目标预测子模型。
[0023]可选地,所述遗传变异致病性预测模型包括主方向预测层、方向矫正层、程度预测层和映射层;
[0024]将所述特征数据输入至预先配置的遗传变异致病性预测模型,得到所述遗传变异致病性预测模型输出的遗传变异致病性预测结果,包括:
[0025]将所述特征数据输入至所述主方向预测层中,对所述特征数据的遗传变异主方向进行预测,得到遗传变异主方向预测结果;
[0026]通过所述方向矫正层对所述遗传变异主方向预测结果的遗传变异主方向进行矫正,得到遗传变异主方向矫正结果;
[0027]利用所述程度预测层对所述遗传变异主方向矫正结果进行概率值预测,得到概率值预测结果;
[0028]通过所述映射层将所述概率值预测结果映射到对应的映射区间,得到最终的映射分值,并将所述映射分值作为遗传变异致病性预测结果。
[0029]可选地,所述目标预测子模型包括三分类模型和二分类模型;
[0030]所述三分类模型应用于所述主方向预测层和所述方向矫正层,所述二分类模型应用于所述方向矫正层和所述程度预测层。
[0031]可选地,应用于所述主方向预测层的三分类模型包括第一分类模型,所述第一分类模型用于对所述特征数据的遗传变异主方向进行预测,所述遗传变异主方向包括致病倾向、临床意义不明确和良性倾向;
[0032]应用于所述方向矫正层的三分类模型包括第二分类模型和第三分类模型,所述第二分类模型用于对所述遗传变异主方向中的致病、可能致病和临床意义不明确进行矫正,所述第三分类模型用于对所述遗传变异主方向中的良性、可能良性和临床意义不明确进行矫正;
[0033]应用于所述方向矫正层的二分类模型包括第四分类模型,所述第四分类模型用于对所述遗传变异主方向中的致病倾向和良性倾向进行矫正;
[0034]应用于所述程度预测层的二分类模型包括第五分类模型、第六分类模型、第七分类模型和第八分类模型;
[0035]其中,所述第五分类模型用于对所述遗传变异主方向矫正结果中致病或可能致病的概率值进行预测,所述第六分类模型用于对所述遗传变异主方向矫正结果中可能致病或
临床意义不明确的概率值进行预测,第七分类模型用于对所述遗传变异主方向矫正结果中良性或可能良性的概率值进行预测,所述第八分类模型用于对所述遗传变异主方向矫正结果中可能良性或临床意义不明确的概率值进行预测。
[0036]本申请还提供了一种遗传变异致病性预测装置,包括:
[0037]位点获取模块,用于获取待预测的基因变异位点;
[0038]特征确定模块,用于确定与所述待预测的基因变异位点对应的特征数据;
[0039]致病性预测模块,用于将所述特征数据输入至预先配置的遗传变异致病性预测模型,得到所述遗传变异致病性预测模型输出的遗传变异致病性预测结果;
[0040]其中,所述遗传变异致病性预测模型为按照不同的致病性等级分类设计的多个目标预测子模型集成得到的,且每一目标预测子模型以其对应的致病性等级分类的训练基因变异位点的特征数据作为训练样本,以所述训练基因变异位点的致病性等级分类作为样本标签训练得到的。
[0041]本申请还提供了一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上述实施例中任一项所述遗传变异致病性预测方法。
[0042]本申请还提供了一种计算机设备,其特征在于,包括:一个或多个处理器,以及存储器;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种遗传变异致病性预测方法,其特征在于,所述方法包括:获取待预测的基因变异位点;确定与所述待预测的基因变异位点对应的特征数据;将所述特征数据输入至预先配置的遗传变异致病性预测模型,得到所述遗传变异致病性预测模型输出的遗传变异致病性预测结果;其中,所述遗传变异致病性预测模型为按照不同的致病性等级分类设计的多个目标预测子模型集成得到的,且每一目标预测子模型以其对应的致病性等级分类的训练基因变异位点的特征数据作为训练样本,以所述训练基因变异位点的致病性等级分类作为样本标签训练得到的。2.根据权利要求1所述的方法,其特征在于,所述确定与所述待预测的基因变异位点对应的特征数据,包括:调用本地注释文件,所述本地注释文件为预先从变异位点功能注释库中下载的注释文件;在所述本地注释文件中查找与所述待预测的基因变异位点对应的特征数据;若在所述本地注释文件中未查找到与所述待预测的基因变异位点对应的特征数据,则调用网页API接口,通过所述网页API接口获取与所述基因变异位点对应的特征数据。3.根据权利要求1或2所述的方法,其特征在于,所述将所述特征数据输入至预先配置的遗传变异致病性预测模型之前,还包括:根据所述特征数据的缺失情况对所述特征数据添加衍生变量;将所述衍生变量显示为缺失的特征数据进行补全;对补全后的特征数据进行归一化处理。4.根据权利要求1

3中任一项所述的方法,其特征在于,每一目标预测子模型的训练过程,包括:确定初始预测子模型,并获取所述初始预测子模型对应的致病性等级分类,以及所述致病性等级分类的训练基因变异位点的特征数据;采用k折交叉验证的方式,将所述训练基因变异位点的特征数据划分为k个数据集,并进行k轮模型训练;每轮模型训练时,选取其中一个数据集作为验证集,剩余数据集作为训练集,利用所述训练集中的特征数据对所述初始预测子模型进行训练,利用所述验证集中的特征数据对训练后的初始预测子模型进行验证,得到验证结果;根据所述初始预测子模型对应的致病性等级分类,选取k轮模型训练的验证结果中预测准确率最高的模型作为目标预测子模型。5.根据权利要求1

4中任一项所述的方法,其特征在于,所述遗传变异致病性预测模型包括主方向预测层、方向矫正层、程度预测层和映射层;将所述特征数据输入至预先配置的遗传变异致病性预测模型,得到所述遗传变异致病性预测模型输出的遗传变异致病性预测结果,包括:将所述特征数据输入至所述主方向预测层中,对所述特征数据的遗传变异主方向进行预测,得到遗传变异主方向预测结果;通过所述方向矫正层对所述遗传变异主方向预测结果的遗传变异主方向进行矫正,得
到遗传变异主方向矫正结果;利用所述程度预测层对所述遗传变异主方向矫正结果进行概率值预测,得到概率值预测结果;通过所述...

【专利技术属性】
技术研发人员:彭继光韦荔全彭智宇
申请(专利权)人:深圳华大基因股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1