【技术实现步骤摘要】
胚系位点变异致病性预测方法、装置、终端及介质
[0001]本申请涉及生物行业分子检测
,特别是涉及胚系位点变异致病性预测方法、装置、终端及介质。
技术介绍
[0002]基因变异的解读对于临床决策有着重要指导意义,包括用药指导、治疗方式等。随着二代高通量测序技术的发展,越来越多的基因变异信息被发现,变异位点的临床解读也面临越来越大的挑战。尽管国际癌症研究机构(International Agency for Research on Cancer,IARC)、美国医学遗传学与基因组学学会(American College of Medical Genetics and Genomics,ACMG)和胚系突变等位基因解读实证联盟(Evidence
‑
based Network for the Interpretation of Germline Mutant Alleles,ENIGMA)等对于变异位点的解读提供了指导原则,将基因变异分为五种类型:致病性、可能致病性、意义不明、可能良性及良性。然而,这些解读 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种胚系位点变异致病性预测方法,其特征在于,包括:获取变异位点数据集,对所述变异位点数据集中的各变异位点数据按照是否为有害位点进行相应赋值,并基于一或多个基因变异指标对所述各变异位点数据进行功能性注释,以得到训练数据集;将基于卷积神经网络进行降维后的训练数据集输入XGBoost机器学习模型中,并使用基于样本平衡调整参数的损失函数,进行模型训练后得到用于胚系位点变异致病性预测的CNN
‑
XGBoost模型。2.根据权利要求1所述的胚系位点变异致病性预测方法,其特征在于,对所述变异位点数据集中的各变异位点数据按照是否为有害位点进行相应赋值包括:将所述变异位点数据集中的致病性变异位点数据和可能致病性变异位点数据按照有害位点进行赋值,并将所述变异位点数据集中的良性变异位点数据和可能良性变异位点数据按照无害位点进行赋值。3.根据权利要求1所述的胚系位点变异致病性预测方法,其特征在于,基于一或多个基因变异指标对所述各变异位点数据进行功能性注释包括:基于基因突变频率值和/或变异有害性预测值对所述各变异位点数据进行功能性注释。4.根据权利要求1所述的胚系位点变异致病性预测方法,其特征在于,所述基于样本平衡调整参数的损失函数包括:在Binary
‑
Logistic回归损失函数中引入β系数对分类概率进行适应性调整;引入β系数后的损失函数被表示为:其中,N表示样本数,y
i
表示第i个样本标签,p
i
表示第i个样本被分到第一类的概率;β为样本平衡调整参数。5.根据权利要求4所述的胚系位点变异致病性预测方法,其特征在于,还包括通过一阶偏导计算和二阶偏导计算对所述引入β系数后的损失函数进行迭代更新计算,计算方式如下:一阶偏导计算:gradient=p
i
(β
‑
βy
i
+y
i
)
‑
y
i
;二阶偏导计算:hessian=(y
i
+β
‑
βy
i
)p
i
(1
‑
技术研发人员:张博,杨峰,石涵,洪跟东,
申请(专利权)人:上海睿璟生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。