System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 疾病患病风险预测模型的构建方法、装置、设备及介质制造方法及图纸_技高网

疾病患病风险预测模型的构建方法、装置、设备及介质制造方法及图纸

技术编号:40559656 阅读:9 留言:0更新日期:2024-03-05 19:21
本发明专利技术实施例公开了一种疾病患病风险预测模型的构建方法、装置、设备及介质,涉及疾病预测技术领域,方法包括:从第一数据库中获取目标患者的基因数据,并从第二数据库中获取目标患者的非基因数据。然后将基因数据和非基因数据进行特征交叉得到交叉特征数据,并将交叉特征数据输入预设风险预测模型得到预测风险分值。最后将预测风险分值和标准风险分值进行比对得到比对结果,并根据比对结果调节训练预设风险预测模型用到的初始超参数,得到目标风险预测模型,通过综合目标患者的基因数据和非基因数据训练构建的目标风险预测模型能够提高对待检测患者的疾病患病风险预测的准确性。

【技术实现步骤摘要】

本专利技术涉及疾病预测,尤其涉及一种疾病患病风险预测模型的构建方法、装置、设备及介质


技术介绍

1、随着社会的发展和人类生活水平的提高,疾病已经成为影响人类生命和健康的重大问题。人们不仅需要治疗和护理的方法,更需要预测和控制疾病发生的能力,疾病风险预测的重要性不言而喻。以肿瘤为例,近年来,肿瘤的发病率呈现不断上升的趋势,严重危害人类生命健康,对肿瘤进行风险监测,以对其进行早期预防显得格外重要,目前常规的肿瘤早期筛查方法包括影像学筛查、内镜筛查、肿瘤标志物筛查等,但这些方法对肿瘤患病风险的预测准确性均较差。


技术实现思路

1、有鉴于此,本申请的目的之一在于提供一种疾病患病风险预测模型的构建方法、装置、计算机设备及计算机可读存储介质,能够至少解决上述部分技术问题。

2、第一方面,本申请实施例提供了一种疾病患病风险预测模型的构建方法,所述方法包括:

3、从第一数据库中获取目标患者的基因数据,并从第二数据库中获取所述目标患者的非基因数据,其中,所述目标患者为疾病感染患者;

4、将所述基因数据和所述非基因数据进行特征交叉得到交叉特征数据,并将所述交叉特征数据输入预设风险预测模型得到预测风险分值;

5、将所述预测风险分值和标准风险分值进行比对得到比对结果,并根据所述比对结果调节训练所述预设风险预测模型用到的初始超参数,得到目标风险预测模型,所述目标风险预测模型用于预测待检测患者的疾病患病风险。

6、在一种可能的实施方式中,所述将所述基因数据和所述非基因数据进行特征交叉得到交叉特征数据之前,所述方法还包括:

7、分别按第一预设处理方式处理所述基因数据和非基因数据,得到标准基因数据和标准非基因数据,所述第一预设处理方式为自然语言处理;

8、分别按第二预设处理方式处理所述标准基因数据和所述标准非基因数据,得到过滤后的标准基因数据和过滤后的标准非基因数据,所述第二预设处理方式包括删除重复数据、去噪、离群分析和聚类中的至少一种;

9、根据上采样和/或下采样方法分别对所述过滤后的标准基因数据和所述过滤后的标准非基因数据进行正负样本平衡处理,得到目标基因数据和目标非基因数据;

10、所述将所述基因数据和所述非基因数据进行特征交叉得到交叉特征数据,包括:

11、将所述目标基因数据和所述目标非基因数据进行特征交叉得到所述交叉特征数据。

12、在一种可能的实施方式中,所述基因数据包括至少一种肿瘤疾病的易感snp位点,及每个所述易感snp位点和至少一种肿瘤疾病之间的相关系数,所述非基因数据包括所述目标患者的年龄、性别、体重、群体、家族病史、工作信息和饮食信息中的至少一种,所述将所述目标基因数据和所述目标非基因数据进行特征交叉得到交叉特征数据,包括:

13、计算所述目标基因数据中每个所述易感snp位点的比值比,并按预设分类参数划分全部所述比值比得到至少两个比值比集合,其中,所述预设分类参数包括变量类型和癌种中的至少一种;

14、将所述至少两个比值比集合中的全部比值比同至少一种所述目标非基因数据进行特征交叉,得到所述交叉特征数据。

15、在一种可能的实施方式中,所述计算所述目标基因数据中每个所述易感snp位点的比值,包括:

16、计算所述目标基因数据中与目标相关系数对应的易感snp位点的比值比,其中,所述目标相关系数为大于或等于预设系数阈值的相关系数。

17、在一种可能的实施方式中,所述将所述预测风险分值和标准风险分值进行比对得到比对结果,并根据所述比对结果调节训练所述预测风险预测模型用到的初始超参数,得到目标风险预测模型,包括:

18、计算所述预测风险分值和所述标准风险分值之间差值的绝对值,得到目标差值;

19、在检测到所述目标差值在预设数值范围内的条件下,判定完成训练并得到所述目标风险预测模型;

20、在检测到所述目标差值不在所述预设数值范围内的条件下,调节所述初始超参数直至检测到所述目标差值在所述预设数值范围内,判断完成训练并得到所述目标风险预测模型。

21、在一种可能的实施方式中,所述初始超参数包括正则化参数、学习率和迭代次数中的至少一种。

22、在一种可能的实施方式中,所述根据所述比对结果调节训练所述预设风险预测模型用到的初始超参数,得到所述目标风险预测模型之后,所述方法还包括:

23、获取待检测患者的待检测基因数据和待检测非基因数据;

24、将所述待检测基因数据和所述待检测非基因数据进行特征交叉,得到待检测交叉特征数据,并将所述待检测交叉特征数据输入所述目标风险预测模型,得到所述待检测患者的目标预测风险分值;

25、从预设风险等级表中确定与所述目标预测风险分值对应的目标风险等级,所述目标风险等级包括正常风险等级、低风险等级和高风险等级。

26、第二方面,本申请实施例提供了一种疾病风险预测模型的构建装置,其所述装置包括:

27、数据获取模块,用于从第一数据库中获取目标患者的基因数据,并从第二数据库中获取所述目标患者的非基因数据,其中,所述目标患者为疾病感染患者;

28、数据处理模块,用于将所述基因数据和所述非基因数据进行特征交叉得到交叉特征数据,并将所述交叉特征数据输入预设风险预测模型得到预测风险分值;

29、数据计算模块,用于将所述预测风险分值和标准风险分值进行比对得到比对结果,并根据所述比对结果调节训练所述预设风险预测模型用到的初始超参数,得到目标风险预测模型,所述目标风险预测模型用于预测待检测患者的疾病患病风险。

30、第三方面,本申请实施例提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器执行时,实现第一方面提供的方法。

31、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序在被一个或多个处理器执行时,实现第一方面提供的方法。

32、本申请实施例提供的疾病患病风险预测模型的构建方法,通过从第一数据库中获取目标患者的基因数据,并从第二数据库中获取目标患者的非基因数据。然后将基因数据和非基因数据进行特征交叉得到交叉特征数据,并将交叉特征数据输入预设风险预测模型得到预测风险分值。最后将预测风险分值和标准风险分值进行比对得到比对结果,并根据比对结果调节训练预设风险预测模型用到的初始超参数,得到目标风险预测模型,通过综合目标患者的基因数据和非基因数据训练构建的目标风险预测模型能够提高对待检测患者的疾病患病风险预测的准确性。

本文档来自技高网...

【技术保护点】

1.一种疾病患病风险预测模型的构建方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述将所述基因数据和所述非基因数据进行特征交叉得到交叉特征数据之前,所述方法还包括:

3.如权利要求2所述的方法,其特征在于,所述基因数据包括至少一种肿瘤疾病的易感SNP位点,及每个所述易感SNP位点和至少一种肿瘤疾病之间的相关系数,所述非基因数据包括所述目标患者的年龄、性别、体重、群体、家族病史、工作信息和饮食信息中的至少一种,所述将所述目标基因数据和所述目标非基因数据进行特征交叉得到交叉特征数据,包括:

4.如权利要求3所述的方法,其特征在于,所述计算所述目标基因数据中每个所述易感SNP位点的比值,包括:

5.如权利要求1所述的方法,其特征在于,所述将所述预测风险分值和标准风险分值进行比对得到比对结果,并根据所述比对结果调节训练所述预测风险预测模型用到的初始超参数,得到目标风险预测模型,包括:

6.如权利要求1所述的方法,其特征在于,所述初始超参数包括正则化参数、学习率和迭代次数中的至少一种。

7.如权利要求1所述的方法,其特征在于,所述根据所述比对结果调节训练所述预设风险预测模型用到的初始超参数,得到所述目标风险预测模型之后,所述方法还包括:

8.一种疾病风险预测模型的构建装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述计算机程序在被所述处理器执行时实现权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,该计算机程序在被一个或多个处理器执行时,实现权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种疾病患病风险预测模型的构建方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述将所述基因数据和所述非基因数据进行特征交叉得到交叉特征数据之前,所述方法还包括:

3.如权利要求2所述的方法,其特征在于,所述基因数据包括至少一种肿瘤疾病的易感snp位点,及每个所述易感snp位点和至少一种肿瘤疾病之间的相关系数,所述非基因数据包括所述目标患者的年龄、性别、体重、群体、家族病史、工作信息和饮食信息中的至少一种,所述将所述目标基因数据和所述目标非基因数据进行特征交叉得到交叉特征数据,包括:

4.如权利要求3所述的方法,其特征在于,所述计算所述目标基因数据中每个所述易感snp位点的比值,包括:

5.如权利要求1所述的方法,其特征在于,所述将所述预测风险分值和标准风险分值进行比对得到比对结果,并根据所述比对结果...

【专利技术属性】
技术研发人员:陈欣魏彩霞吴彭春曾敬富段奉元杨鑫锐
申请(专利权)人:昆明金域医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1