进展为2型糖尿病的风险预测的方法、模型训练及装置制造方法及图纸

技术编号:34107178 阅读:15 留言:0更新日期:2022-07-12 00:40
本公开描述了一种进展为2型糖尿病的风险预测的方法、模型训练及装置,该模型训练包括选取多个受试者并在预设时间段内采集受试者的数据以获得初始样本数据;从初始样本数据中选取受试者在预设时间段的起始时间以前未确诊糖尿病且未存在除糖尿病以外的预设情况,以及受试者对应的因素数据的缺失程度符合预设要求的因素数据作为有效样本数据;获取有效样本数据对应的受试者的建模队列;基于单因素和多因素的回归分析对有效样本数据中与建模队列对应的数据进行分析以获取目标特征集;基于目标特征集确定自变量集并分别训练多个基于回归分析的模型以获取多个经训练模型以从中选择目标模型并生成列线图。由此,能够量化地预测未来进展为T2DM的风险。预测未来进展为T2DM的风险。预测未来进展为T2DM的风险。

【技术实现步骤摘要】
进展为2型糖尿病的风险预测的方法、模型训练及装置


[0001]本公开大体涉及2型糖尿病风险预测领域,具体涉及一种进展为2型糖尿病的风险预测的方法、模型训练及装置。

技术介绍

[0002]糖尿病的发展一般可以分为糖尿病前期和糖尿病,而血糖水平高于正常但还未达到糖尿病判断标准的状态可以称为糖尿病前期。在糖尿病前期一般没有明显的身体不适感,但随着病情的发展血糖会不断升高。若在糖尿病前期进行风险预测并积极控制还有机会逆转。因此,如何尽早识别糖尿病的风险显得至关重要。
[0003]目前,糖尿病前期的判断标准尚不统一,标准之间差异很大。一些专家开始研究糖尿病(例如2型糖尿病,T2DM)的风险预测的方法或工具。例如,Chung等在韩国人群中进行了一项横断面研究显示,其列线图模型可作为评估当前T2DM的风险的筛查工具。Wang等在我国华中地区人群中进行的一项随访研究显示,其列线图模型的风险因素没有纳入一些糖尿病判断指标(例如,糖负荷后两小时血糖和糖化血红蛋白)。Abbasi等综合评价了16项研究中的25个T2DM的风险待训练模型,其中包括12个仅包含无创指标的简易模型和13个包含血液学生化指标的复杂模型,大多数待训练模型可在5到10年内识别出罹患T2DM的高风险人群。
[0004]然而,Chung等的研究无法预测未来发生T2DM的风险。Wang等的研究无法评估研究人群的一些糖尿病判断指标的范围是否符合一般人群特征。Abbasi等的研究仅可以识别高风险人群,无法个体化定量评估未来发生T2DM的实际风险。因此,如何量化地预测未来进展为T2DM的风险,是亟待解决的问题。

技术实现思路

[0005]本公开是鉴于上述的状况而提出的,其目的在于提供一种能够纳入一些糖尿病判断指标进行风险预测且能够量化地预测未来进展为T2DM的风险的进展为2型糖尿病的风险预测的方法、模型训练及装置。
[0006]为此,本公开第一方面提供一种进展为2型糖尿病的风险预测的训练方法,包括在预设时间段的起始时间以前选取多个受试者,并在所述预设时间段内以预设频率采集各个受试者的数据以获得初始样本数据,其中,所述初始样本数据包括各个受试者的随时间变化的包括多个因素的因素数据;从所述初始样本数据中选取同时满足第一条件、第二条件和第三条件的因素数据作为有效样本数据,其中,所述第一条件为受试者在所述预设时间段的起始时间以前未确诊糖尿病,所述第二条件为受试者在所述预设时间段的起始时间以前未存在除糖尿病以外的预设情况,所述第三条件为受试者对应的因素数据的缺失程度符合预设要求;获取所述有效样本数据对应的受试者的建模队列;基于单因素的回归分析和多因素的回归分析对所述有效样本数据中与所述建模队列对应的建模数据集进行分析以获取目标特征集,其中,所述目标特征集包括由所述单因素的回归分析获得的保护因素集
和第一危险因素集、以及由所述多因素的回归分析获得的第二危险因素集;基于所述目标特征集确定不同的自变量集并分别训练多个待训练模型以获取多个经训练模型,其中,所述待训练模型是基于回归分析的模型;并且从所述多个经训练模型中选择目标模型,并基于所述目标模型生成列线图,其中,所述列线图用于获取进展为2型糖尿病的量化的风险预测结果。在这种情况下,能够基于列线图量化地预测未来进展为T2DM的风险,并且列线图纳入了一些糖尿病判断指标进行风险预测。
[0007]另外,在本公开的第一方面所涉及的训练方法中,可选地,由所述单因素的回归分析获得的保护因素集和第一危险因素集,包括:基于基线特征统计对所述有效样本数据的建模数据集进行分析以获取初始危险因素集和初始保护因素集;并且利用所述单因素的回归分析对所述有效样本数据的建模数据集进行分析以获取所述多个因素中的各个因素的第一关联性水平,若所述第一关联性水平小于预设水平,则将该因素加入单因素集,基于所述初始危险因素集、所述初始保护因素集和所述单因素集获取所述保护因素集和所述第一危险因素集。由此,能够结合基线特征统计和单因素的回归分析确定保护因素集和第一危险因素集。
[0008]另外,在本公开的第一方面所涉及的训练方法中,可选地,由所述多因素的回归分析获得的第二危险因素集,包括:利用所述多因素的回归分析对所述有效样本数据的建模数据集进行分析以获取所述多个因素中的各个因素的第二关联性水平,若所述第二关联性水平小于所述预设水平,则将该因素加入所述第二危险因素集。由此,能够基于多因素的回归分析确定第二危险因素集。
[0009]另外,在本公开的第一方面所涉及的训练方法中,可选地,所述第一危险因素集包括年龄、体质指数、收缩压、空腹血糖、糖负荷后两小时血糖、糖化血红蛋白、血肌酐、低密度脂蛋白胆固醇、甘油三酯、丙氨酸氨基转移酶、天冬氨酸氨基转移酶和γ

谷氨酰转肽酶;所述保护因素集包括为女性的性别和高密度脂蛋白胆固醇;所述第二危险因素集包括年龄、空腹血糖、糖负荷后两小时血糖和糖化血红蛋白。由此,能够确定目标特征集。
[0010]另外,在本公开的第一方面所涉及的训练方法中,可选地,所述预设情况包括肝功能不全、终末期肾病、癌症、糖皮质激素治疗、和存在手术史中的至少一种情况。由此,能够排除对预测进展为T2DM的风险具有负面影响的数据。
[0011]另外,在本公开的第一方面所涉及的训练方法中,可选地,基于所述目标模型生成列线图,包括:确定所述目标模型的预测方程,其中,所述回归分析为逻辑回归分析,所述预测方程满足公式:Y=b0+b1×
AGE+b2×
FPG+b3×
2hPG+b4×
HbA1c,其中,Y表示进展为2型糖尿病的概率,AGE表示年龄,FPG表示空腹血糖,2hPG表示糖负荷后两小时血糖,HbA1c表示糖化血红蛋白,b0、b1、b2、b3、b4为所述目标模型的伪决定系数;基于所述预测方程生成所述列线图。由此,能够确定逻辑回归分析对应的预测方程。另外,列线图涉及的因素的值均为连续的实际测量值,相较于采用危险因素的临界点或分段值来赋分的方案,能够提供更准确、更个体化的风险预测。
[0012]另外,在本公开的第一方面所涉及的训练方法中,可选地,基于所述目标特征集确定不同的自变量集并分别训练多个待训练模型以获取多个经训练模型,包括:从所述有效样本数据获取各个自变量集对应的子数据集;获取所述子数据集中与所述建模队列对应的建模数据集和与验证队列对应的验证数据集,其中,所述验证队列来源于所述初始样本数
据对应的受试者;利用该建模数据集对与所述子数据集对应的待训练模型进行训练;并且利用该验证数据集验证该待训练模型,进而最终获得对应的经训练模型。由此,能够基于自变量集对待训练模型进行训练以获取经训练模型。
[0013]本公开第二方面提供了一种进展为2型糖尿病的风险预测的训练装置,该训练装置包括:至少一个处理电路,所述至少一个处理电路被配置为执行本公开第一方面所述的训练方法。
[0014]本公开第三方面提供了一种进展为2型糖尿病的风险预测的方法,该方法包括获取待测者的待预测数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种进展为2型糖尿病的风险预测的训练方法,其特征在于,包括:在预设时间段的起始时间以前选取多个受试者,并在所述预设时间段内以预设频率采集各个受试者的数据以获得初始样本数据,其中,所述初始样本数据包括各个受试者的随时间变化的包括多个因素的因素数据;从所述初始样本数据中选取同时满足第一条件、第二条件和第三条件的因素数据作为有效样本数据,其中,所述第一条件为受试者在所述预设时间段的起始时间以前未确诊糖尿病,所述第二条件为受试者在所述预设时间段的起始时间以前未存在除糖尿病以外的预设情况,所述第三条件为受试者对应的因素数据的缺失程度符合预设要求;获取所述有效样本数据对应的受试者的建模队列;基于单因素的回归分析和多因素的回归分析对所述有效样本数据中与所述建模队列对应的建模数据集进行分析以获取目标特征集,其中,所述目标特征集包括由所述单因素的回归分析获得的保护因素集和第一危险因素集、以及由所述多因素的回归分析获得的第二危险因素集;基于所述目标特征集确定不同的自变量集并分别训练多个待训练模型以获取多个经训练模型,其中,所述待训练模型是基于回归分析的模型;并且从所述多个经训练模型中选择目标模型,并基于所述目标模型生成列线图,其中,所述列线图用于获取进展为2型糖尿病的量化的风险预测结果。2.根据权利要求1所述的训练方法,其特征在于,由所述单因素的回归分析获得的保护因素集和第一危险因素集,包括:基于基线特征统计对所述有效样本数据的建模数据集进行分析以获取初始危险因素集和初始保护因素集;并且利用所述单因素的回归分析对所述有效样本数据的建模数据集进行分析以获取所述多个因素中的各个因素的第一关联性水平,若所述第一关联性水平小于预设水平,则将该因素加入单因素集,基于所述初始危险因素集、所述初始保护因素集和所述单因素集获取所述保护因素集和所述第一危险因素集。3.根据权利要求2所述的训练方法,其特征在于,由所述多因素的回归分析获得的第二危险因素集,包括:利用所述多因素的回归分析对所述有效样本数据的建模数据集进行分析以获取所述多个因素中的各个因素的第二关联性水平,若所述第二关联性水平小于所述预设水平,则将该因素加入所述第二危险因素集。4.根据权利要求3所述的训练方法,其特征在于:所述第一危险因素集包括年龄、体质指数、收缩压、空腹血糖、糖负荷后两小时血糖、糖化血红蛋白、血肌酐...

【专利技术属性】
技术研发人员:陈丽侯新国梁凯刘金波王川闫飞王令舒
申请(专利权)人:山东大学齐鲁医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1