【技术实现步骤摘要】
一种糖尿病评分模型建立方法及糖尿病风险评分方法
[0001]本专利技术涉及数据处理
,具体涉及一种糖尿病评分模型建立方法及糖尿病风险评分方法。
技术介绍
[0002]糖尿病(Diabetes Mellitus,DM)是一种由于胰岛素分泌缺陷或胰岛素作用障碍所致的以高血糖为特征的代谢性疾病,其特点是慢性高血糖,伴有胰岛素分泌不足或作用障碍,导致碳水化合物、脂肪、蛋白质代谢紊乱,造成多种器官的慢性损伤、功能障碍衰竭。糖尿病最主要的表现是血中的葡萄糖含量过高及尿中有糖。糖尿病中90%为2型糖尿病(Type 2Diabetes Mellitus,T2DM),1型糖尿病仅占4%
‑
6%。2型糖尿病又名非胰岛素依赖型糖尿病(NIDDM),特点是人体自身能够产生胰岛素,但细胞无法对其作出反应,使胰岛素的效果大打折扣。
[0003]只有及早地发现糖尿病,提高人群中未诊糖尿病的检出率,才能对糖尿病风险进行干预,增强防治效果。传统的通过检测餐后血糖和糖化血红蛋白来确诊糖尿病的方式成本较高。考虑到糖尿病患病风险与个 ...
【技术保护点】
【技术特征摘要】
1.一种糖尿病评分模型建立方法,其特征在于,包括:通过预先建立的随机森林计算引发糖尿病的各变量的重要度;根据各变量的重要度确定重要变量;根据所述重要变量构建回归模型;利用所述回归模型生成列线图模型,将所述列线图模型作为所述糖尿病评分模型。2.根据权利要求1所述的糖尿病评分模型建立方法,其特征在于,通过预先建立的随机森林计算引发糖尿病的变量的重要度的步骤,包括:对多个初始样本进行有放回地随机抽取,形成多个自助样本,以及与各自助样本对应的袋外数据,各所述初始样本中包括多类变量;对所述袋外数据进行分类,得到各袋外数据对相应自助样本的第一投票分数;将其中一类变量的数值在各袋外数据中的顺序随机改变,形成第二测试样本;利用所述随机森林对新的测试样本进行分类,得到各自助样本的第二投票分数;根据所述第一投票分数和所述第二投票分数计算所述变量的重要度。3.根据权利要求2所述的糖尿病评分模型建立方法,其特征在于,通过如下公式计算所述变量的重要度:其中,score
i
表示第i类变量的重要度,b表示所述自助样本的数量,rate
j
表示第j个自助样本的第一投票分数,rate
ij
表示将第i类变量的数值在各袋外数据中的顺序随机改变后,第j个自助样本的第二投票分数,p表示变量的种类数量。4.根据权利要求1所述的糖尿病评分模型建立方法,其特征在于,根据所述重要变量构建回归模型的步骤,包括:建立logistic回归函数;通过最大似然估计方式,计算logistic回归函数中各个回归参数的值;结合各个回归参数的值确定logistic回归模型。5.根据权利要求4所述的糖尿病评分模型建立方法,其特征在于,logistic回归函数为:其中,β0,β1,β2,
…
,β
k
为常数项和自变量系数,x
1i
,x
2i
,
…
,x
ki
为自变量,用y
i
表示实际观测到的反应变量,y
i
=1表示事件发生,y
i
=0表示事件未发生,p
i
=P(y
i
=1)为待检测事件发生的概率,其中y
i
服从二项分布,即y
i
~B(1,p
i
)。6....
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。