【技术实现步骤摘要】
一种风险预测模型的构建方法、设备、终端及存储介质
[0001]本专利技术涉及风险预测模型
,特别涉及一种风险预测模型的构建方法、设备、终端及存储介质。
技术介绍
[0002]糖尿病合并冠心病,区别于普通冠心病患者,冠脉病变弥漫而且复杂,经常容易合并糖尿病自主神经病变,很多病人心脏缺血症状较为隐匿,不容易早期识别及干预,导致心血管死亡风险高,社会危害极大。随着本世纪冠心病治疗技术的发展,糖尿病合并冠心病患者的预后得到了显著改善,在一定情况下减少了由于心血管导致死亡的风险,已有的治疗方案包括:标准的药物治疗、在药物治疗基础上的冠脉介入治疗和冠脉搭桥等,但由于糖尿病合并冠心病涉及到的病变情况复杂,目前糖尿病合并冠心病患者的死亡率仍然很高。
[0003]目前的治疗策略可以改善糖尿病合并冠心病患者的长期预后,但仍然有部分患者生存周期有限。在此情况下,如果能准确预测糖尿病合并冠心病患者心血管死亡风险,以及对死亡风险影响因素贡献大小作评估,有助于准确识别高危的糖尿病合并冠心病患者,做到及时有效干预。
[0004]但现 ...
【技术保护点】
【技术特征摘要】
1.一种风险预测模型的构建方法,其特征在于,包括:步骤S1、获取糖尿病合并冠心病患者的多个属性数据;步骤S2、基于信息增益评价函数对各所述属性数据进行评估,得到各所述属性数据的信息增益,并基于多个所述属性数据组成数据集;步骤S3、初始化迭代次数N,N=1;步骤S4、第N次基于所述数据集在深度神经网络中进行训练生成模型;步骤S5、基于损失函数对所述模型进行性能评估,得到性能值;步骤S6、若所述性能值与初始模型的性能值的差值不大于性能阈值,从所述数据集剔除所述信息增益最小的一个或多个所述属性数据,并将所述迭代次数加1后作为N,返回步骤S4;所述初始模型为N=1时基于所有所述属性数据形成的所述数据集在深度神经网络中进行训练生成的;步骤S7、若所述性能值与所述初始模型的性能值的差值大于性能阈值,将第N-1次生成的模型作为用于预测糖尿病合并冠心病人的心血管死亡风险的最终模型。2.如权利要求1所述的方法,其特征在于,所述属性数据关联有病例样本的数据;所述步骤S2,包括:基于信息增益评价函数与所述病例样本的数据确定第一信息熵,且基于信息增益评价函数、所述属性数据及所述病例样本的数据确定第二信息熵;所述第一信息熵为所述病例样本中心血管死亡事件的信息熵;所述第二信息熵为不同的所述属性数据取值下的心血管死亡事件的信息熵;基于所述第一信息熵与所述第二信息熵的差值确定各所述属性数据的信息增益。3.如权利要求1或2所述的方法,其特征在于,所述信息增益评价函数为:G(D,A)=H(D)-H(D|A);其中,G(D,A)为所述信息增益;H(D)为第一信息熵;p
i
包括p0、p1;;N0和N1分别为所述属性数据对应的糖尿病合并冠心病患者中没有发生心血管死亡事件和发生心血管死亡事件的病例数;A为所述属性数据,a为所述属性数据的值;p(A=a)为所述属性数据的值为a时的概率;H(D|A=a)为当所述属性数据的值是a时的第二信息熵。4.如权利要求1所述的方法,其特征在于,所述步骤S6,包括:若所述性能值与初始模型的性能值的差值不大于性能阈值,基于预设的剔除阈值从所述数据集剔除所述信息增益最小的一个或多个所述属性数据;其中,剔除的一个所述属性数据的所述信息增益小于所述剔除阈值,或剔除的多个所述属性数据的所述信息增益的和小于所述剔除阈值。5.如权利要求1所述的方法,其特征在于,在将第N-1次生成的模型作为所述最终模型之后,该方法还包括:将第N-1次生成的模型对应的所述数据集中信息增益最小的所述属性数据作为第一属性数据;
将第N-2次生成的模型对应的所述数据集中信息增益最小的所述属性数据作为第二属性数据;基于所述第一属性数据与所述第二属性数据两者的信息增益确定针对所述属性数据的信息增益阈值。6.如权利要求1所述的方法,其特征在于,所述步骤S1,包括:获取糖尿病合并冠心病患者的病例样本;其中,所述病例样本包括没有发生心血管死亡的第一病例样本和发生心血管死亡的第二病例样本;所述第一病例样本的数量大于所述第二病例样本的数量;对所述第一病例样本进行随机下采样,以使所述第一病例样本的数量和所述第二病例样本的数量相同;在所述第一病例样本与第二病例样本中获取属性数据。7.如权利要求1所述的方法,其特征在于,所述步骤S4,包括:基于所述属性数据确定输入值,并基于...
【专利技术属性】
技术研发人员:冯新星,陈燕燕,
申请(专利权)人:中国医学科学院阜外医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。