一种慢性心力衰竭患者PRO预后风险模型及构建方法技术

技术编号:35455649 阅读:10 留言:0更新日期:2022-11-03 12:13
本发明专利技术涉及机器学习和数据处理技术领域,公开了一种慢性心力衰竭患者报告结局(PRO)预后风险模型及构建方法。利用自行研制的慢性心力衰竭PRO测量工具(CHF

【技术实现步骤摘要】
一种慢性心力衰竭患者PRO预后风险模型及构建方法


[0001]本专利技术涉及机器学习和数据处理
,具体为一种慢性心力衰竭患者PRO预后风险模型及构建方法。

技术介绍

[0002]慢性心力衰竭是各种心血管疾病的终末阶段,尽管近年来心衰治疗取得很大的进展,但其再住院率、死亡率仍居高不下,这与疾病预后不良和院外管理“断崖式”下降密切相关。因此,建立科学的心衰患者院外评估体系/系统,实时评估患者病情,持续对患者进行全病程、全方位、多领域、多维度的预后评估,对于采取个性化的干预措施,改善患者预后具有重要意义。
[0003]目前,临床上多采用人口统计学数据、临床症状及体征、实验室化验、影像学检查及生物标志物等评估患者预后。此类资料虽可反映患者的状态,但预测效能有限,较少涉及患者心理、社会、治疗等领域的健康状态,且常忽略了患者自身对于疾病的感受和观点。而且现有类似的量表大多均来源于国外,缺乏跨文化调试,无法直接应用于我国国人的健康评估。因此,制定适用于我国国人的PRO测量工具对于评估患者健康状况、了解患者健康期望、制定患者管理方案至关重要。
[0004]此外,临床虽已开发了多种类型的风险预测模型,用以捕获患者总体风险,量化患者生存前景,但多惯用传统的统计模型,该类方法设定简单、解释性好,但预测能力有限,当数据结构复杂,不满足这些模型条件假定时,效果并不理想。而随着人类对疾病研究的加深,各种不同类型的数据陆续出现,数据结构的复杂性,使线性预测模型不得不因其局限性逐渐退出,与此同时大数据时代的发展使机器学习技术受到广泛关注,尤其是集成机器学习技术对于模型的改善效果更加显著。
[0005]综上所述,本申请利用自行研制的慢性心衰PRO测量工具(CHF

PROM),以量表的形式反映患者健康状况,同时,结合患者一般人口学资料构建慢性心衰预后风险模型,将其与慢性病患者的院外管理相联系,全面便捷地从“生物

心理

社会

环境”医学新模式角度出发,捕获患者疾病状态,合理指导患者院外管理。

技术实现思路

[0006]针对现有测量工具以及风险预测模型在预后评估中存在的问题本专利技术提供了一种慢性心力衰竭患者报告结局(PRO)预后风险模型及构建方法。
[0007]为了达到上述目的,本专利技术采用了下列技术方案:
[0008]本专利技术提供了一种慢性心力衰竭患者PRO预后风险模型的构建方法,包括以下步骤:
[0009]S1:研制慢性心力衰竭患者PRO测量工具,建立随访队列;
[0010]S2:数据预处理;包括异常值识别、缺失值填补、类别比例不均衡问题的处理和特征筛选;
[0011]S3:根据预处理后的数据构建预测模型,得到慢性心力衰竭患者PRO预后风险模型。
[0012]进一步,所述步骤S1具体包括以下步骤:
[0013]S11、慢性心力衰竭患者PRO测量工具研制
[0014]按照国际PRO测量工具研制规范,从生理领域、心理领域、社会领域和治疗领域出发,查阅国内外相关问卷及文献,结合专家意见与患者访谈的形式,形成初量表框架;
[0015]根据严格的纳入排除标准,招募105名慢性心衰患者和50名健康人进行预调查,采用经典测量理论和项目反应理论,对条目进行初步筛选和调整,形成初量表;
[0016]在365例患者,100例健康人群中进行大规模调查,并修改,形成终量表,即慢性心力衰竭患者PRO测量工具;
[0017]S12、随访队列构建
[0018]顺序纳入2年内,三所三级甲等医院符合纳入和排除标准的患者;
[0019]住院期间,收集患者的一般资料和PRO信息,患者出院后1个月、3个月和之后每6个月通过电话进行随访,随访内容为患者终点事件及发生时间。
[0020]进一步,所述步骤S2具体包括以下步骤:
[0021]S21、异常值识别:对原始数据集中的异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理;
[0022]S22、缺失值填补:对缺失比例大于30%的分类变量进行删除,对缺失比例不大于30%的分类变量采用missForest函数进行填补;
[0023]S23、类别比例不均衡问题的处理:使用SMOTE算法对数据不均衡问题进行处理;
[0024]S23、特征筛选:从患者的一般资料和PRO信息两个角度进行特征变量的收集,由于PRO测量工具部分的变量比较重要,且变量数目少,因此特征筛选工作仅对患者一般资料的变量进行;具体为,将患者一般资料的特征变量输入XGBoost模型中,进行特征重要性排序,并结合临床专家建议,选择排序靠前的16个变量与PRO测量工具中的4个变量作为最终的变量筛选结果,用于纳入最终的预测模型。
[0025]进一步,所述步骤S3预测模型构建的具体过程为:
[0026]将进行预处理后的数据输入logistic回归、随机森林模型(RF)、极限梯度增强学习机(XGBoost)、轻梯度提升机(LightGBM)、朴素贝叶斯(NB)和多层感知学习机(MLP)模型中,通过以下3个阶段构建预测模型,

以患者一般资料为自变量构建预测模型;

以患者一般资料+慢性心力衰竭患者报告结局测量工具CHF

PROM四个领域为自变量构建模型;

通过学习曲线和网格搜索对

的参数进行调整,得到各机器学习算法的最优配置;所有模型构建采用Python 3.7的各种软件包进行分析;
[0027]具体构建过程如下:
[0028]定义数据集D=(X
i
,y
i
),其中X
i
表示第i个样本的各特征变量,y
i
为第i个样本的预测变量;
[0029]构建决策树模型,定义函数f
k
代表第K棵数的权重;
[0030]定义目标函数为:式中l代表损失函数,用来衡量
与真实值(y
i
)之间的差距,Ω是正则项,用于防止模型过拟合;
[0031]对目标函数进行二阶泰勒展开结果如下:
[0032][0033]其中,g
i
和h
i
是第t棵残差树的参数,当目标函数值达到最小状态时,各参数取值为最优模型参数,其构建模型为当前最优的预测模型,const表示前面树的复杂度,即
[0034]更进一步,所述步骤S11中的终量表即慢性心力衰竭患者PRO测量工具包括4个领域共57个条目,其中生理领域(PHD)16条,心理领域(PSD)21条,社会领域(SOD)8条,治疗领域(TRE)12条,具体信息如下表:
[0035][0036]所述步骤S12中纳入标准为:根据ESC指南诊断为慢性心力衰竭,纽约心脏协会心功能II

IV级的患者;排除标准为:排除两个月前发生急本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种慢性心力衰竭患者PRO预后风险模型的构建方法,其特征在于,包括以下步骤:S1:研制慢性心力衰竭患者PRO测量工具,建立随访队列;S2:数据预处理;包括异常值识别、缺失值填补、类别比例不均衡问题的处理和特征筛选;S3:根据预处理后的数据构建预测模型,得到慢性心力衰竭患者PRO预后风险模型。2.根据权利要求1所述的慢性心力衰竭患者PRO预后风险模型的构建方法,其特征在于:所述步骤S1具体包括以下步骤:S11、慢性心力衰竭患者PRO测量工具研制按照国际PRO测量工具研制规范,从生理领域、心理领域、社会领域和治疗领域出发,查阅国内外相关问卷及文献,结合专家意见与患者访谈的形式,形成初量表框架;根据严格的纳入排除标准,招募105名慢性心衰患者和50名健康人进行预调查,采用经典测量理论和项目反应理论,对条目进行初步筛选和调整,形成初量表;在365例患者,100例健康人群中进行大规模调查,并修改,形成终量表,即慢性心力衰竭患者PRO测量工具;S12、随访队列构建顺序纳入2年内,三所三级甲等医院符合纳入和排除标准的患者;住院期间,收集患者的一般资料和PRO信息,患者出院后1个月、3个月和之后每6个月通过电话进行随访,随访内容为患者终点事件及发生时间。3.根据权利要求1所述的慢性心力衰竭患者PRO预后风险模型的构建方法,其特征在于:所述步骤S2具体包括以下步骤:S21、异常值识别:对原始数据集中的异常值进行识别,并与临床医师合作进行专业判断,进行删除或保留处理;S22、缺失值填补:对缺失比例大于30%的分类变量进行删除,对缺失比例不大于30%的分类变量采用missForest函数进行填补;S23、类别比例不均衡问题的处理:使用SMOTE算法对数据不均衡问题进行处理;S23、特征筛选:从患者的一般资料和PRO信息两个角度进行特征变量的收集,由于PRO测量工具部分的变量比较重要,且变量数目少,因此特征筛选工作仅对患者一般资料的变量进行;具体为,将患者一般资料的特征变量输入XGBoost模型中,进行特征重要性排序,并结合临床专家建议,选择排序靠前的16个变量与PRO测量工具中的4个变量作为最终的变量筛选结果,用于纳入最终的预测模型。4.根据权利要求1所述的慢性心力衰竭患者PRO预后风险模型的构建方法,其特征在于,所述步骤S3预测模型构建的具体过程为:将进行预处理后的数据输入logistic回归、随机森林模型RF、极限梯度增强学习机XGBoost、轻梯度提升机LightGBM、朴素贝叶斯NB和多层感知学习机MLP模型中,通过以下3个阶段构建预测模型,

以患者一般资料为自变量构建预测模型;

以患者一般资料+慢性心力衰竭患者报告结局测量工具CHF
‑...

【专利技术属性】
技术研发人员:田晶张岩波闫晶晶韩清华王磊杨弘胡晓娟杜宇涛韩港飞
申请(专利权)人:山西医科大学第一医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1