一种基于机器学习预测氯吡格雷治疗时发生制造技术

技术编号:39721053 阅读:10 留言:0更新日期:2023-12-17 23:27
本发明专利技术公开了一种基于机器学习预测氯吡格雷治疗时发生

【技术实现步骤摘要】
一种基于机器学习预测氯吡格雷治疗时发生HTPR风险的系统和方法


[0001]本专利技术属于医疗风险预测领域,特别涉及一种基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统和方法


技术介绍

[0002]阿司匹林联合
P2Y12
受体拮抗剂双联抗血小板已被证实可显著降低经皮冠状动脉介入
(PCI)
术后患者的主要不良心血管事件

尽管普拉格雷和替格瑞洛在降低缺血性事件方面具有明显的优势,氯吡格雷因相对较低的出血风险和医疗费用较少而广泛应用

然而,氯吡格雷的药效学效果受个体间差异的影响

氯吡格雷治疗后血小板高反应性
(HTPR)
为发生缺血性事件的主要原因之一

国内外报道接受规范的双联抗血小板治疗的患者
HTPR
的发生率为4%

46
%,该类患者发生缺血性事件的比例为氯吡格雷治疗后血小板反应最佳的患者血栓形成风险高
2.73
倍,死亡风险高
1.5


重要的是,通过识别潜在的
HTPR
相关危险因素,上述不良事件是可以提前预防的

[0003]目前,
ABCD

GENE
等评分工具已广泛应用于
PCI
治疗术后氯吡格雷治疗时发生
HTPR
的风险预测
/>对于
HTPR
发生风险高的患者,应将氯吡格雷升级为普拉格雷或替格瑞洛

然而,
ABCD

GENE
等评分工具多针对高加索人,高加索人
HTPR
的发生率为5%

44
%,而亚洲人
HTPR
的发生率为
20


65


此外,
HTPR
与预测因子之间可能存在复杂的非线性关系,传统的逻辑回归模型仅能分析线性关系,影响
HTPR
预测模型的准确性


技术实现思路

[0004]本专利技术的目的是针对现有技术的缺陷,提供一种基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统和方法

[0005]为了实现上述目的,本专利技术采用以下技术方案:一种基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统,包括:
[0006]数据收集模块,用于提取患者信息;
[0007]数据预处理模块,用于对所收集的信息进行清洗

规范化,并对数据进行筛选,同时评价模型的预测能力并优化模型,基于优化后的模型筛选出最优特征变量组合;
[0008]模型训练模块,用于将筛选出的最优特征变量组合作为建模变量,构建新的建模数据集作为自变量,基于
XGBoost
算法构建
HTPR
预测模型并训练模型;
[0009]预测模块,用于将训练好的模型对患者
PCI
术后氯吡格雷治疗后是否发生
HTPR
进行预测

[0010]进一步的,患者信息包括人口统计学信息

既往史

合并疾病

药物使用信息

实验室检验值信息

基因信息

诊断信息

[0011]进一步的,数据预处理模块包括:
[0012]数据清洗子模块,用于对患者信息数据进行去重

排序,并剔除缺失超过阈值的数
据;
[0013]数据规范化子模块,用于对清洗后的患者信息数据进行热编码或数字编码,或者根据阈值划分为二分类;
[0014]变量初筛子模块,用于对规范后的数据采用
Pearson
相关性检验和
Mann

Whitney U
检验对自变量和目标变量进行相关性检验,删除不相关和显著性差的变量,保留相关和显著性的变量,针对二分类变量,剔除极度不平衡的变量,并剔除数据缺失率超过阈值的变量;
[0015]变量插补子模块,用于对初筛后的变量利用随机森林算法对存在缺失值的变量进行插补;特征变量筛选子模块,用于评价模型的预测能力并优化模型,基于优化后的模型筛选出最优特征变量组合

[0016]进一步的,特征变量筛选子模块具体采用以下步骤筛选出最优特征变量组合:采用基于
RF
的特征序列前向选择算法对重要性得分大于0的变量做最终变量筛选,从空集开始搜索特征,每次把一个特征添加到特征子集中,并进行建模使得评价指标达到最优值,最终筛选出最佳的特征组合

[0017]进一步的,模型训练模块采用以下步骤进行预测模型训练:
[0018](1)
用筛选出的最优特征变量组合构建新的建模数据集;
[0019](2)
对建模数据集划分训练和测试数据集;
[0020](3)
将训练集用于训练模型进行训练,模型经过多次迭代后,连续设定迭代次数的性能指标相差不超过设定阈值时,判定模型在此训练集上已训练好,并通过网格搜索的方式调节模型超参数;
[0021](4)
利用训练和测试数据集中的交叉验证集验证模型性能的稳定性和泛化能力,当模型在交叉验证集上表现出的性能与训练集上性能一致时,判定模型具有较强的泛化能力;
[0022](5)
在测试集上测试模型性能

[0023]一种基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的方法,包括以下步骤:
[0024](1)
提取患者信息;
[0025](2)
对所收集的信息进行清洗

规范化,并对数据进行筛选,同时评价模型的预测能力并优化模型,基于优化后的模型筛选出最优特征变量组合;
[0026](3)
将筛选出的最优特征变量组合作为建模变量,构建新的建模数据集作为自变量,基于
XGBoost
算法构建
HTPR
预测模型并训练模型;
[0027](4)
将训练好的模型对患者
PCI
术后氯吡格雷治疗后是否发生
HTPR
进行预测

[0028]进一步的,步骤
(1)
中患者信息包括人口统计学信息

既往史

合并疾病

药物使用信息

实验室检验值信息

基因信息

诊断信息

[0029本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统,其特征在于包括:数据收集模块,用于提取患者信息;数据预处理模块,用于对所收集的信息进行清洗

规范化,并对数据进行筛选,同时评价模型的预测能力并优化模型,基于优化后的模型筛选出最优特征变量组合;模型训练模块,用于将筛选出的最优特征变量组合作为建模变量,构建新的建模数据集作为自变量,基于
XGBoost
算法构建
HTPR
预测模型并训练模型;预测模块,用于将训练好的模型对患者
PCI
术后氯吡格雷治疗后是否发生
HTPR
进行预测
。2.
根据权利要求1所述的基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统,其特征在于:所述患者信息包括人口统计学信息

既往史

合并疾病

药物使用信息

实验室检验值信息

基因信息

诊断信息
。3.
根据权利要求1所述的基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统,其特征在于:所述数据预处理模块包括:数据清洗子模块,用于对患者信息数据进行去重

排序,并剔除缺失超过阈值的数据;数据规范化子模块,用于对清洗后的患者信息数据进行热编码或数字编码,或者根据阈值划分为二分类;变量初筛子模块,用于对规范后的数据采用
Pearson
相关性检验和
Mann

Whitney U
检验对自变量和目标变量进行相关性检验,删除不相关和显著性差的变量,保留相关和显著性的变量,针对二分类变量,剔除极度不平衡的变量,并剔除数据缺失率超过阈值的变量;变量插补子模块,用于对初筛后的变量利用随机森林算法对存在缺失值的变量进行插补;特征变量筛选子模块,用于评价模型的预测能力并优化模型,基于优化后的模型筛选出最优特征变量组合
。4.
根据权利要求3所述的基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统,其特征在于:所述特征变量筛选子模块具体采用以下步骤筛选出最优特征变量组合:采用基于
RF
的特征序列前向选择算法对重要性得分大于0的变量做最终变量筛选,从空集开始搜索特征,每次把一个特征添加到特征子集中,并进行建模使得评价指标达到最优值,最终筛选出最佳的特征组合
。5.
根据权利要求1所述的基于机器学习预测氯吡格雷治疗时发生
HTPR
风险的系统,其特征在于:所述模型训练模块采用以下步骤进行预测模型训练:
(1)
用筛选出的最优特征变量组合构建新的建模数据集;
(2)
对建模数据集划分训练和测试数据集;
(3)
将训练集用于训练模型进行训练,模型经过多次迭代后,连续设定迭代次数的性能指标相差不超过设定阈值时,判定模型在此训练集上已训练好,并通过网格搜索的方式调节模型超参...

【专利技术属性】
技术研发人员:丁兰萍顾智淳袁红宇周敏
申请(专利权)人:江苏省人民医院南京医科大学第一附属医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1