一种基于集成学习的药物反应可解释分析方法技术

技术编号:38318172 阅读:14 留言:0更新日期:2023-07-29 09:00
本发明专利技术提供了一种基于集成学习的药物反应可解释分析方法,所述方法包括:获取原始数据,将所述原始数据进行抽取和向量化编码,得到第一数据;所述第一数据来源不同数据表,按照时间戳进行整合,得到训练数据;将训练数据输入集成学习模型进行训练,利用模型解释算法解释集成学习模型,得到重要特征集;将所述重要特征集输入集成学习模型进行训练,利用模型解释算法解释药物反应。本发明专利技术利用生成重要特征集解决了药物反应分析数据模式复杂的问题,同时针对药物反应结局进行可解释分析,增强了模型的可信度,为药物反应分析提供有利依据,因此具有较高的应用价值。因此具有较高的应用价值。因此具有较高的应用价值。

【技术实现步骤摘要】
一种基于集成学习的药物反应可解释分析方法


[0001]本专利技术涉及药物反应分析
,具体涉及一种基于集成学习的药物反应可解释分析方法。

技术介绍

[0002]在临床上,药物反应分析通过综合分析和预测患者对药物的反应,进而在治疗过程中选择更有效、更合适的治疗方案,提高治疗效果。实际研究中,药物反应分析涉及多因素影响,如环境因素、健康状况等,同时缺乏标准化方法,很难比较不同药物之间的反应,因此药物反应分析面临数据模式复杂,缺乏标准化方法等关键问题。针对所述问题,一方面,传统的统计学方法很难准确拟合复杂的高维数据,另一方面,药物反应分析对可解释性提出更高要求,因此研究药物反应可解释分析方法具有重要意义。

技术实现思路

[0003]针对现有技术中的上述不足,本专利技术提供了一种基于集成学习的药物反应可解释分析方法。
[0004]为了达到上述专利技术目的,本专利技术采用的技术方案为:
[0005]一种基于集成学习的药物反应可解释分析方法,包括如下步骤:
[0006]S1、获取原始数据,将所述原始数据进行抽取和向量化编码,得到第一数据;
[0007]S2、按照时间戳对所述述第一数据进行整合,得到训练数据;
[0008]S3、将训练数据输入集成学习模型进行训练,利用模型解释算法解释集成学习模型,得到重要特征集;
[0009]S4、将所述重要特征集输入集成学习模型进行训练,利用模型解释算法解释药物反应。
[0010]进一步的,所述原始数据进行抽取和向量化编码,得到第一数据,包括:
[0011]按照临床纳入排除标准对原始数据进行抽取;
[0012]对疾病诊断、药物干预方式等多值类别进行独热编码。
[0013]进一步的,所述S2具体包括如下内容:
[0014]第一数据包括患者信息数据、血液学检验数据、药物干预数据,以药物干预数据中的时间戳为准,在血液学检验数据中截取位于所述时间戳前且间隔最近的血液学检验数据,得到药物干预前的生化指标特征;
[0015]以药物干预数据中的时间戳为准,在血液学检验数据中截取位于所述时间戳后且间隔最近的白蛋白检验数据,得到预测标签;
[0016]将所述患者信息数据、药物干预前的生化指标特征、药物干预数据、预测标签按照时间戳进行整合,得到训练数据。
[0017]进一步的,所述S3具体包括如下内容:
[0018]利用XgBoost算法对所述训练数据进行训练,采用模型解释算法SHAP进行重要特
征排序;
[0019]根据所述重要特征排序,结合临床知识进行筛选,得到重要特征集。
[0020]进一步的,所述S4具体包括如下内容:
[0021]利用XgBoost算法对所述重要特征集进行训练,得到训练后的基于重要特征的集成学习模型;
[0022]采用模型解释算法SHAP对所述基于重要特征的集成学习模型进行单因素分析,得到单个特征对药物干预反应的影响规律;
[0023]采用模型解释算法SHAP对所述基于重要特征的集成学习模型进行设置交互变量的单因素分析,得到药物干预与其他特征的联合影响规律;
[0024]根据所述单因素分析和设置交互变量的单因素分析,结合临床知识,得到药物反应的可解释分析。
[0025]本专利技术具有以下有益效果:
[0026]1、在本专利技术中,利用训练后的模型,通过模型解释算法在最初的训练特征中得到重要特征集,也就是说在进行最终的药物反应分析前,结合医学知识依据特征和药物反应结局之间的关系,筛选出重要特征,减少特征数量,避免重要信息淹没在高维数据中,有效解决药物反应分析中数据模式复杂的问题。
[0027]2、在本专利技术中,设计了一种基于重要特征的药物反应可解释分析方法,所述方法从宏观角度量化了不同药物对患者结局的影响程度,同时通过设置交互变量的单因素分析方法从局部角度分析不同患者对不同药物的反应情况。可以实现不同患者的药物反应可解释分析,为药物反应分析提供有力的分析依据。
附图说明
[0028]图1是本专利技术实施例中所述的基于集成学习的药物反应可解释分析方法流程示意图。
具体实施方式
[0029]下面对本专利技术的具体实施方式进行描述,以便于本
的技术人员理解本专利技术,但应该清楚,本专利技术不限于具体实施方式的范围,对本
的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本专利技术的精神和范围内,这些变化是显而易见的,一切利用本专利技术构思的专利技术创造均在保护之列。
[0030]如图1所示,本实施例提供了一种基于集成学习的药物反应可解释分析方法,包括如下步骤:
[0031]步骤S1、获取原始数据,所述原始数据包括至少一个实验者在住院期间,一次药物干预前和干预后的血液学检验数据以及药物干预数据,将所述原始数据按照纳入标准进行抽取,对多值类别变量进行向量编码,得到第一数据;
[0032]在本步骤中,所述原始数据来自老年患者住院部,原始数据从不同数据库中提取,且包含大量无用、重复信息,需要进行预处理操作,具体实现步骤包括步骤S11和步骤S12;
[0033]步骤S11、从医疗机构老年患者住院部获取原始数据,所述原始数据从住院登记数据、检验数据、医嘱数据中分别提取;根据内容,依次分类为患者信息数据、血液学检验数
据、药物干预数据;由专业医生提供纳入标准对原始数据进行抽取,针对患者信息数据,纳入年龄65岁以上、临床资料完整的患者;针对血液学检验数据,抽取与药物干预结局相关的缺失率较低的血液学检验指标;针对药物干预数据,抽取药物种类、单次剂量、干预频率、干预次数等信息。
[0034]步骤S12、疾病诊断、药物干预方式等特征属于多值类别,不同患者的疾病类别和药物干预方式不同,采用独热编码进行向量编码。
[0035]步骤S2、对所述第一数据,按照药物干预时间戳截取数据并进行整合,得到训练数据;
[0036]在本步骤中,第一数据包括患者信息数据、血液学检验数据、药物干预数据,三类数据以药物干预数据中的时间戳为准进行整合,得到整合后的训练数据的具体实现步骤包括步骤S21、步骤S22、步骤S23和步骤S24;
[0037]步骤S21、整合数据的时间戳以药物干预数据中的时间戳为准,考虑所截取的血液学检验数据需要能够有效预测药物干预结局,同时用于预测的血液学检验数据需要早于药物干预结局产生的时间,因此截取血液学数据中早于药物干预时间戳的数据,并计算时间间隔,得到第二数据。
[0038]步骤S22、实验者在不同时间进行药物干预产生不同的药物干预结局,因此使用晚于药物干预时间的血液学检验数据中的白蛋白水平作为药物干预结局,并计算时间间隔,得到第三数据。
[0039]步骤S23、根据专业医生,为了得到有效反应药物干预过程的数据,所述第二数据和第三数据中需要保留时间间隔在3天内的数据,分别得到第四数据和第五数据。
[0040]步骤S24、以实验者的住院本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成学习的药物反应可解释分析方法,其特征在于,包括如下步骤:S1、获取原始数据,将所述原始数据进行抽取和向量化编码,得到第一数据;S2、按照时间戳对所述述第一数据进行整合,得到训练数据;S3、将训练数据输入集成学习模型进行训练,利用模型解释算法解释集成学习模型,得到重要特征集;S4、将所述重要特征集输入集成学习模型进行训练,利用模型解释算法解释药物反应。2.根据权利要求1所述的一种基于集成学习的药物反应可解释分析方法,其特征在于,所述原始数据进行抽取和向量化编码,得到第一数据,包括:按照临床纳入排除标准对原始数据进行抽取;对疾病诊断、药物干预方式等多值类别进行独热编码。3.根据权利要求1所述的一种基于集成学习的药物反应可解释分析方法,其特征在于,所述S2具体包括如下内容:第一数据包括患者信息数据、血液学检验数据、药物干预数据,以药物干预数据中的时间戳为准,在血液学检验数据中截取位于所述时间戳前且间隔最近的血液学检验数据,得到药物干预前的生化指标特征;以药物干预数据中的时间戳为准,在血液学检验数据中截取位于所...

【专利技术属性】
技术研发人员:滕飞督静雯龚勋林宁杨孝光李运明黄路非李暄张聂于静
申请(专利权)人:西南交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1