基于可解释性机器学习的支气管哮喘辅助诊断方法及系统技术方案

技术编号:37155022 阅读:12 留言:0更新日期:2023-04-06 22:15
本发明专利技术涉及一种基于可解释性机器学习的支气管哮喘辅助诊断方法及系统,属于智能医学技术领域。本发明专利技术利用预设的自动机器学习框架进行数据预处理、特征工程处理及预测模型构建,在测试集中采用交叉验证的方法评估各预测模型的性能;根据性能指标选取性能最优的预测模型,在预定义的搜索空间上调整模型的超参数,并进行交叉验证和迭代训练以得到最佳预测模型;基于可解释性技术对最佳预测模型进行解释分析。本发明专利技术能够将使用者从繁琐的数据预处理、特征工程、模型选择和参数调优过程中解脱出来,能够有效分析和整合大型医疗数据,为支气管哮喘相关的治疗提供可靠的辅助诊断。气管哮喘相关的治疗提供可靠的辅助诊断。气管哮喘相关的治疗提供可靠的辅助诊断。

【技术实现步骤摘要】
基于可解释性机器学习的支气管哮喘辅助诊断方法及系统


[0001]本专利技术涉及一种基于可解释性机器学习的支气管哮喘辅助诊断方法及系统,属于智能医学


技术介绍

[0002]支气管哮喘是最常见的慢性呼吸道疾病之一,常见症状包括咳嗽、咳痰和呼吸短促等,严重影响生活质量。支气管哮喘发病机制尚不明确,识别、治疗哮喘仍然面临诸多挑战。
[0003]随着计算机技术的不断提高和支气管哮喘相关数据的积累,使用机器学习技术对这些数据进行系统分析已经为患者带来了具有临床意义的知识。但是,随着机器学习算法种类的增加和复杂度的提升,临床医师需要选择相应的构架进行训练,并从众多机器学习算法模型中选择合适的模型,需要使用者进行大量繁琐的数据处理、模型选择及超参数优化。另外,机器学习模型结构复杂,属于“黑盒”模型,模型输出结果也难以被解释。

技术实现思路

[0004]本专利技术的目的是提供一种基于可解释性机器学习的支气管哮喘辅助诊断方法及系统,通过少量人工干预得到可解释的、可靠的辅助诊断模型。
[0005]本专利技术为解决上述技术问题而提供一种基于可解释性机器学习的支气管哮喘辅助诊断方法,该辅助诊断方法包括以下步骤:
[0006]1)获取与支气管哮喘患者相关的原始数据,包括有患者属性信息、症状以及相关医学检查数据,并对获取的数据进行预处理;
[0007]2)构建自动化特征工程框架,将预处理的数据输入自动化特征工程框架进行特征工程处理;
[0008]3)构建自动机器学习框架并输入处理后的特征,机器学习框架自动遍历预设的机器学习模型,并对模型性能指标进行评估;
[0009]4)根据性能指标选取性能最优的机器学习模型,在预定义的搜索空间上调整模型的超参数,并进行交叉验证和迭代训练以得到最佳机器学习模型;
[0010]5)应用可解释性方法对得到的最佳机器学习模型进行解释,利用最佳机器学习模型进行辅助诊断。
[0011]本专利技术利用预设的自动机器学习框架构建不同的预测模型,在测试集中采用交叉验证的方法评估各预测模型的性能;根据性能指标选取性能最优的预测模型,在预定义的搜索空间上调整模型的超参数,并进行交叉验证和迭代训练以得到最佳预测模型。本专利技术能够将使用者从繁琐的数据预处理、特征工程、模型选择和参数调优过程中解脱出来,能够有效分析和整合大型医疗数据,为支气管哮喘相关的治疗提供可靠的辅助诊断。
[0012]进一步地,所述步骤3)中的性能指标包括有:Accuracy、F1

score和MCC,
[0013]其中,Accuracy表示模型正确预测分类的样本占总样本的比率,为模型的成功率;
F1

score为综合考虑Recall和Precision的调和均值;MCC(Matthews correlation coefficient)为模型性能的综合指标,该指标考虑了真阳性、真阴性、假阳性和假阴性,是一个比较均衡的指标。
[0014]本专利技术采用Accuracy、F1

score和MCC作为评价模型的性能指标,能够准确、全面实现对模型的评价。
[0015]进一步地,所述步骤3)中预设的机器学习模型包括有LightGBM、XGBoost、CatBoost、Gradient Boosting Classifier、Random Forest Classifier、AdaBoost、Logistic Regression、Extra Trees Classifier、Decision Tree Classifier、Ridge Classifier、Linear Discriminant Analysis、Dummy Classifier、KNN、SVM

Linear Kernel和Naive Bayes。
[0016]本专利技术机器学习框架中预设的机器学习算法包括有多种不同的算法模型,为后续模型的选取提供了可靠的数据来源。
[0017]进一步地,所述的步骤4)中是以Accuracy为基准选取最优预测模型。
[0018]本专利技术根据Accuracy进行模型选择,根据验证结果,选择Accuracy最高的模型作为最优预测模型。
[0019]进一步地,该方法还包括利用测试集对得到最佳预测模型进行验证的步骤。
[0020]本专利技术对得到的最佳预测模型进行测试验证,以确保所选择的最佳预测模型的性能。
[0021]进一步地,所述步骤1)中获取患者属性信息包括有年龄和病史,相关医学检查数据包括有实验室检查数据、肺功能检查数据、肺部听诊声音数据、影像学数据和症状模式数据。
[0022]进一步地,所述的数据预处理包括有重复值删除、异常值处理及缺失值填补,其中缺失值填补采用基于随机森林的多重插补技术。
[0023]由于获取的原始数据中存在有重复值和缺失值等情况,本专利技术通过上述预处理方式,确保构建模型准确性和泛化性。
[0024]进一步地,所述步骤2)的特征工程包括有特征预处理和特征选择,其中特征预处理用于将预处理后的数据进行数据集划分、数据转换、离散特征编码、特征归一化及不平衡数据处理;特征选择包括利用Person相关系数/互信息/距离相关度,评估单个特征和结果之间的相关程度,去除和结果不太相关的特征,删除零方差或近零方差特征,删除共线性特征。
[0025]本专利技术通过对预处理后的数据进行特征工程处理,保证了各种数据类型的统一,有助于后续模型的输入;通过特征选择和特征提取,删除一些冗余特征,减少了特征的干扰,同时增强了模型训练的精度。
[0026]本专利技术应用可解释性技术对得到的最佳机器学习模型进行解释,所述步骤5)的可解释性方法包括有:基于排列的特征重要性、SHAP、部分依赖图(PDP)和Morris Sensitivity Analysis(MSA)。
[0027]本专利技术还提供了一种基于可解释性机器学习的支气管哮喘辅助诊断系统,该辅助诊断系统包括处理器和存储器;存储器,用于存储所述处理器的可执行指令;其中所述处理器配置为经由执行所述可执行指令来实现本专利技术上述基于可解释性机器学习的支气管哮
喘辅助诊断方法。
[0028]本专利技术利用预设的自动机器学习框架进行数据预处理、特征工程处理及预测模型构建,在测试集中采用交叉验证的方法评估各预测模型的性能;根据性能指标选取性能最优的预测模型,在预定义的搜索空间上调整模型的超参数,并进行交叉验证和迭代训练以得到最佳预测模型;基于可解释性技术对最佳预测模型进行解释分析。本专利技术能够将使用者从繁琐的数据预处理、特征工程、模型选择和参数调优过程中解脱出来,能够有效分析和整合大型医疗数据,为支气管哮喘相关的治疗提供可靠的辅助诊断。
附图说明
[0029]图1是本专利技术支气管哮喘的辅助诊断方法的流程图;
[0030]图2是本专利技术支气管哮喘的辅助诊断系统的工作原理图;
[0031]图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于可解释性机器学习的支气管哮喘辅助诊断方法,其特征在于,该辅助诊断方法包括以下步骤:1)获取与支气管哮喘患者相关的原始数据,包括有患者属性信息、症状以及相关医学检查数据,并对获取的数据进行预处理;2)构建自动化特征工程框架,将预处理的数据输入自动化特征工程框架进行特征工程处理;3)构建自动机器学习框架并输入处理后的特征,机器学习框架自动遍历预设的机器学习模型,并对模型性能指标进行评估;4)根据性能指标选取性能最优的机器学习模型,在预定义的搜索空间上调整模型的超参数,并进行交叉验证和迭代训练以得到最佳机器学习模型;5)应用可解释性方法对得到的最佳机器学习模型进行解释,利用最佳机器学习模型进行辅助诊断。2.根据权利要求1所述的基于可解释性机器学习的支气管哮喘辅助诊断方法,其特征在于,所述步骤3)中的主要性能指标包括有:Accuracy、F1

score和MCC,其中,Accuracy表示模型正确预测分类的样本占总样本的比率,为模型的成功率;F1

score为综合考虑Recall和Precision的调和均值;MCC(Matthews correlation coefficient)为模型性能的综合指标,该指标考虑了真阳性、真阴性、假阳性和假阴性,是一个比较均衡的指标。3.根据权利要求1所述的基于可解释性机器学习的支气管哮喘辅助诊断方法,其特征在于,所述步骤3)中预设的机器学习模型包括有LightGBM、XGBoost、CatBoost、Gradient Boosting Classifier、Random Forest Classifier、AdaBoost、Logistic Regression、Extra Trees Classifier、Decision Tree Classifier、Ridge Classifier、Linear Discriminant Analysis、Dummy Classifier、KNN、SVM<...

【专利技术属性】
技术研发人员:雷小莉王俊丽
申请(专利权)人:河南省人民医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1