用于智能疾病筛查的临床决策支持方法及系统技术方案

技术编号:19348022 阅读:45 留言:0更新日期:2018-11-07 16:03
本发明专利技术提供一种用于智能疾病筛查的临床决策支持方法及系统,该疾病筛查模型能够提升疾病筛查的准确率,减小误分类代价。该方法包括:对检查报告进行后结构化处理,得到样本数据集;根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型;至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到疾病筛查模型,所述疾病筛查模型的输入为检查报告,输出为疾病分类结果,所述疾病分类结果用于支持临床决策。

Clinical decision support method and system for intelligent disease screening

The invention provides a clinical decision support method and system for intelligent disease screening. The disease screening model can improve the accuracy of disease screening and reduce the cost of misclassification. The method includes: structuring the examination report to get the sample data set; training the individual classification model according to the sample data set to get multiple homogeneous classification models; at least using the minimum misclassification cost threshold selection method MCTSM to set the classification threshold of the integrated model to get the disease screening model. The input of the disease screening model is the examination report, and the output is the disease classification result. The disease classification result is used to support clinical decision-making.

【技术实现步骤摘要】
用于智能疾病筛查的临床决策支持方法及系统
本专利技术涉及医疗
,具体地,涉及一种用于智能疾病筛查的临床决策支持方法及系统。
技术介绍
传统上对癌症(例如胃癌,乳腺癌等)的诊断和筛查依靠医生对病历以及检查报告的分析。而由于日趋沉重的工作压力、冗长的病历和检查报告,对医生的工作效率产生较大的影响,以及癌症的诊断筛查工作本身的难度和基层医生自身专业水平的限制,导致对癌症的筛查存在较高的误诊率和漏诊率。随着近年来人工智能技术的进步,数据驱动的分析研究逐渐成为临床和生物学领域癌症相关研究的有力支持和补充,使得疾病的筛查逐渐趋向智能化。例如,相关技术中运用集成学习方法,分析了超过140万名糖尿病患者的数据,在检测视网膜病变(DR)的易感性方面具有很高的准确性,同时,解决了视网膜病筛查依从性低的问题。又例如,将癌症的合并症纳入到癌症的诊断和治疗研究中,考虑使用准确率、灵敏度和特异性作为模型性能的评估指标,但是,却忽略了癌症相关数据集不平衡导致的准确率等指标使用局限的情况。通常情况下,使用机器学习方法建立的分类模型不可避免地存在泛化误差,并且分类阈值选取的不同,会带来灵敏度、特异性等不同方面的本文档来自技高网...

【技术保护点】
1.一种用于智能疾病筛查的临床决策支持方法,其特征在于,所述方法包括:对检查报告进行后结构化处理,得到样本数据集;根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型;至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到疾病筛查模型,所述疾病筛查模型的输入为检查报告,输出为疾病分类结果,所述疾病分类结果用于支持临床决策。

【技术特征摘要】
1.一种用于智能疾病筛查的临床决策支持方法,其特征在于,所述方法包括:对检查报告进行后结构化处理,得到样本数据集;根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型;至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到疾病筛查模型,所述疾病筛查模型的输入为检查报告,输出为疾病分类结果,所述疾病分类结果用于支持临床决策。2.根据权利要求1所述的方法,其特征在于,所述至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到所述疾病筛查模型,包括:设定一分类阈值,并将发生疾病概率大于所述分类阈值的确定为患病样本,将发生疾病概率小于所述分类阈值的确定为正常样本;每设定一分类阈值后,根据如下公式计算在该分类阈值下的误分类代价lcost:lcost=α*FPR+β*(1-TPR);其中,α为误诊代价系数,β为漏诊代价系数;TPR=TP/(TP+FN)为真正例率,TP为正确预测的患病样本数,FN为错误预测的患病样本数;FPR=FP/(FP+TN)代表患病样本的误诊率,FP为错误预测的无疾病本数,TN为正确预测的无疾病本数;1-TPR代表患病样本的漏诊率;选取使得误分类代价lcost具有最小值的分类阈值作为所述疾病筛查模型的目标分类阈值。3.根据权利要求1或2所述的方法,其特征在于,所述至少使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,以得到所述疾病筛查模型,包括:对所述多个同质分类模型使用最优赋权加权集成方法OWIA进行加权集成,并使用最小误分类代价阈值选取方法MCTSM设定集成模型的分类阈值,得到所述疾病筛查模型。4.根据权利要求3所述的方法,其特征在于,所述根据所述样本数据集进行个体分类模型的训练,得到多个同质分类模型,包括:将所述样本数据集按照预设比例划分为训练数据集和测试数据集;从所述训练数据集中采样得到k份互有交叉的采样数据集,k为大于1的正整数;采用同一机器学习算法,分别在所述k份训练数据集上进行模型的训练和校验,得到k个同质分类模型。5.根据权利要求3所述的方法,其特征在于,所述对所述多个同质分类模型使用最优赋权加权集成方法OWIA进行加权集成,包括:确定所述多个同质分类模型的权重组合集合;分别计算在所述权重组合集合中的每一权重组合下,集成模型的性能评估值;将所述集成模型的最优性能评估值对应的权重组合作为最优权重组合,并将在所述最优权重组合下的集成模型作为所述疾病筛查模型。6.一种用...

【专利技术属性】
技术研发人员:丁帅杨善林胡世康
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1