本发明专利技术公开了一种基于人工智能的新型冠状病毒患者病况分类系统,属于病况分类领域,包括:分类模型获取模块,用于训练一个或多个根据患者数据对患者病况进行分类的二分类模型,并从中获取准确性最高的二分类模型作为目标模型,同时确定患者数据中的可解释的特征;预处理模块,用于提取待分类患者数据中的可解释的特征后,对所提取的特征进行预处理,以填充其中的缺失值并替换其中的异常值,从而在预处理结束后得到待分类特征;病况分类模块,用于以待分类特征为目标模型的输入,利用目标模型完成对待分类患者的病况分类。本发明专利技术提出了一种稳定性、鲁棒性以及准确性均满足要求的分类系统,能够解决新型冠状病毒患者病况分类的问题。
【技术实现步骤摘要】
一种基于人工智能的新型冠状病毒患者病况分类系统
本专利技术属于病况分类领域,更具体地,涉及一种基于人工智能的新型冠状病毒患者病况分类系统。
技术介绍
新型冠状病毒是2019年12月新出现的RNA病毒,传染力强。感染病人病症多样,如何判断病人接下来的病况变化对医护人员采取进一步的治疗措施起到指导作用。目前临床采集的病人身体指标包括二聚体定量测定、甲状腺功能全套(TSH,FT3,FT4)、免疫全套(IgG.IgA.IgM.C3.C4)、白细胞介素、生化全套、糖链抗原等六十余项指标。指标的种类繁多,这给医护人员判断病人病况发展带来了巨大的困难。同时患者数量庞大,有数以万计的病人需要以周或天为粒度进行评估。目前医护人员根据指标结合对病人身体状况的主观判断来对病人病况进行评级分类,这样的分类方法给医护人员带来了沉重的负担。基于人工智能的完成分类,是通过计算机辅助的方式帮助人类做出快速精准的判断与决策。人工智能的兴起,使这种技术手段在分类任务中占据了越来越关键的位置。然而,利用人工智能来解决新型冠状病毒感染病人病况分类问题面临着诸多困难。首先,病人身体指标的部分缺失给计算机分类带来了挑战。如乳酸脱氢酶这一指标,在100位病人中有10位病人没有检测,这就需要分类具有很高的稳定性。其次,检测得到的指标当中存在一些异常数据,其数值严重超出了该指标的取值范围,需要分类具有很高的鲁棒性。最后,医学数据的正面样本较多,负面样本较少,类目的不均衡会影响分类的准确性。新型冠状病毒来势迅猛,但尚无针对这一问题的性能优良的分类系统,因此,为了解决新型冠状病毒患者病况的分类问题,急需提出一种稳定性、鲁棒性以及准确性均满足要求的分类系统。
技术实现思路
针对现有技术的缺陷和改进需求,本专利技术提供了一种基于人工智能的新型冠状病毒患者病况分类系统,其目的在于,提出一种稳定性、鲁棒性以及准确性均满足要求的分类系统,以解决新型冠状病毒患者病况分类的问题。为实现上述目的,本专利技术提供了一种基于人工智能的新型冠状病毒患者病况分类系统,包括:分类模型获取模块、预处理模块以及病况分类模块;分类模型获取模块,用于训练一个或多个根据患者数据对患者病况进行分类的二分类模型,并从中获取准确性最高的二分类模型作为目标模型,同时确定患者数据中的可解释的特征;预处理模块,用于提取待分类患者数据中的可解释的特征后,对所提取的特征进行预处理,以填充其中的缺失值并替换其中的异常值,从而在预处理结束后得到待分类特征;病况分类模块,用于以待分类特征为目标模型的输入,利用目标模型完成对待分类患者的病况分类。本专利技术所提供的基于人工智能的新型冠状病毒患者病况分类系统,通过预处理操作,填充患者特征数据中的缺失值并替换其中的异常值,保证了分类的稳定性和鲁棒性;通过训练多个分类模型,并从中选取准确性最高的模型进行病况分类,保证了分类的准确性。总的来说,本专利技术提供了一种具有稳定性、鲁棒性和准确性的新型冠状病毒患者病况分类系统,能够有效解决新型冠状病毒患者病况分类的问题。本专利技术所提供的基于人工智能的新型冠状病毒患者病况分类系统,还会从众多的特征数据中筛选出可解释的特征,并且仅针对可解释的特征完成病况分类,由此能够提高二分类模型的可解释性,有效防止过拟合,进一步保证分类的准确性。进一步地,分类模型获取模块包括:预处理单元、数据集划分单元、N个模型训练单元、决策单元以及模型重训练单元;预处理单元,用于对已标注两类数据标签的医学检测数据进行预处理,以填充其中的缺失值并替换其中的异常值,从而在预处理结束后得到数据集;数据集划分单元,用于按照预设的比例将数据集划分为训练集、验证集和测试集;N个模型训练单元中的每一个模型训练单元,用于建立一个根据患者数据对患者病况进行分类的二分类模型,在设置类别权重后,利用训练集和验证集分别对所建立的二分类模型进行训练和验证,并利用测试集评估已训练好的二分类模型的准确性;N个模型训练单元所建立的N个二分类模型互不相同,每一个二分类模型在训练结束后,输出特征重要度;决策单元,用于从已训练好的N个二分类模型中选取准确性最高二分类模型作为候选模型,并根据候选模型输出的特征重要度,选取特征重要度最高的前K项特征作为可解释的特征;模型重训练单元,用于剔除训练集和验证集中可解释的特征之外的特征,并利用新的训练集和验证集对候选模型进行训练和验证,从而在训练完成后,得到最优的二分类模型,将其作为目标模型;其中,N和K均为正整数。本专利技术所提供的基于人工智能的新型冠状病毒患者病况分类系统,其中的分类模型获取模块在获取目标模型时,利用已标注两类数据标签的医学检测数据对多个二分类模型进行严格的训练、验证和测试,以从中筛选出准确性最高的模型,由此保证了分类模型的分类性能是最优的。可解释性是AI+医疗这一交叉领域中必须要面临的重大的问题,尤其是在考虑到在现实生活的临床实践中,少数病人可能会出现异常状况,如果模型没有学习过类似病况,做出的判断将会不可靠;可解释的模型便于医护人员分析这类情况,做出更加科学合理的判断。此外,由于检测设备等缘故,检测的指标会伴随着一定的干扰和噪声,不可解释的模型即使在噪声上过拟合了,设计者也无法知道,而一个可解释的模型则可以通过分析判断是否过拟合。本专利技术提供的基于人工智能的新型冠状病毒患者病况分类系统,其中的分类模型获取模块通过分析特征重要度,能够提高所选取模型的可解释性,防止过拟合。本专利技术所提供的基于人工智能的新型冠状病毒患者病况分类系统,其中的模型训练单元在利用训练集对二分类模型进行训练之前,会先设置类别权重,从而在模型训练过程中,给数目少的那类更大的学习权重,给数目多的那类稍小的学习权重,由此能够削弱类别不均衡带来的影响,提高分类准确性。进一步地,各模型训练单元在训练和验证二分类模型时,采用M折交叉验证;其中,M为正整数;通过交叉验证,能够消除随机因素,提高分类结果可信度,为选取最优的二分类模型提供了可靠的依据。进一步地,M折交叉验证为M折分层交叉验证,并且每折交叉验证中两类数据的比例是相同的,以进一步提高模型分类结果的可信度。进一步地,准确性以准确率和F1-score为评价指标,并且准确率的优先级高于F1-score。本专利技术在评价模型的准确性时,综合考虑准确率(accuracy)和F1-score,并且优先考虑准确率,能够综合反映模型的整体性能。进一步地,N=5,并且5个模型训练单元所建立的二分类模型分别为:XGBoost、LightGBM、随机森林、CatBoost和逻辑回归。进一步地,分类模型获取模块还包括:特征可视化单元;特征可视化单元用于对决策单元所选取的可解释的特征进行可视化操作。本专利技术通过对可可解释的特征进行可视化操作,能够进一步提高模型的可解释性,防止过拟合。进一步地,预处理操作包括:使用预设的填充值x填充缺失数据;对于每一项特征,若其值大于该项特征第H百分本文档来自技高网...
【技术保护点】
1.一种基于人工智能的新型冠状病毒患者病况分类系统,其特征在于,包括:分类模型获取模块、预处理模块以及病况分类模块;/n所述分类模型获取模块,用于训练一个或多个根据患者数据对患者病况进行分类的二分类模型,并从中获取准确性最高的二分类模型作为目标模型,同时确定患者数据中的可解释的特征;/n所述预处理模块,用于提取待分类患者数据中的可解释的特征后,对所提取的特征进行预处理,以填充其中的缺失值并替换其中的异常值,从而在预处理结束后得到待分类特征;/n所述病况分类模块,用于以所述待分类特征为所述目标模型的输入,利用所述目标模型完成对所述待分类患者的病况分类。/n
【技术特征摘要】
20200307 CN 20201015391471.一种基于人工智能的新型冠状病毒患者病况分类系统,其特征在于,包括:分类模型获取模块、预处理模块以及病况分类模块;
所述分类模型获取模块,用于训练一个或多个根据患者数据对患者病况进行分类的二分类模型,并从中获取准确性最高的二分类模型作为目标模型,同时确定患者数据中的可解释的特征;
所述预处理模块,用于提取待分类患者数据中的可解释的特征后,对所提取的特征进行预处理,以填充其中的缺失值并替换其中的异常值,从而在预处理结束后得到待分类特征;
所述病况分类模块,用于以所述待分类特征为所述目标模型的输入,利用所述目标模型完成对所述待分类患者的病况分类。
2.如权利要求1所述的基于人工智能的新型冠状病毒患者病况分类系统,其特征在于,所述分类模型获取模块包括:预处理单元、数据集划分单元、N个模型训练单元、决策单元以及模型重训练单元;
所述预处理单元,用于对已标注两类数据标签的医学检测数据进行预处理,以填充其中的缺失值并替换其中的异常值,从而在预处理结束后得到数据集;
所述数据集划分单元,用于按照预设的比例将所述数据集划分为训练集、验证集和测试集;
所述N个模型训练单元中的每一个模型训练单元,用于建立一个根据患者数据对患者病况进行分类的二分类模型,在设置类别权重后,利用所述训练集和所述验证集分别对所建立的二分类模型进行训练和验证,并利用所述测试集评估已训练好的二分类模型的准确性;所述N个模型训练单元所建立的N个二分类模型互不相同,每一个二分类模型在训练结束后,输出特征重要度;
所述决策单元,用于从已训练好的N个二分类模型中选取准确性最高二分类模型作为候选模型,并根据所述候选模型输出的特征重要度,选取特征重要度最高的前K项特征作为可解释的特征;
所述模型重训练单元,用于剔除所述训练集和所述验证集中可解释的特征之外的特征,并利用新的训练集和验证集对所述候选模型进行训练和验证,从而在训练完成后,得到最优的二分类模型,将其...
【专利技术属性】
技术研发人员:袁烨,孙川,严丽,徐卉,王茂霖,郭裕祺,唐秀川,张海涛,肖阳,
申请(专利权)人:华中科技大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。