System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,更具体地说,本专利技术涉及一种基于特征选择和改进bagging的哮喘病辅助诊断系统。
技术介绍
1、哮喘病是一种慢性呼吸系统疾病,其主要特征是气道炎症和气道高反应性,患者常常会出现反复发作的喘息、气急、胸闷或咳嗽等症状,这些症状通常在夜间或清晨发作或加剧,哮喘病的发病原因复杂,可能涉及遗传、环境等多种因素。
2、传统的诊断方法中,医生通常通过观察大量医学指标进行哮喘病诊断,然后结合自身经验判断疾病类型并获得诊断,容易造成误诊和漏诊。基于机器学习的哮喘病辅助诊断方法中,现有的诊断模型中对血常规体检数据的特征筛选仅考虑特征之间的冗余性具有一定的局限性,未能捕捉到病人数据中的潜在关键特征。因此,本专利技术提出了基于特征选择和改进bagging的哮喘病辅助诊断系统来辅助医生对于哮喘病的诊断。
技术实现思路
1、为了克服现有技术的上述缺陷,本专利技术的实施例提供一种基于特征选择和改进bagging的哮喘病辅助诊断系统,通过以下方案,以解决上述
技术介绍
中提出的问题。
2、为实现上述目的,本专利技术提供如下技术方案:一种基于特征选择和改进bagging的哮喘病辅助诊断系统,包括:
3、数据获取模块:用于获取目标用户的体检数据,包括年龄、性别、家族史、症状、体检结果以及实验室检查结果。
4、数据预处理模块:用于对数据获取模块获取的体检数据进行预处理,包括数据清洗和数据归一化。
5、特征选择模块:采用dfi进行特征选
6、构建bagging模型模块:用于构建一个改进bagging模型,并使用处理过的数据进行训练。
7、训练模型模块:用于根据构建bagging模型模块训练好的模型进行对系统的构建。
8、哮喘病诊断模块:用于加载强分类器模型,将处理后的数据输入模型进行预测,预测结果会以概率或分类形式输出,辅助医生判断患者是否患有哮喘病。
9、优选的,所述数据清洗用于去除体检数据中的异常值和重复值,通过填充方法处理体检数据中的缺失值;
10、所述数据归一化利用最大最小值归一化将数据缩放到相似的范围,所使用的公式为:其中xmin表示归一化数据的最小边界,xmax表示归一化数据的最大边界,x表示原始数据,x*表示归一化处理之后的数值。
11、优选的,所述dfi通过候选特征和所选特征子集之间的特征依赖和特征冗余,修正候选特征对于类别的重要性,同时考虑当前特征子集和类别的特征排序,包括基尼重要性和候选特征权重,具体通过假设fi是候选特征,xi是选定特征,c是类标签,s表示选定的特征子集以及f表示总的特征集合,并令f表示特征集f中的任意特征,f对类c的贡献通过特征重要性来描述。
12、优选的,所述基尼重要性具体包括:
13、通过分类回归树中的基尼指数来衡量数据集f在某个节点的纯度:其中p1,…,py分别表示类别1,…,y的概率;
14、当节点根据特征fi进行分裂时,特征fi的基尼递减定义为:其中fv是分割子节点处的数据集;
15、特征fi的gi(fi)定义为:其中是随机森林中包含特征f的决策树的数量,gdt(fi)是树t的基尼系数下降,fi′是特征fi的随机排列。
16、优选的,所述候选特征权重具体包括:
17、依赖性:当特征fi满足公式时,则特征fi依赖于特征子集s,其中,i(fi;c|xi)为条件互信息,i(c;fi)为互信息;
18、冗余性:当特征fi满足公式时,则特征fi与特征子集s冗余;
19、通过依赖性标准和冗余性标准构建候选特征权重,用w(fi;s)表示,计算公式为:
20、对w(fi;s)归一化:其中h为信息熵;
21、f中特征fi动态特征重要性定义为:
22、优选的,所述特征选择模块的具体步骤包括:
23、步骤s1:根据公式计算f中特征fi动态特征重要性;
24、步骤s2:当特征子集的个数k小于预设定的特征个数k时,每次选择使dfi(fi)值最大的特征,s=s∪{fi},f=f-{fi},动态更新f中的dfi;
25、步骤s3:当k=k+1时,则继续执行步骤s2,当特征子集的数量k达到预设定的特征个数k时,循环结束,获得最优特征子集。
26、优选的,所述构建bagging模型模块使用adaboost作为基分类器,adaboost使用决策树作为基分类器。
27、本专利技术的技术效果和优点:
28、本专利技术通过数据获取模块获取目标用户的体检数据,通过数据预处理模块对数据获取模块获取的体检数据进行预处理,通过特征选择模块采用dfi进行特征选择,通过使用bagging基本框架构建一个改进模型,并使用处理过的数据进行训练,通过训练模型模块根据构建bagging模型模块训练好的模型进行对系统的构建,通过哮喘病诊断模块加载强分类器模型,将处理后的数据输入模型进行预测,预测结果会以概率或分类形式输出,辅助医生判断患者是否患有哮喘病;
29、本专利技术根据病人的体检数据进行辅助诊断,能够辅助医生进行对病人是否患有哮喘病的临床诊断,并且构建的诊断系统使用了一种基于动态特征重要性的特征选择方法进行特征选择,同时考虑了特征之间的冗余性、依赖性和特征与类别之间的相关性筛选出最具有诊断意义的特征,使用adaboost作为bagging的基分类器,能够提高诊断模型的鲁棒性和泛化性能。
本文档来自技高网...【技术保护点】
1.一种基于特征选择和改进Bagging的哮喘病辅助诊断系统,其特征在于,包括:
2.根据权利要求1所述的一种基于特征选择和改进Bagging的哮喘病辅助诊断系统,其特征在于:所述数据清洗用于去除体检数据中的异常值和重复值,通过填充方法处理体检数据中的缺失值;
3.根据权利要求1所述的一种基于特征选择和改进Bagging的哮喘病辅助诊断系统,其特征在于:所述DFI通过候选特征和所选特征子集之间的特征依赖和特征冗余,修正候选特征对于类别的重要性,同时考虑当前特征子集和类别的特征排序,包括基尼重要性和候选特征权重,具体通过假设fi是候选特征,Xi是选定特征,c是类标签,S表示选定的特征子集以及F表示总的特征集合,并令f表示特征集F中的任意特征,f对类c的贡献通过特征重要性来描述。
4.根据权利要求1所述的一种基于特征选择和改进Bagging的哮喘病辅助诊断系统,其特征在于:所述基尼重要性具体包括:
5.根据权利要求1所述的一种基于特征选择和改进Bagging的哮喘病辅助诊断系统,其特征在于:所述候选特征权重具体包括:
6.根
7.根据权利要求1所述的一种基于特征选择和改进Bagging的哮喘病辅助诊断系统,其特征在于:所述构建Bagging模型模块使用Adaboost作为基分类器,Adaboost使用决策树作为基分类器。
...【技术特征摘要】
1.一种基于特征选择和改进bagging的哮喘病辅助诊断系统,其特征在于,包括:
2.根据权利要求1所述的一种基于特征选择和改进bagging的哮喘病辅助诊断系统,其特征在于:所述数据清洗用于去除体检数据中的异常值和重复值,通过填充方法处理体检数据中的缺失值;
3.根据权利要求1所述的一种基于特征选择和改进bagging的哮喘病辅助诊断系统,其特征在于:所述dfi通过候选特征和所选特征子集之间的特征依赖和特征冗余,修正候选特征对于类别的重要性,同时考虑当前特征子集和类别的特征排序,包括基尼重要性和候选特征权重,具体通过假设fi是候选特征,xi是选定特征,c是类标签,s表示选定的特征子集以及f表示总的特征集合,并令f表示特征集f中的任...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。