【技术实现步骤摘要】
一种基于集成学习与改变决策阈值的化验数据校验方法
本专利技术属于大数据
,涉及一种基于集成学习与改变决策阈值的化验数据校验方法。
技术介绍
传统的化验数据的准确性依赖于医生的经验积累和外部化验环境,外界环境的干扰也会对化验数据造成不良影响。随着机器学习的不断发展,近年来不断有学者开始研究基于机器学习的化验数据准确度验证方法,但是数据的种类多种多样,且越来越复杂和多样性,基于单分类器建立的化验数据的验证已经无法保证其分类的准确性。
技术实现思路
本专利技术的目的是提供一种基于集成学习与改变决策阈值的化验数据校验方法,解决了有效的对化验数据进行分类准确度验证的技术问题。为实现上述目的,本专利技术采用如下技术方案:一种基于集成学习与改变决策阈值的化验数据校验方法,包括如下步骤:步骤1:建立数个远程终端和中心服务器,所有远程终端均通过互联网与中心服务器通信;在远程终端中建立数据采集模块、数据清洗模块和分类模块;在中心服务器中建立对比数据集和多指标评价模块;步骤 ...
【技术保护点】
1.一种基于集成学习与改变决策阈值的化验数据校验方法,其特征在于:包括如下步骤:/n步骤1:建立数个远程终端和中心服务器,所有远程终端均通过互联网与中心服务器通信;/n在远程终端中建立数据采集模块、数据清洗模块和分类模块;/n在中心服务器中建立对比数据集和多指标评价模块;/n步骤2:远程终端通过数据采集模块获取体液化验数据,建立体液数据集,并在数据清洗模块中对体液数据集中的数据进行清洗,包括如下步骤:/n步骤S1:对体液化验数据中的缺失值和异常值进行处理,剔除异常数据,得到预处理数据集;/n步骤S2:通过均值方差归一化将预处理数据集中的数据转换为同一水平下的数据,得到预处理 ...
【技术特征摘要】
1.一种基于集成学习与改变决策阈值的化验数据校验方法,其特征在于:包括如下步骤:
步骤1:建立数个远程终端和中心服务器,所有远程终端均通过互联网与中心服务器通信;
在远程终端中建立数据采集模块、数据清洗模块和分类模块;
在中心服务器中建立对比数据集和多指标评价模块;
步骤2:远程终端通过数据采集模块获取体液化验数据,建立体液数据集,并在数据清洗模块中对体液数据集中的数据进行清洗,包括如下步骤:
步骤S1:对体液化验数据中的缺失值和异常值进行处理,剔除异常数据,得到预处理数据集;
步骤S2:通过均值方差归一化将预处理数据集中的数据转换为同一水平下的数据,得到预处理后数据集;
步骤S3:将预处理后数据集中的70%的数据划分为训练集,再将其中30%的数据划分为测试集;
步骤3:分类模块选择KNN、决策树、支持向量机和逻辑回归算法四种不同的单分类器作为基分类器,组合得到一个集成分类器;
步骤4:远程终端读取中心服务中的对比数据集;
步骤5:分类模块计算基分类器权重,包括如下步骤:
步骤S4:对训练集中的样本通过FCM模糊聚类算法进行聚类划分为两类样本;
步骤S5:基分类器分别在这两类样本上进行分类,通过与对比数据集中的实际标签进行对比,得到每个基分类器的分类错误率e;
步骤S6:根据公式计算得到每个基分类器的权重w;
步骤6:分类模块计算测试集中每个测试样本到每个聚类中心的欧氏距离,将欧氏距离的倒数...
【专利技术属性】
技术研发人员:赵杰,翟运开,叶明,石金铭,陈昊天,卢耀恩,张旭,李明原,
申请(专利权)人:郑州大学第一附属医院,
类型:发明
国别省市:河南;41
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。