多层感知网络下糖尿病血检异常值辅助剔除方法技术

技术编号：34602276 阅读：24 留言：0更新日期：2022-08-20 09:05

本发明专利技术公开了一种多层感知网络下糖尿病血检异常值辅助剔除方法。本发明专利技术先根据无监督机器学习算法找出可能的异常值即离群值，根据是否是离群值分类，抽取数据后再交由专业医生对是否是异常值标注标签，从而变为分类任务，最后通过MLP模型(多层感知器)判断是否为异常数据。由于部分血液检查的结果数值分布比较特殊，单用无监督学习分离离群值，会导致离群的正常值被当作异常值，而本发明专利技术进行分层抽样后变为分类数据可以改善这种问题。另外本发明专利技术的分类任务还能考虑到不同变量对于检查值的影响，例如三甲医院的检验值可信度更高等。例如三甲医院的检验值可信度更高等。例如三甲医院的检验值可信度更高等。

全部详细技术资料下载

【技术实现步骤摘要】
多层感知网络下糖尿病血检异常值辅助剔除方法

[0001]本专利技术涉及一种用于处理糖尿病患者血液检查异常值的算法，属于医学数据异常值处理

技术介绍

[0002]异常值处理方法主要包括统计学方法以及机器学习方法。统计学方法通过对数据进行描述统计分析，观察其方差、标准差、均值等是否和常规值有所差异来判断异常值。机器学习方法通常采用聚类等无监督学习来分离离群值。
[0003]但对于医疗数据而言，不同的检验项目的异常值有着截然不同的分布，显然采用统计学方法无法应对。而某些检验项目的正常值可能恰好是分离值，因此采用无监督学习方式来判断异常值会导致离群的正常值被当作异常值。

技术实现思路

[0004]本专利技术要解决的技术问题是：现有的异常值处理方法无法全面应对医疗数据不同检验项目的异常值具有截然不同分布的问题。
[0005]为了解决上述技术问题，本专利技术的技术方案是提供了一种多层感知网络下糖尿病血检异常值辅助剔除方法，其特征在于，包括以下步骤：
[0006]步骤1、检查来自不同医院的各检查项名称，将属于同一检查项目的不同检查项名称归为同一组；
[0007]步骤2、获取来自不同医院的每个分组下的检查数据；
[0008]步骤3、对检查数据进行初步清洗；
[0009]步骤4、采用无监督学习方式分离每个分组下的离群数据，获得每个分组下的离群数据以及非离群数据；
[0010]步骤5、设定多个分类变量，并获取与检查数据相对应的分类变量的数据值，各分类变量的...

【技术保护点】

【技术特征摘要】
1.一种多层感知网络下糖尿病血检异常值辅助剔除方法，其特征在于，包括以下步骤：步骤1、检查来自不同医院的各检查项名称，将属于同一检查项目的不同检查项名称归为同一组；步骤2、获取来自不同医院的每个分组下的检查数据；步骤3、对检查数据进行初步清洗；步骤4、采用无监督学习方式分离每个分组下的离群数据，获得每个分组下的离群数据以及非离群数据；步骤5、设定多个分类变量，并获取与检查数据相对应的分类变量的数据值，各分类变量的数据值包括医院的属性值、患者的属性值、检查时间的属性值以及检查项的属性值；步骤6、从每个分组的离群数据以及非离群数据中分别抽取检查数据样本，并获得与每个检查数据样本相对应的分类变量的数据值；步骤7、由医生判断步骤6抽取的检查数据样本是否为异常值，并打上标签；步骤8、对每个检查数据样本相对应的所有分类变量的数据值做嵌入矩阵处理，其中，所有分类变量中的连续数据值在做嵌入矩阵处理前先进行标准化处理，将标准化处理后的连续数据值做嵌入矩阵处理，同时将检查数据样本也做嵌入矩阵处理，则对于每个检查数据样本都能够获得一个对应的输入矩阵，该输入矩阵包括检查数据样本以及对应的所有分类变量的数据值；步骤9、将步骤...

【专利技术属性】
技术研发人员：潘铮，蔡淳，张天驰，陈诚，沈赟，曹川韡，钟翌曦，童庆，尚明曦，崔欣，黎衍云，刘月星，赵晓静，
申请(专利权)人：万达信息股份有限公司上海市第六人民医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人