一种医疗健康大数据优化采集方法技术

技术编号:40844794 阅读:24 留言:0更新日期:2024-04-01 15:12
本发明专利技术涉及数据处理技术领域,尤其涉及一种医疗健康大数据优化采集方法,该方法获取初始医疗健康大数据,对初始医疗健康大数据进行预设的数据预处理,得到医疗健康大数据,获取医疗健康大数据中的任一类目标数据;获取目标数据的平滑拟合曲线;将目标数据与平滑拟合曲线上对应的拟合值做差,得到差值集合,根据差值集合构建得到差值直方图,根据差值直方图的正态分布曲线和概率密度曲线,确定正态分布时区间,根据正态分布时区间确定目标数据中的异常目标数据,对目标数据中的异常目标数据进行剔除,得到优化后的医疗健康大数据,提高了对目标数据进行跳点数据清洗的效果,完成了对医疗健康大数据的优化采集。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种医疗健康大数据优化采集方法


技术介绍

1、在当今数字化时代,医疗健康领域积累了大量的数据,包括病患信息、医学影像、实验室结果等。这些大数据的采集、管理和分析对于医疗决策、科学研究以及患者个性化治疗具有重要意义。但医疗健康大数据在采集和传输过程中由于设备老化和噪声影响,往往会产生异常值,因此,在对医疗健康大数据采集时,需要对医疗健康大数据进行数据清洗。

2、传统数据清洗包括跳点数据的去除、缺失数据的填补、重复数据的剔除和漂移数据的对齐,其中缺失数据的填补、重复数据的剔除和漂移数据的对齐可以根据邻域数据的相似性进行处理,而跳点数据主要分为三类,分别为明显超出数据正常波动范围的“野点”、处于数据正常波动范围内但明显偏离整体变化趋势的异常点以及在数据变化趋势周围小范围波动的异常点。跳点去除难以根据邻域数据进行判定,传统跳点去除通常采用阈值法,阈值法对第一类跳点(突变式)效果较好,但对后两类跳点(渐进式)处理效果较差,渐进式跳点较难处理且在实际监测过程中也更为常见。

3、因此,如何提高对医疗健康大数据进行本文档来自技高网...

【技术保护点】

1.一种医疗健康大数据优化采集方法,其特征在于,所述一种医疗健康大数据优化采集方法包括:

2.根据权利要求1所述的一种医疗健康大数据优化采集方法,其特征在于,所述根据所述正态分布曲线和所述概率密度曲线,获取所述目标数据的平滑拟合曲线,包括:

3.根据权利要求2所述的一种医疗健康大数据优化采集方法,其特征在于,所述根据所述对比结果确定所述正态分布曲线上的目标正态分布时区间,包括:

4.根据权利要求1所述的一种医疗健康大数据优化采集方法,其特征在于,所述根据所述正态分布时区间确定所述差值集合中的异常差值,包括:

5.根据权利要求1所述的一种医疗...

【技术特征摘要】

1.一种医疗健康大数据优化采集方法,其特征在于,所述一种医疗健康大数据优化采集方法包括:

2.根据权利要求1所述的一种医疗健康大数据优化采集方法,其特征在于,所述根据所述正态分布曲线和所述概率密度曲线,获取所述目标数据的平滑拟合曲线,包括:

3.根据权利要求2所述的一种医疗健康大数据优化采集方法,其特征在于,所述根据所述对比结果确定所述正态分布曲线上的目标正态分布时区间,包括:

4.根据权利要求1所述的一种医疗健康大数据优化采集方法,其特征在于,所述根据所述正态分布时区间确定所述差值集合中的异常差值,包括:

5...

【专利技术属性】
技术研发人员:戈艺
申请(专利权)人:济宁医学院附属医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1