【技术实现步骤摘要】
一种基于属性动态选择与灰度关联分析的缺失值填补方法
本专利技术属于数据处理领域,具体涉及一种基于属性动态选择与灰度关联分析的缺失值填补方法。
技术介绍
随着健康中国战略的推进,以治病为中心转变为以人民健康发展为中心的新主旨深入人心,人们的健康意识在不断提升,各类健康投入也在迅猛攀升。越来越多的厂家将目光转向家用医疗检测仪和智慧移动设备的研发生产,将其作为抢占健康市场的热门产品。医用健康设备飞速发展不断更新原有健康管理方式,用户依托这些技术设备自行采集的检测数据也在不断增长,将在国家层面的居民健康战略指导和个人健康应用服务方面发挥重要作用。然而,这些智能健康检测设备的某些技术问题,或是用户由于未按时采集、采集方式不当、数据存储不及时等原因造成的数据缺失,都会导致后续的预测诊断和精准指导出现偏差,难以达成预期目标。对于此类缺失问题,最好的解决办法是进行有效的数据填补。对于现有概念下的检测数据来说,其数据本身具有用户主体上的同一性和时间上的连续性,数据间亦具有一定的相关性。因此在对此类数据集上的缺失值进行填补时,可以采用身 ...
【技术保护点】
1.一种基于属性动态选择的缺失数据填补方法,其特征在于包括以下步骤:/n步骤1:对包含缺失值的原始数据集基于朴素方法进行初始填补;/n步骤2:在完成初始填补的基础上,执行属性动态选择,对每个待填补属性只筛选出相关性较大的属性用于后续计算;/n步骤3:采用灰度关联度作为样本间距离度量公式执行K近邻计算,在距离计算中将高斯核函数优化后的属性间关联系数作为相关权重,得到待填补样本与其他样本间的灰度关联距离,由此距离排序获得最相近的K个邻居;/n步骤4:根据待填补数据的具体属性,对K个邻居的同一属性值进行加权计算,将其作为下一次填补的初始值并不断迭代,直到前后两次填补值的差值收敛于 ...
【技术特征摘要】
1.一种基于属性动态选择的缺失数据填补方法,其特征在于包括以下步骤:
步骤1:对包含缺失值的原始数据集基于朴素方法进行初始填补;
步骤2:在完成初始填补的基础上,执行属性动态选择,对每个待填补属性只筛选出相关性较大的属性用于后续计算;
步骤3:采用灰度关联度作为样本间距离度量公式执行K近邻计算,在距离计算中将高斯核函数优化后的属性间关联系数作为相关权重,得到待填补样本与其他样本间的灰度关联距离,由此距离排序获得最相...
【专利技术属性】
技术研发人员:朱粤婕,王建新,严承,张志,
申请(专利权)人:中南大学,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。