【技术实现步骤摘要】
一种惰性降维方法、系统、计算机设备及存储介质
[0001]本专利技术涉及数据科学
,尤其涉及一种惰性降维方法、系统、计算机设备及存储介质。
技术介绍
[0002]数据降维是一种常见的数据处理方法,常见于数学建模过程。在数据维度很高时,数学建模需要庞大的计算资源,所以希望可以将高维数据压缩至低维数据,且不影响原始数据的质量,在加速计算的情况下,达到预期的效果。
[0003]数据降维的问题在于降维后的数据会失去数据原本的含义,数据属性含糊,甚至无法直观地解释。另外,原始数据属性本身具有意义,属性之间的重要性或许不同,而单纯地叠加数据内部信息量去降维会造成数据失真,导致预测偏差。
技术实现思路
[0004]有鉴于此,本专利技术提出了一种惰性降维方法、系统、计算机设备及存储介质,改善了传统数据降维中仅对数据进行单纯叠加导致数据失真、预测偏差大等问题。
[0005]基于上述目的,本专利技术实施例的一方面提供了一种惰性降维方法,具体包括如下步骤:
[0006]获取高维数据,所述高维数据的每一 ...
【技术保护点】
【技术特征摘要】
1.一种惰性降维方法,其特征在于,包括:获取高维数据,所述高维数据的每一行表示样本数据,每一列表示样本属性;计算所述高维数据中的各个属性下对应样本数据的方差,并将各个属性按照其对应的方差大小进行排序;按照帕累托法则从按方差排序后的属性中确定第一组属性;基于主成分分析法对所述按方差排序后的属性中的其余属性进行主成分计算以得到主成分属性,并对所述主成分属性按照其对应特征值大小进行排序;按照帕累托法则从按主成分排序后的主成分属性中确定第二组属性;判断上述确定的各组属性的数量之和是否满足预设条件,并基于判断结果确定最终的降维数据。2.根据权利要求1所述的方法,其特征在于,所述将各个属性按照其对应的方差大小进行排序包括:将各个属性按照其对应的方差大小从大到小进行排序。3.根据权利要求2所述的方法,其特征在于,所述按照帕累托法则从按方差排序后的属性中确定第一组属性包括:按照帕累托法则将按方差排序后的属性中前20%的属性确定为第一组属性。4.根据权利要求1所述的方法,其特征在于,所述对所述主成分属性按照其对应特征值大小进行排序,包括:对所述主成分属性按照其对应特征值大小从大到小进行排序;按照帕累托法则从按主成分排序后的主成分属性中确定第二组属性包括:按照帕累托法则将所述按主成分排序后的主成分属性中前20%的属性确定为第二组属性。5.根据权利要求1所述的方法,其特征在于,所述基于判断结果确定最终的降维数据包括:响应于上述确定的各组属性的数量之和满足预设条件,组合各组属性下的数据以得到降维数据。6.根据权利要求1所述的方法,其特征在于,进一步包括:响应于上述确定的各组属性的数量之和不满足预设条件,返回基于主成分分析...
【专利技术属性】
技术研发人员:邹德强,
申请(专利权)人:山东云海国创云计算装备产业创新中心有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。