一种属性处理方法及服务器技术

技术编号:15704832 阅读:42 留言:0更新日期:2017-06-26 09:55
本发明专利技术公开了一种属性处理方法及服务器,其中方法包括:获取到针对至少两个样本数据的N个属性,N为大于等于2的整数;计算得到所述N个属性中任意两个属性之间的相关系数;基于所述N个属性中任意两个属性之间的相关系数,确定由N个属性组成的有向网络;基于所述有向网络,计算得到所述N个属性的重要度;基于所述N个属性的重要度,从所述N个属性中选取M个属性组成属性集合,其中,M为大于等于1且小于等于N的整数。

【技术实现步骤摘要】
一种属性处理方法及服务器
本专利技术涉及通信领域中的数据处理技术,尤其涉及一种属性处理方法及服务器。
技术介绍
随着信息技术的不断进步,尤其是社交网络、移动互联网、云计算、物联网等互联网技术的广泛应用,人们的各种社会活动、沟通设备、传感器正在生成海量数据。面对海量数据的迅猛增长,如何更有效的分析长期积累、持续增长的海量数据,从中挖掘出价值,用于支撑决策和业务发展是当今众多拥有大规模数据的企业所面临的严峻挑战。数据挖掘中属性约简是数据挖掘中非常重要的数据预处理步骤,目的在于删除不相关、弱相关或者冗余的属性,精确地揭示属性与属性、属性与类别之间的相关性。目前较为常用的属性约简方法主要包括基于粗糙集理论的属性约简方法和主成分分析法。基于粗糙集理论的属性约简方法,是指在保持分类能力不变的条件下,删除其中不相关或者不重要的属性,目标是要从条件属性集合中发现部分必要的条件属性,使得根据这部分条件属性形成的相对于决策属性的分类和所有条件属性所形成的相对于决策属性的分类一致,即和所有条件属性相对于决策属性有相同的分类能力。主成分分析方法的基本思想是借助一个正交变换,将分量相关的原随机变量转换为分量不本文档来自技高网...
一种属性处理方法及服务器

【技术保护点】
一种属性处理方法,其特征在于,所述方法包括:获取到针对至少两个样本数据的N个属性,N为大于等于2的整数;计算得到所述N个属性中任意两个属性之间的相关系数;基于所述N个属性中任意两个属性之间的相关系数,确定由N个属性组成的有向网络;基于所述有向网络,计算得到所述N个属性的重要度;基于所述N个属性的重要度,从所述N个属性中选取M个属性组成属性集合,其中,M为大于等于1且小于等于N的整数。

【技术特征摘要】
1.一种属性处理方法,其特征在于,所述方法包括:获取到针对至少两个样本数据的N个属性,N为大于等于2的整数;计算得到所述N个属性中任意两个属性之间的相关系数;基于所述N个属性中任意两个属性之间的相关系数,确定由N个属性组成的有向网络;基于所述有向网络,计算得到所述N个属性的重要度;基于所述N个属性的重要度,从所述N个属性中选取M个属性组成属性集合,其中,M为大于等于1且小于等于N的整数。2.根据权利要求1所述的方法,其特征在于,所述基于所述N个属性中任意两个属性之间的相关系数,确定由N个属性组成的有向网络,包括:将所述N个属性分别作为N个节点;将所述N个属性中任意两个属性之间的相关系数作为所述任意两个属性对应的节点之间的边;基于所述N个节点以及任意两个属性对应的节点之间的边构成所述有向网络。3.根据权利要求2所述的方法,其特征在于,所述计算得到所述N个属性的重要度,包括:基于有向网络,逐个选取N个节点中的一个节点对应的属性作为第一属性;基于所述有向网络中的边,选取与所述第一属性相关的属性集合;基于所述第一属性的第一重要度、以及所述属性集合中的属性数量以及所述第一属性与所述属性集合中每一个属性之间的相关系数,计算得到所述第一属性的第二重要度;直至计算完成所述有向网络中N个节点对应的属性的第二重要度。4.根据权利要求3所述的方法,其特征在于,所述计算完成所述有向网络中N个节点对应的属性的第二重要度之后,所述方法还包括:计算N个节点对应的属性的第二重要度与第一重要度之间的差值,得到N个节点对应的属性的差值的和;判断所述差值之和是否小于预设的门限值,若所述差值的和小于预设的门限值,则确定所述N个节点对应的属性的重要度等于其对应的第二重要度;否则,将所述第二重要度设置为第一重要度,继续进行N个节点对应的属性的第二重要度。5.根据权利要求1-4任一项所述的方法,其特征在于,所述基于所述N个属性的重要度,从所述N个属性中选取M个属性组成属性集合,包括:对所述N个属性的重要度按照从大到小的顺序进行...

【专利技术属性】
技术研发人员:鲍媛媛
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1