一种基于二进制萤火虫算法的属性选择方法技术

技术编号:13457834 阅读:48 留言:0更新日期:2016-08-03 16:15
本发明专利技术公开了一种基于二进制萤火虫算法的属性选择方法,其特征按如下步骤进行:步骤1、利用分形维数盒计法计算高维数据集的分形维数,获得的所要选择属性的个数;步骤2、初始化萤火虫种群;步骤3、利用二进制萤火虫算法对高维数据集的多个属性进行选择,获得最优属性子集;步骤4、输出最优解。本发明专利技术使用二制萤火虫算法作为属性选择的搜索策略,以分形维数作为属性选择评估度量准则,从高维数据集的多个指标属性中选择一个较优的属性子集,这样能够降低数据处理的复杂性,提高数据处理的效率,从而满足解决实际问题的需要。

【技术实现步骤摘要】

本专利技术涉及数据挖掘与模式识别中的数据预处理领域,具体的说是一种基于二进制萤火虫算法的属性选择方法
技术介绍
数据挖掘(DataMining)指从海量的数据中通过一系列复杂的算法探索隐藏于数据中的有效信息的行为,而数据的高维性和多属性会影响数据挖掘的性能。因此,需要对高维数据集进行降维预处理,从而提高数据挖掘的效率。所谓数据降维就是按照一定的准则从原始数据集的属性集中选取一个最具代表性的属性子集,又称属性选择。属性选择是以属性变量与目标属性之间的相关关系及冗余关系测度为基础,根据事先设定的属性评估标准或评估函数来选择数据挖掘模型所需的输入属性。属性选择的关键在于评估度量和搜索策略这两方面。现有的经典属性选择算法主要从两个角度进行考虑:其一,侧重属性选择的评估度量准则研究。InbaraniH,ArafatH及JingSY等人将粗糙集理论作为待选属性子集的评估度量准则来解决属性选择问题。随着分形理论的发展,分形维数作为评估度量准则,并证明其有效性与可行性。其中,Train本文档来自技高网...

【技术保护点】
一种基于二进制萤火虫算法的属性选择方法,其特征是按如下步骤进行:步骤1、利用分形维数盒计法计算维度为d的高维数据集的分形维数,获得的计算结果d1,并向上取整后作为选择属性的个数m;m<d;步骤2、初始化萤火虫种群X;初始化第i只萤火虫为xi,并有xi=(xi1,xi2,…,xik,…,xid),i=1,2,…n;xik表示第i只萤火虫的第k位;并有xik=1表示第i只萤火虫的第k个属性被选择;并有xik=0表示第i只萤火虫的第k个属性未被选择;且从而初始化萤火虫种群X={x1,x2,…,xi,…,xn};以第i只萤火虫为xi作为属性选择的第i个解;定义第i只萤火虫xi的荧光素挥发因子为ρ、荧光...

【技术特征摘要】
1.一种基于二进制萤火虫算法的属性选择方法,其特征是按如下步骤进行:
步骤1、利用分形维数盒计法计算维度为d的高维数据集的分形维数,获得的计算结果
d1,并向上取整后作为选择属性的个数m;m<d;
步骤2、初始化萤火虫种群X;
初始化第i只萤火虫为xi,...

【专利技术属性】
技术研发人员:倪志伟李敬明张琛朱旭辉金飞飞伍章俊
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1