基于邻域搜索策略的特征选择装置制造方法及图纸

技术编号：22975089 阅读：22 留言：0更新日期：2019-12-31 23:34

一种基于邻域搜索策略的特征选择装置，包括：获取单元，适于获取特征搜索空间；所述特征搜索空间包括多个特征子集；选取单元，适于采用基于邻域搜索策略的微粒群算法，从所述特征搜索空间中的特征子集中搜索出全局最优特征子集。上述的方案，可以提高所选取的特征子集的准确性，进而可以提高采用所选取的特征子集中的特征所构建的模型的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于邻域搜索策略的特征选择装置
本专利技术属于计算机
，特别是涉及一种基于邻域搜索策略的特征选择装置。
技术介绍
在机器学习和数据挖掘问题中，经常遇到高维数据集。很显然并非所有特征在建模时都是有用的，其中存在一些无关或冗余特征。在高维数据集上建模会带来高昂的计算成本，同时会降低预测模型的准确性。特征选择的目的是从所有特征中辨别并选出那些有价值的特征，并利用这些特征来建立预测模型。特征选择可以有效地降低建模时间，提升模型准确率以及提供更好的模型解读能力。特征选择是一个非常复杂的组合优化问题。在高维度数据集中，搜索空间规模很大，且特征之间存在复杂的相互关系。假设一个数据集中含有n个特征，那么可能的特征子集就有2n个。传统的穷举方法显然无法应用于高维数据集。进化计算技术是一种具备很强的全局搜索能力的优化算法，很适合用于高维空间的优化问题。其中，微粒群算法因其具备操作简单、收敛速度快等特点，已经被应用于从高维数据集中筛选出优秀的特征子集。但是现有的基于微粒群算法的特征选择模型，所选取的特征子集存在准确性差的问题。
技术实现思路
本专利技术解决的技术问题是如何提高所选取的特征子集的准确性。为了达到上述目的，本专利技术提供一种基于邻域搜索策略的特征选择装置，所述装置包括：获取单元，适于获取特征搜索空间；所述特征搜索空间包括多个特征子集；选取单元，适于采用基于邻域搜索策略的微粒群算法，从所述特征搜索空间中的特征子集中搜索出全局最优特征子集。可选地，所述选取单...

【技术保护点】
1.一种基于邻域搜索策略的特征选择装置，其特征在于，包括：/n获取单元，适于获取特征搜索空间；所述特征搜索空间包括多个特征子集；/n选取单元，适于采用基于邻域搜索策略的微粒群算法，从所述特征搜索空间中的特征子集中搜索出全局最优特征子集。/n

【技术特征摘要】
1.一种基于邻域搜索策略的特征选择装置，其特征在于，包括：
获取单元，适于获取特征搜索空间；所述特征搜索空间包括多个特征子集；
选取单元，适于采用基于邻域搜索策略的微粒群算法，从所述特征搜索空间中的特征子集中搜索出全局最优特征子集。

2.根据权利要求1所述的基于邻域搜索策略的特征选择装置，其特征在于，所述选取单元，适于初始化所述特征搜索空间中的特征子集；
计算所述特征子集之间的相似度矩阵；基于计算得到的相似度矩阵，找到每个特征子集最相似的预设数量个邻近特征子集；从所述预设数量个邻近特征子集中找出适应度数值最大的特征子集，分别作为每个特征子集对应的局域导引；基于对应的局域导引对每个特征子集的位置进行更新，得到每个特征子集更新后的新特征子集；当确定新特征子集的适应度数值大于对应的特征子集的适应度数值时，采用新特征子集代替对应的特征子集；从所述计算所述特征子集之间的相似度矩阵开始执行下一次迭代，直至迭代次数达到预设的次数阈值，得到全局最优特征子集。

3.根据权利要求2所述的基于邻域搜索策略的特征选择装置，其特征在于，所述选取单元，适于采用如下的公式计算所述相似度矩阵中的特征子集之间的相似度：
Sij＝||xi-xj||；
其中，Sij表示第i个特征子集xi与第j个特征子集xj之间的相似度，||xi-xj||表示第i个特征子集xi与第j个特征子集xj之间的欧式距离。

4.根据权利要求1所述的基于邻域搜索策略的特征选择装置，其特征在于，所述选取单元，适于采用如下的公式计算所述特征子集的适应度数值：<...

【专利技术属性】
技术研发人员：仇晨晔，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人