【技术实现步骤摘要】
基于EFO
‑
AOA混合算子的特征选择算法
[0001]本专利技术涉及大数据挖掘与处理
,具体涉及一种基于EFO
‑
AOA混合算子的特征选择算法。
技术介绍
[0002]随着智能电网的建设与发展,传感器技术与状态监测技术的成熟,电网数据呈爆发式增长。而近年来日趋成熟的大数据技术的推广与应用,使得电网的状态监测数据加上与设备的状态密切相关的电网运行、气象环境等数据逐步得到集成共享,推动电网运行状态评价、故障诊断朝基于全景状态监测的信息集成化和综合分析方向发展。
[0003]数据量的巨大增长带来了不同的挑战和问题,如不相关、高维、噪声数据等。因此,这些问题影响机器学习算法的效率和准确性,导致计算成本较高。特征选择算法(Feature Selection,FS)被用来减少计算成本和提高分类精度。FS方法通常用于通过选择相关特性的子集来捕获数据属性并删除部分冗余和噪声数据。其已被广泛应用于不同领域,如人体动作检测、文本分类、COVID
‑
19CT图像分类、神经肌肉疾 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.基于EFO
‑
AOA混合算子的特征选择算法,其特征在于包括以下步骤:第一步:将数据集分为训练集和测试集,并为一组表示特征选择FS目标特征的个体设置初始值;第二步:Step1:通过计算每个特征个体的布尔逻辑值,并根据布尔逻辑值对应的特征计算对应的特征个体适应度函数值;Step2:确定每个特征个体的适应度值,并将具有做优适应度值的个体作为最佳特征个体使用,在迭代更新时,EFO算子通过主动电定位与被动电定位以发现包含最优解的可行区域;Step3:根据随机概率,使用AOA运算符执行运算策略,再次执行Step2更新特征的过程,迭代至达到停止标准为止。2.电鳗寻优算法EFO,其特征在于:包含主动电定位、被动电定位;定义区域解N,其含义为:可能包含所有目标解向量的范围,区域解N通过随机初始化搜索空间并考虑到区域边界,得到:x
ij
=xmin j+rand(xmax j
‑
xmin j)
ꢀꢀꢀ
(1);其中:x
ij
为初始特征个体,x
minj
为落在区域解上边界的特征个体,x
maxj
为落在区域解下边界的特征个体,rand()为随机数函数;在EFO中,频率较高的位置使用主动电定位,而频率较低的位置使用被动电定位,频率值为适应度函数值的最大值和最小值之间给出其中:f
it
为解数i在每个迭代数t的适应度值;和分别为获得的最差和最佳适应度函数值;f
max
‑
f
min
是最大和最小适应度函数值的插值;表示解数i在第t次迭代时的适应度值;f
min
、f
max
分别表示最大和最小适应度值;区域解数I(A
i
)的振幅确定如下:其中:α是范围[0,1]内的值;表示解数i在第t
‑
1次迭代时的振幅;主动电定位范围估计值确定方法如下:r
i
=(xmax j
‑
xmin j)A
i
ꢀꢀꢀ
(4);其中:r
i
、A
i
分别表示主动电定位范围估计值、解数i的振幅;为了在区域空间中发现相邻解,需要估计当前解与其他解之间的距离,解数i与k之间的距离计算如下:其中:d
ik
表示解数i与解数k的距离;||x
i
‑
x
j
|||是欧式距离标准公式;x
ij
‑
x
kj
指解数i与解数k的欧式距离;j代表迭代次数,d是迭代次数最大值;如果在区域空间中发现至少一个相邻解,则使用式(6);否则,使用式(7):
其中:表示区域解的侯选位置、φ的取值范围在[
‑
1,1]之间、φ(x
kj
‑
x
ij
)是一个权重参量,范围为[
‑
1,1],用于限制搜索区域一直在区域空间内进行;其中:φ
rj
表示特征个体在源位置的权重参量;被动空间中区域解数i的概率确定如下:其中:P
k
表示k解的概率;A
k
表示k的振幅;d
ik
表示解数i与解数k的欧式距离;A
j
表示j的振幅;d
ij
表示解数i与解数j的欧式距离;N
A
表示振幅空间;k解由公式(8)确定,源位置x
rj
由公式(9)定义,新位置由公式(10)产生:其中:k代表解数;K代表所有的解数,K=1,2,3,...,k,k+1,...,;在少数情况下,具有较高频率的解会产生被动电定位;为了避免这种情况,确定公式(11)以选择参数值:其中:fi表示解数i的适应度值;被动空间的最终作用是通过公式(12)改变区域解数i的参数,以提高表示交换的特征的可能性:如果区域解数i的参数编号j的值超出了边界,则会将其重新定位到以下限制:其中:表示区域解的候选位置;x
minj
表示解数下边界,x
maxj
技术研发人员:程江洲,闫冉阳,张晓瑀,冯梦婷,冯馨以,
申请(专利权)人:三峡大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。