System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及机器学习与数据挖掘,具体是一种基于改进雪消融优化算法的特征选择方法。
技术介绍
1、在大数据时代背景下,随着数据收集技术的不断革新,数据分析的复杂性迅速攀升,数据维度的爆炸性增长成为引发过拟合现象的重要诱因之一。例如在医疗数据挖掘中,数据集中存在很多冗余及不相关的特征,这些特征不仅可能会影响数据采集与处理的效率,还可能对挖掘结果的准确性造成负面影响,需要对数据进行挖掘。在机器学习领域,特征选择是机器学习中分类、回归和数据挖掘中至关重要的预处理步骤,特征选择的目的是利用一种选择方法,删除数据集中冗余和不相关的特征,找到最优特征子集,它不仅能降低数据维度、提高机器学习算法的效率,还能从原始数据集中选出对分类器分类性能最有用的特征,提高其分类精度。
2、传统的特征选择技术,诸如过滤式、包装式和嵌入式方法,在处理海量数据集时往往面临计算资源消耗大、参数调优复杂等挑战。相比之下,启发式搜索算法以其群体迭代搜索的机制展现出独特优势,这类算法模型设计直观、编程实现便捷、所需调整参数有限,并具备强大的优化搜索能力,因此,在处理特征选择问题上显示出更高的适应性。
3、雪消融优化(snow ablation optimizer,sao)算法,作为2023年推出的创新性元启发式算法,在应对复杂优化问题方面展现出了非凡的性能。该算法模拟了自然界中雪的升华与融化现象,在算法设计中巧妙地融入了探索与开发的平衡机制,有效防止了算法提前收敛至局部最优解的问题。当sao算法被拓展至特征选择领域,其独特的搜索逻辑显著降低了特征
4、1、通过雪消融优化算法在对数据特征直接分类效果的准确率仍存在不足,且在完成数据特征直接分类后存在较多干扰特征数量;
5、2、在完成数据集的最高分类后,存在较多干扰的平均特征子集,导致需对平均特征子集进行大量筛选,造成效率的降低;
6、针对以上问题,本专利技术提供了一种基于雪消融优化算法的特征选择方法,以解决上述问题。
技术实现思路
1、为实现上述目的,本专利技术提供如下技术方案:一种基于改进雪消融优化算法的特征选择方法,包括以下步骤:
2、s1:获取数据集中待选取的特征;
3、s2:使用佳点集策略初始化种群;
4、s3:使用支持向量机分类器作为模型,计算种群中每个个体的最佳适应度值;
5、s4:确定所述适应度值排序前三的个体位置及精英种群的质心位置,将这四个个体的位置信息存入精英池数组中;
6、s5:将原种群均匀随机划分为:a种群、b种群;
7、s6:确定种群全部个体的质心位置,更新所述a种群中的个体位置;
8、s7:对所述a种群实现周期振荡突变策略扰动;
9、s8:计算雪融因子ddf及融化速率m的值;
10、s9:更新所述b种群中的个体位置;
11、s10:对最佳所述适应度最优的个体利用测试函数评价分类结果;
12、s11:判断当前迭代次数是否到达设定最大迭代次数;
13、s12:输出最优特征子集。
14、进一步,优选的,依据步骤s1,获取数据集中待选取特征的方法为:
15、s101:获取一个数据集,该所述数据集包含x行数据和y列特征,将所述数据集按照行进行随机划分形成10个子集,从这10个子集中随机挑选一个作为测试集,而余下的9个子集合并作为训练集;
16、s102:对所述训练集和所述测试集的特征数据进行归一化处理。
17、进一步,优选的,依据步骤s2,所述佳点集策略初始化种群方法如下所示:
18、s201:计算佳点r值,r=(r-1,r-2,...,r-n);
19、其中r-i=mod(2cos(2πi-/p),mi,1),1≤i≤n,i表示第i个个体;
20、佳点r=ones(n,1)×2×cos((2×π⊙[1:d])/p),其中d为解空间的维度,p为大于2×d+3的最小整数;
21、s202:构造数量为a的佳点集pn(i)={(r1i1,r2i2,...rnin)},i=1,2,3,...n:
22、其中,a为样本数量;pn(i)为佳点集;
23、s203:将pn映射到种群所在的可行域的上下限中:
24、其中,aj表示当前维度的下限;bj表示当前维度的上限;表示第i个个体在第j个维度的值,即该个体在当前维度的解空间中的位置。
25、进一步,优选的,依据步骤s3,所述适应度值的计算方法包括:
26、minfitness=αγr(d)+βr/y,其中,γr(d)为利用选取的特征子集所得到的分类误差,r为所选取的特征数量,y为所有特征的数量,r/y为所选的特征子集数量与原特征数量相比的缩小比例,α和β分别为控制分类误差和特征数量缩减率的权重系数,适应度函数值越低则代表个体越好。
27、进一步,优选的,依据步骤s4,精英池数组中的某一随机元素与所述种群中精英个体的质心位置更新方法为:
28、elite(t)∈[g(t),xsecond(t),xthird(t),xc(t)]
29、
30、其中,elite(t)表示从精英池数组中选出的某一随机元素,g(t)表示在第t次迭代中适应度最小的最佳个体的位置;xsecond(t)表示适应度从低到高排序为第二的个体的位置;xthird(t)表示适应度排序为第三的个体的位置;xc(t)表示精英种群中个体的质心位置;n1表示精英种群的个体数量。
31、进一步,优选的,依据步骤s5,将原所述种群均匀随机划分为:a种群、b种群。
32、进一步,优选的,依据步骤s6,种群全部个体的质心位置及更新所述a种群中的个体位置的方法如下:
33、
34、
35、其中,表示种群全部个体的质心位置;xi(t)表示第i个个体在第t次迭代中的位置;xi(t+1)表示第i个个体在第t+1次迭代中的位置;elite(t)表示在第t次迭代时从精英池数组中随机选出的一位个体的位置;bmi(t)表示包含服从高斯分布的随机数的向量,用以表示个体在解空间中做布朗运动,g(t)-xi(t)表示解空间中的个体位置更新过程中向最优解靠近的过程,表示不同个体之间存在的相互作用;
36、表示逐项相乘,θ1表示在0和1之间的随机数。
37、进一步,优选的,依据步骤s7,所述周期振荡突变策略,扰动a种群个体位置的方法为:
38、
39、
40、其中,a为自定义的振幅值;fr为自定义的频率;
41、每隔fr-1代,对所述a种群的所有个体的特征应用该突变策略。<本文档来自技高网...
【技术保护点】
1.一种基于改进雪消融优化算法的特征选择方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤S1,获取数据集中待选取特征的方法为:
3.根据权利要求2所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤S2,所述佳点集策略初始化种群方法如下所示:
4.根据权利要求3所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤S3,所述适应度值的计算方法包括:
5.根据权利要求4所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤S4,精英池数组中的某一随机元素与所述种群中精英个体的质心位置更新方法为:
6.根据权利要求5所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤S6,种群全部个体的质心位置及更新所述a种群中的个体位置的方法如下:
7.根据权利要求6所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤S7,所述周期振荡突变策略,扰动a种群个体位置的方法为:
...【技术特征摘要】
1.一种基于改进雪消融优化算法的特征选择方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤s1,获取数据集中待选取特征的方法为:
3.根据权利要求2所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤s2,所述佳点集策略初始化种群方法如下所示:
4.根据权利要求3所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤s3,所述适应度值的计算方法包括:
5.根据权利要求4所述的一种基于改进雪消融优化算法的特征选择方法,其特征在于:依据步骤s4,精英池数组中的某一随机元素与所述种群中精英个体...
【专利技术属性】
技术研发人员:赵婧,史明上,杨雨田,蔡伟斌,李佳,熊瑞雪,
申请(专利权)人:西京学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。