当前位置: 首页 > 专利查询>温州大学专利>正文

基于前哨多种群机制果蝇优化算法来构建预测模型的方法技术

技术编号:21479096 阅读:60 留言:0更新日期:2019-06-29 05:08
本发明专利技术提供一种基于前哨多种群机制果蝇优化算法来构建预测模型的方法,包括获取样本数据并对所获取到的样本数据进行归一化处理;利用基于前哨机制和多种群增强机制的果蝇优化支持向量机的惩罚因子C和核宽γ;基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建预测模型,并基于所构建的预测模型对待分类样本进行分类和预测。实施本发明专利技术,通过基于前哨机制和多种群增强机制的果蝇优化算法来优化SVM的惩罚因子和核宽,可有效提升算法的收敛速度和收敛精度,提升算法逃脱局部最优解的能力,找到更优的全局近似最优解。

【技术实现步骤摘要】
基于前哨多种群机制果蝇优化算法来构建预测模型的方法
本专利技术涉及计算机
,尤其涉及一种基于前哨多种群机制果蝇优化算法来构建预测模型的方法。
技术介绍
支持向量机(SVM)常用于构建预测模型来对数据进行分析,该支持向量机(SVM)最常用的两种参数优化方法包括网格搜索和梯度下降。在第一种参数优化方法中,网格搜索是一种穷举搜索方法,它一般是通过设置合理的区间上下限和间隔步长对指定参数空间进行划分,然后对每个网格节点代表的参数组合进行训练和预测,将这些预测结果中取值最高的一组参数作为最终SVM模型的最佳参数。该方法虽然在一定程度上能保证得到给定参数空间内最优的参数组合,然而随着参数空间增大,其搜索效率会大大降低,特别是设置合理的区间和间隔步长值往往非常困难,从而大大降低了其可行性,而且模型也非常容易陷入局部最优值;在第二种参数优化方法中,梯度下降方法虽然能克服网格搜索方法的缺陷,但是它对初始值非常敏感,特别是初始参数设置离最优解非常远的时候,模型很容易收敛到局部最优解。近年来,由于元启发式的搜索算法凭借其独特的全局寻优能力而受到了学术和工业界的广泛关注,它们被普遍认为比传统寻优方法具有更大的机会找到全局最优解,因此提出多种基于元启发式算法的SVM训练算法来处理参数优化问题。SVM在具体应用时,其性能主要受包括线性核函数、多项式核函数、径向基(RBF)核函数和sigmoid核函数等核函数影响,一般情况下选择基于RBF核函数的SVM。RBF核SVM主要涉及两个重要的参数C和γ。C是惩罚因子,它用于控制对错分样本惩罚的程度,起到控制训练误差和模型复杂度之间平衡的作用;C值越小,则对数据中误判样本的惩罚也越小,使得训练误差变大,因此结构风险也变大。相反,C值越大,对错分样本的约束程度就越大,这样会导致模型虽然对训练数据的误判率很低,但整体的泛化能力却很差,容易出现“过拟合”现象。参数γ代表RBF核函数中的核宽,它决定了核函数的宽度,直接影响SVM的性能。如果γ取得不恰当,SVM很难获得预期的学习效果。γ值太小会导致过拟合,γ值太大会使SVM的判别函数过于平缓。所以惩罚因子C和核宽γ从不同的角度影响着SVM的分类超平面。在实际应用中,它们取值过大或过小都会使SVM的泛化性能变差。但是,采用现有的元启发式的搜索算法来处理SVM参数优化问题,还有待进一步提升算法的收敛速度和收敛精度,提升算法逃脱局部最优解的能力,从而找到更优的全局近似最优解。
技术实现思路
本专利技术实施例所要解决的技术问题在于,提供一种基于前哨多种群机制果蝇优化算法来构建预测模型的方法,通过基于前哨机制和多种群增强机制的果蝇优化算法(MOFOA)来优化SVM的惩罚因子和核宽,可有效提升算法的收敛速度和收敛精度,提升算法逃脱局部最优解的能力,找到更优的全局近似最优解。为了解决上述技术问题,本专利技术实施例提供了一种基于前哨多种群机制果蝇优化算法来构建预测模型的方法,所述方法包括以下步骤:步骤S1:获取样本数据并对所获取到的样本数据进行归一化处理;步骤S2、利用基于前哨机制和多种群增强机制的果蝇优化支持向量机的惩罚因子C和核宽γ,具体为:步骤S2.1、定义最大评估数MaxFE,子群数M,种群数popsize和种群位置范围LR;其中,果蝇种群的初始位置(Xaxis,Yaxis)在给定范围内随机定义;Xaxis=rand(LR),Yaxis=rand(LR)(I)步骤S2.2、执行公式(2),使果蝇个体i通过嗅觉随机搜寻食物,得到果蝇个体i的位置(Xi,Yi);Xi=Xaxis+rand(LR),Yi=Yaxis+rand(LR)(2)步骤S2.3、利用公式(3),将果蝇群体分为M个子群;步骤S2.4、首先,使用公式(4)评估从群体中的果蝇个体i到初始位置的距离;其次,利用公式(5),使用距离的倒数作为气味浓度测定值,其中,Si,1表示果蝇在当前位置时的C值,Si,2表示果蝇在当前位置时的γ值;步骤S2.5、执行前哨机制,通过公式(6)和(7)来对比预飞行果蝇个体和历史果蝇个体的适应度值,选出适应度值更优的果蝇作为当前进行搜索的果蝇;其中,λ表示果蝇的位置坐标;[λ]=min(function(Stemp),function(Si))(6)Si=Sλ(7)步骤S2.6、利用公式(8),将果蝇群体位置映射至正态分布中,其中,G(θ)用以产生高斯梯度的正态分布向量,Muti表示映射至正态分布后的果蝇位置,之后再执行一次公式(6),选出更优的果蝇个体;步骤S2.7、利用公式(9)-(13),将气味浓度Si代入气味浓度测定功能,以找到果蝇位置的气味浓度Smelli,并将该值作为果蝇气味浓度Smelli,j的值;其中,果蝇位置的气味浓度Smelli基于果蝇个体i当前位置的C和γ值,以内部K折交叉验证策略计算支持向量机的准确度ACC获取的;bestSmell表示果蝇中气味浓度最佳的浓度值,bestindex表示浓度最佳的果蝇的坐标,bestPosition表示当前最佳气味浓度值的果蝇的位置;Smelli,j=Fitnessfunction(Si,j)(9)[bestSmell,bestindex]=min(Smelli,j)(10)Xaxis=Xbestindex,Yaxis=Ybestindex(11)bestPosition=Sbestindex(12)bestCV=bestSmell(13)若bestSmell优于bestCV,则更新Xaxis,Yaxis,bestPosition和bestCV;其中ACC是基于K折交叉验证获取的平均准确度,并根据公式(14)计算获得;acck表示每一折数据上计算获得的准确度;步骤S2.8、判断是否达到了最大评估数MaxFE;若否,则重复步骤S2.2-S2.7,进行下一次评估操作;若是,则跳转到步骤S2.9;步骤S2.9、输出果蝇的位置bestPosition,即最优的惩罚因子C和核宽γ值;步骤S3、基于所获得的惩罚因子C和核宽γ,利用所归一化处理后的数据来构建下述公式(15)所示的预测模型,并基于所构建的预测模型对待分类样本进行分类和预测;其中,K(·)采用公式(16)所示;xj表示第j个归一化处理后的样本数据;xi(i=1...l)表示训练样本;yi(i=1...l)表示训练样本对应的标签,yi=1代表正类样本,yi=-1代表负类样本;b为阈值;αi是拉格朗日系数;K(xi,xj)=exp(-r||xi-xj||2)(16)。实施本专利技术实施例,具有如下有益效果:本专利技术通过基于前哨机制和多种群增强机制的果蝇优化算法(MOFOA)将优化SVM的惩罚因子C和核宽γ编码为果蝇食物的位置进行优化,并在优化过程中采用K折交叉验证,不仅使算法能快速收敛从而有效地找到最优值,还能防止算法陷入局部最优解。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,根据这些附图获得其他的附图仍属于本专利技术的范畴。图1为本专利技术实施例提供的基于前哨多种群机制果蝇优化算法来构建预测模本文档来自技高网
...

【技术保护点】
1.一种基于前哨多种群机制果蝇优化算法来构建预测模型的方法,其特征在于,所述方法包括以下步骤:步骤S1:获取样本数据并对所获取到的样本数据进行归一化处理;步骤S2、利用基于前哨机制和多种群增强机制的果蝇优化支持向量机的惩罚因子C和核宽γ,具体为:步骤S2.1、定义最大评估数MaxFE,子群数M,种群数popsize和种群位置范围LR;其中,果蝇种群的初始位置(Xaxis,Yaxis)在给定范围内随机定义;Xaxis=rand(LR),Yaxis=rand(LR)           (1)步骤S2.2、执行公式(2),使果蝇个体i通过嗅觉随机搜寻食物,得到果蝇个体i的位置(Xi,Yi);Xi=Xaxis+rand(LR),Yi=Yaxis+rand(LR)       (2)步骤S2.3、利用公式(3),将果蝇群体分为M个子群;

【技术特征摘要】
1.一种基于前哨多种群机制果蝇优化算法来构建预测模型的方法,其特征在于,所述方法包括以下步骤:步骤S1:获取样本数据并对所获取到的样本数据进行归一化处理;步骤S2、利用基于前哨机制和多种群增强机制的果蝇优化支持向量机的惩罚因子C和核宽γ,具体为:步骤S2.1、定义最大评估数MaxFE,子群数M,种群数popsize和种群位置范围LR;其中,果蝇种群的初始位置(Xaxis,Yaxis)在给定范围内随机定义;Xaxis=rand(LR),Yaxis=rand(LR)(1)步骤S2.2、执行公式(2),使果蝇个体i通过嗅觉随机搜寻食物,得到果蝇个体i的位置(Xi,Yi);Xi=Xaxis+rand(LR),Yi=Yaxis+rand(LR)(2)步骤S2.3、利用公式(3),将果蝇群体分为M个子群;步骤S2.4、首先,使用公式(4)评估从群体中的果蝇个体i到初始位置的距离;其次,利用公式(5),使用距离的倒数作为气味浓度测定值,其中,Si,1表示果蝇在当前位置时的C值,Si,2表示果蝇在当前位置时的γ值;步骤S2.5、执行前哨机制,通过公式(6)和(7)来对比预飞行果蝇个体和历史果蝇个体的适应度值,选出适应度值更优的果蝇作为当前进行搜索的果蝇;其中,λ表示果蝇的位置坐标;[λ]=min(function(Stemp),function(Si))(6)Si=Sλ(7)步骤S2.6、利用公式(8),将果蝇群体位置映射至正态分布中,其中,G(θ)用以产生高斯梯度的正态分布向量,Muti表示映射至正态分布后的果蝇位置,之后再执行一次公式(6),选出更优的果蝇个体;步骤S2.7、利用公式(9)-(13),将气味浓度Si代入气味浓度测定功能,以找到果蝇位置的气味浓度Smelli,并将该值作为果蝇气味浓...

【专利技术属性】
技术研发人员:陈慧灵李世民杨宇涛李佳伟曾丹任男汪鹏君陈一鹏
申请(专利权)人:温州大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1