一种采用遗传算法优化二分类模型参数的方法技术

技术编号:8271732 阅读:313 留言:0更新日期:2013-01-31 04:05
本发明专利技术公开了一种采用遗传算法优化二分类模型参数的方法,包括以下步骤:一、训练样本获取,其获取过程如下:信号采集、特征提取和样本获取;二、核函数选取:选用径向基函数作为需建立二分类模型的核函数,且二分类模型为支持向量机模型;三、惩罚参数C与核参数γ确定:采用遗传算法对需建立二分类模型的惩罚参数C与所选用径向基函数的核参数γ进行优化,且优化过程如下:种群初始化、初始化种群中各个体适应度值计算、选择操作、交叉操作与变异操作、子代群体中各个体适应度值计算、选择操作与判断是否满足终止条件。本发明专利技术设计合理、操作简便、实现方便且使用效果好、实用价值高,所获得分类模型的分类精度高,训练速度快且支持向量个数少。

【技术实现步骤摘要】
本专利技术涉及一种SVM分类器模型参数优化方法,尤其是涉及一种采用遗传算法优化二分类模型参数的方法
技术介绍
支持向量机(Support Vector Machine, SVM)是上世纪九十年代一种新的模式识别方法,其通过非线性变换将输入空间映射到高维空间,在新空间中求得最优分类超平面。支持向量机分类是通过寻找一个分类超平面来分开训练样本中的两类样本点,并且使分类超平面间隔最大,实现线性可分的最优分类。对于线性不可分情况,运用核函数把低维输入空间的数据映射到高维空间,从而将低维空间的线性不可分问题转化为高维空间的线性可分问题。目前,比较常用的核函数有线性核函数、多项式核函数、RBF径向基核函数和·Sigmoid核函数等。其中,RBF核函数为

【技术保护点】
一种采用遗传算法优化二分类模型参数的方法,其特征在于该方法包括以下步骤:步骤一、训练样本获取,其获取过程如下:步骤101、信号采集:采用状态信息检测单元(1)对被检测对象在两种不同工作状态时的工作状态信息分别进行实时检测,并将所检测信号同步传送至数据处理器(2),相应获得两组工作状态检测信息;两组所述工作状态检测信息中均包括状态信息检测单元(1)在不同采样时刻检测到的多个检测信号;步骤102、特征提取:待数据处理器(2)接收到状态信息检测单元(1)所传送的检测信号时,自各检测信号中分别提取出能代表并区别该检测信号的一组特征参数,且该组特征参数包括W个特征量,并对W个所述特征量进行编号,W个所述特征量组成一个特征向量,其中W≥2;步骤103、样本获取:分别在经特征提取后的两组所述工作状态检测信息中,随机抽取m个检测信号组成训练样本集;所述训练样本集中相应包括l个训练样本,其中l=2×m;l个所述训练样本分属于两个样本类,每一个样本类中均包括被检测对象工作于同一个工作状态时的m个训练样本,两个样本类分别与被检测对象的两种不同工作状态相对应;两个所述样本类中的每一个训练样本均记作Xks,其中k为样本类的类别标号且k=1或2,s为各样本类中所包括m个训练样本的样本序号且s=1、2…m;Xks为类别标号为k的样本类中第s个训练样本的特征向量,Xks∈Rd,其中d为Xks的向量维数且d=W;步骤二、核函数选取:选用径向基函数作为需建立二分类模型的核函数,且所述二分类模型为支持向量机模型;步骤三、惩罚参数C与核参数γ确定:采用遗传算法对需建立二分类模型的惩罚参数C与所选用径向基函数的核参数γ进行优化,且其优化过程如下:步骤301、种群初始化:将惩罚参数C的一个取值与核参数γ的一个取值作为一个个体,并将多个个体集合为一个种群,同时所述种群中的所有个体均进行二进制编码后形成初始化种群;其中,惩罚参数C的一个取值和核参数γ的一个取值均为自区间(0,1000]中随机抽取的一个数值;步骤302、初始化种群中各个体适应度值计算:初始化种群中所有个体的适应度值计算方法均相同;初始化种群中多个所述个体,分别对应多个不同的分类模型;对于所述初始化种群中的任一个个体来说,采用步骤103中所述训练样本集中的两个所述样本类,对与该个体对应的分类模型进行训练,且以该分类模型的分类准确率作为该个体的适应度值;待所述初始化种群中所有个体的适应度值均计算出来后,再相应计算出所述初始化种群的种群平均适应度值;步骤303、选择操作:根据步骤302中计算得出的所述初始化种群中所有个体的适应度值,选出所述初始化种群中适应度值高的多个个体作为子代群体;步骤304、交叉操作与变异操作:对选取的子代群体进行交叉操作与变异操作,获得新一代的子代群体;步骤305、子代群体中各个体适应度值计算:子代群体中所有个体的适应度值计算方法均相同;子代群体中多个所述个体,分别对应多个不同的分类模型z;对于所述子代群体中的任一个个体来说,采用步骤103中所述训练样本集中的两个所述样本类,对与该个体对应的分类模型进行训练,且以该分类模型的分类准确率作为该个体的适应度值;待所述子代群体中所有个体的适应度值均计算出来后,再相应计算出所述子代群体的种群平均适应度值;步骤306、选择操作:根据步骤305中计算得出的所述子代群体中所有个体的适应度值,选出所述子代群体中适应度值高的多个个体作为子代 群体;步骤307、判断是否满足终止条件:当进化代数超过预先设定的最大进化代数itmax或者子代群体中个体的最大适应度值大于或等于预先设定的适应度设定值时,遗传算法终止并输出当前所获得所述子代群体中适应度值最高的个体;否则,返回步骤304;步骤307中所输出的适应度值最高的个体变为所确定的惩罚参数C与核参数γ,且待惩罚参数C与核参数γ确定后,便获得二分类模型的分类函数。...

【技术特征摘要】
1.一种采用遗传算法优化二分类模型参数的方法,其特征在于该方法包括以下步骤 步骤一、训练样本获取,其获取过程如下 步骤101、信号采集采用状态信息检测单元(I)对被检测对象在两种不同工作状态时的工作状态信息分别进行实时检测,并将所检测信号同步传送至数据处理器(2),相应获得两组工作状态检测信息;两组所述工作状态检测信息中均包括状态信息检测单元(I)在不同采样时刻检测到的多个检测信号; 步骤102、特征提取待数据处理器(2)接收到状态信息检测单元(I)所传送的检测信号时,自各检测信号中分别提取出能代表并区别该检测信号的一组特征参数,且该组特征参数包括W个特征量,并对W个所述特征量进行编号,W个所述特征量组成一个特征向量,其中W彡2 ; 步骤103、样本获取分别在经特征提取后的两组所述工作状态检测信息中,随机抽取m个检测信号组成训练样本集; 所述训练样本集中相应包括I个训练样本,其中l=2Xm ;1个所述训练样本分属于两个样本类,每一个样本类中均包括被检测对象工作于同一个工作状态时的m个训练样本,两个样本类分别与被检测对象的两种不同工作状态相对应;两个所述样本类中的每一个训练样本均记作Xks,其中k为样本类的类别标号且k=l或2,s为各样本类中所包括m个训练样本的样本序号且s=l、2…m ;Xks为类别标号为k的样本类中第s个训练样本的特征向量,Xks e Rd,其中d为Xks的向量维数且d=W ; 步骤二、核函数选取选用径向基函数作为需建立二分类模型的核函数,且所述二分类模型为支持向量机模型; 步骤三、惩罚参数C与核参数Y确定采用遗传算法对需建立二分类模型的惩罚参数C与所选用径向基函数的核参数Y进行优化,且其优化过程如下 步骤301、种群初始化将惩罚参数C的一个取值与核参数Y的一个取值作为一个个体,并将多个个体集合为一个种群,同时所述种群中的所有个体均进行二进制编码后形成初始化种群;其中,惩罚参数C的一个取值和核参数Y的一个取值均为自区间(0,1000]中随机抽取的一个数值; 步骤302、初始化种群中各个体适应度值计算初始化种群中所有个体的适应度值计算方法均相同;初始化种群中多个所述个体,分别对应多个不同的分类模型; 对于所述初始化种群中的任一个个体来说,采用步骤103中所述训练样本集中的两个所述样本类,对与该个体对应的分类模型进行训练,且以该分类模型的分类准确率作为该个体的适应度值; 待所述初始化种群中所有个体的适应度值均计算出来后,再相应计算出所述初始化种群的种群平均适应度值; 步骤303、选择操作根据步骤302中计算得出的所述初始化种群中所有个体的适应度值,选出所述初始化种群中适应度值高的多个个体作为子代群体; 步骤304、交叉操作与变异操作对选取的子代群体进行交叉操作与变异操作,获得新一代的子代群体; 步骤305、子代群体中各个体适应度值计算子代群体中所有个体的适应度值计算方法均相同;子代群体中多个所述个体,分别对应多个不同的分类模型z ;对于所述子代群体中的任一个个体来说,采用步骤103中所述训练样本集中的两个所述样本类,对与该个体对应的分类模型进行...

【专利技术属性】
技术研发人员:马宏伟毛清华张旭辉陈海瑜张大伟姜俊英
申请(专利权)人:西安科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1