一种基于粗糙支持矢量机的模式分类识别方法。设{(x↓[i],y↓[i]),i=1,2,…,l}为包含l个样本的训练集,其中第i个样本x↓[i]∈R↑[d]为d维的特征矢量,y↓[i]∈{+1,-1}为x↓[i]的类别;支持矢量机寻找两类间的最优分界面使分类间隔最大;对于训练样本为线性不可分的情况,支持矢量机通过非线性映射φ将输入特征空间映射到更高维的特征空间Z,使两类样本在此高维特征空间中线性可分,以寻找两类间的最优分界面;在高维特征空间中,位于分界面上的样本点φ(x)满足w·φ(x)+b=0,其中w∈Z,b∈R,w和b分别为加权矢量和偏移量,两者定义了高维特征空间中的分界面;某样本x↓[i]通过决策函数sgn(w·φ(x↓[i])+b)判为两类之一;其特征在于本方法的具体步骤如下: (1)定义粗糙分类间隔:由上粗糙间隔和下粗糙间隔表示,其中上粗糙间隔宽度为2ρ↓[l]/║w║,下粗糙间隔宽度为2ρ↓[u]/║w║,ρ↓[u]>ρ↓[l]; (2)用粗糙支持矢量机最大化粗糙间隔来确定最优分类面,这一优化问题表示为公式(5); *1/2║w║↑[2]-vρ↓[l]-vρ↓[u]+1/l*ξ↓[i]+δ/l*ξ′↓[i] subject to y↓[i](w·φ(x↓[i])+b)≥ρ↓[u]-ξ↓[i]-ξ′↓[i], 0≤ξ↓[i]≤ρ↓[u]-ρ↓[l],ξ′↓[i]≥0,ρ↓[l]≥0,ρ↓[u]≥0, (5) 其中δ>1; (3)为求解步骤(2)定义的优化问题,将其转换为由公式(8)表示的对偶问题来求解; *1/2**α↓[i]α↓[j]y↓[i]y↓[j]K(x↓[i],x↓[j]) subject to *α↓[i]y↓[i]=0,0≤α↓[i]≤δ/l,*α↓[i]≥2v, (8) 其中,v的选取范围为0~1,δ的选取范围为2~10; (4)求解对偶问题(8)获得其最优解(α↓[1]↑[*],…,α↓[l]↑[*])↑[T],并由公式(9)计算b↑[*]: b↑[*]=-1/2*α↓[i]↑[*]y↓[i](K(x↓[i],x↓[j])+K(x↓[i],x↓[k])), (9) 其中j∈{i|α↓[i]↑[*]∈(0,1/l),y↓[i]=1},k∈{i|α↓[i]↑[*]∈(0,1/l),y↓[i]=-1},或者j∈{i|α↓[i]↑[*]∈(1/l,δ/l),y↓[i]=1},k∈{i|α↓[i]↑[*]∈(1/l,δ/l),y↓[i]=-1}, 至此完成粗糙间隔支持矢量机训练; (5)分类识别,未知样本*的类别由公式(3)计算得到: *=sgn(w↑[*]·φ(*)+b↑[*])=sgn(*α↓[i]↑[*]y↓[i]K(*,x↓[i])+b↑[*]), (3) (α↓[1]↑[*],…,α↓[l]↑[*])↑[T]和b↑[*]已由步骤(4)求得,其中,K(x↓[i],x↓[j])=φ(x↓[i])·φ(x↓[j])。
【技术实现步骤摘要】
本专利技术属于模式分类识别
,具体涉及一种基于支持矢量机(support vectormachine SVM)的模式分类识别方法。
技术介绍
模式识别的目的是将对象进行分类,其应用领域非常广泛,例如,计算机辅助诊断、字符识别、语音识别等等。支持矢量机是一种基于统计学习理论的模式识别的方法。传统的基于统计学习理论的模式识别方法如基于贝叶斯决策理论的分类器是根据经验风险最小来训练分类器。但经验风险只有当样本数无穷大才趋近于期望风险。因此,基于经验风险最小的分类器不能保证有较高的推广能力。如果训练样本数较少,基于经验风险最小的分类器性能可能较差。支持矢量机是基于结构风险最小原则,在特征空间中寻找一个最优分界面,使得该分界面能够尽可能多的将两类数据点正确的分开,同时使分开的两类数据点距离分界面最远,即找到经验风险最小和推广能力最大之间的平衡点。已有的研究结果表明,对较小的训练样本集,支持矢量机是各种分类器中性能最好的。由于传统的支持矢量机所获得的最优分界面仅仅取决于少量的支持矢量,当训练样本中存在噪声或离群数据时,传统的支持矢量机仍可能出现过学习问题。针对该问题,今年来出现了不少支持本文档来自技高网...
【技术保护点】
一种基于粗糙支持矢量机的模式分类识别方法。设{(x↓[i],y↓[i]),i=1,2,…,l}为包含l个样本的训练集,其中第i个样本x↓[i]∈R↑[d]为d维的特征矢量,y↓[i]∈{+1,-1}为x↓[i]的类别;支持矢量机寻找两类间的最优分界面使分类间隔最大;对于训练样本为线性不可分的情况,支持矢量机通过非线性映射φ将输入特征空间映射到更高维的特征空间Z,使两类样本在此高维特征空间中线性可分,以寻找两类间的最优分界面;在高维特征空间中,位于分界面上的样本点φ(x)满足w·φ(x)+b=0,其中w∈Z,b∈R,w和b分别为加权矢量和偏移量,两者定义了高维特征空间中的分界面;某样本x↓[i]...
【技术特征摘要】
【专利技术属性】
技术研发人员:汪源源,张俊华,
申请(专利权)人:复旦大学,
类型:发明
国别省市:31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。