当前位置: 首页 > 专利查询>云南大学专利>正文

一种分数阶C-支持向量机及其设计方法和应用技术

技术编号:22565693 阅读:54 留言:0更新日期:2019-11-16 12:17
本发明专利技术公开了一种分数阶C‑支持向量机及其设计方法和应用。设计方法包括:设计向量机的分数阶梯度向量、选取向量机的拉格朗日乘子、更新拉格朗日乘子、更新分数阶导数集合、更新法向量和阈值以及将法向量和与之带入判别函数确定分类结果的步骤。分数阶C‑支持向量机由上述设计方法设计得到。本发明专利技术还公开一种心脏病数据的分类方法,其通过分数阶C‑支持向量机对心脏病数据进行分类。本发明专利技术通过简单的方法即可完成对分数阶C‑支持向量机的设计,所设计的C‑支持向量机可对数据进行分数阶导的分类,分类效果较整数阶更为精确,对于依赖分类结果进行结案的事件,可提供高准确率的数据支撑。

A fractional c-support vector machine and its design method and Application

The invention discloses a fractional order C \u2011 support vector machine and a design method and application thereof. The design method includes: design the fractional step vector of vector machine, select the Lagrange multiplier of vector machine, update the Lagrange multiplier, update the set of fractional derivative, update the normal vector and threshold, and bring the sum of normal vectors into the discriminant function to determine the classification results. The fractional order C \u2011 support vector machine is designed by the above design method. The invention also discloses a classification method of heart disease data, which classifies the heart disease data by fractional C \u2011 support vector machine. The invention can complete the design of fractional order C \u2011 support vector machine by simple method, the designed C \u2011 support vector machine can classify the data by fractional derivative, the classification effect is more accurate than the integer order, and it can provide data support with high accuracy for the events that depend on the classification result to be closed.

【技术实现步骤摘要】
一种分数阶C-支持向量机及其设计方法和应用
本专利技术涉及LIBSVM工具箱中C-支持向量分类领域,尤其是一种分数阶C-支持向量机的设计方法、通过该设计方法设计得到的分数阶C-支持向量机,和利用分数阶C-支持向量机进行心脏病数据分类的方法。
技术介绍
Rong-EnFan,Pai-HsuenChen,Chih-JenLin在《WorkingSetSelectionUsingSecondOrderInformationforTrainingSupportVectorMachines》一文中公开了LIBSVM的C-支持向量分类方法。其包括以下流程:1、选取拉格朗日乘子α的下标i,j2、更新拉格朗日乘子α当yi≠yj时,当yi=yj时,3、更新辅助变量4、对法向量w和阈值b更新5、确定分类结果将w*,b*代入判别函数(如下),确定分类结果。sign(wTΦ(x)+b)上述方法可以实现对数据的分类,但是,其结果属于整数阶导层次,分类精度不高。
技术实现思路
本专利技术的专利技术目的在于:针对上述存在的问题,提供一种分数阶C-支持向量机的设计方法、利用该设计方法设计出的分数阶C-支持向量机,和利用分数阶C-支持向量机进行心脏病数据分类的方法。以实现对数据的高精确度分类。为心脏病确诊提供可靠数据支撑。本专利技术采用的技术方案如下:一种分数阶C-支持向量机的设计方法,分数阶C-支持向量机的分数阶梯度向量设计为:ψ(v)(α)=b0α1-vQα-eb0α1-v其中,v是分数阶导数的阶次,0≤v≤1,Γ(z)是分数阶的基本函数,Gamma函数的积分定义为:Q为n乘n阶对称矩阵,Qij=yiyjK(xi,xj),其中K(xi,xj)是核函数,i、j代表下标,y是数据点集的标签,在二分类中,其取值定义为+1或-1;ψ(α)表示目标函数的对偶形式,ψ(v)(α)表示目标函数的对偶形式的分数阶梯度;α是拉格朗日乘子,在SMO算法中是一个约束条件,其约束范围是0<αi<C,C>0称为惩罚参数;n表示数据点集的个数;所述分数阶C-支持向量机的设计方法包括:A.选取向量机的拉格朗日乘子α的下标i,j的步骤;B.更新步骤A中的拉格朗日乘子α的步骤;C.根据步骤B中所更新的拉格朗日乘子α,更新分数阶导数集合的步骤;D.根据步骤C中所更新的分数阶导数集合,更新法向量w和阈值b的步骤;和E.将步骤D中所更新的法向量w和阈值b带入判别函数,确定出分类结果。通过上述方法的设计结果对数据进行分类,可以实现对数据的分数阶导分类,其分类结果较整数阶导更为精确,分类准确度更高。进一步的,所述步骤A中选取向量机的拉格朗日乘子α的下标i,j的方法为:Iup(αk)和对应的Ilow(αk),是关于αt下标t的集合对于α的下标i的选取使用的是FirstOrder的方法,对j的选择除需要满足违反对,还需要使目标函数减少最多,根据泰勒公式将目标函数在αk处展开,假设αk每次的偏移量都是d,其中d=(d1,d2,…,dn)。进一步的,所述步骤B更新数据的方法为:当yi≠yj时,当yi=yj时,进一步的,所述步骤C更新数据的方法为:其中,C>0称为惩罚参数。其由问题决定,C值大时对误分类的惩罚增大,C值小时对误分类的惩罚减小。LIBSVM为了加速运算设置了一个集合G-bar,G-bar是目标函数的分数阶导数的集合。SMO算法的一个核心就是对α的更新。拉格朗日乘子在训练的过程中,α_i会经过多次迭代,这时候一部分α_i就会落到边界上,即α_i=0或α_i=C。此时α的值落在边界上不会发生改变,所以把此时的状态称为inactive。对那些处于0和C之间α_i的状态称为active。进一步的,所述步骤D更新数据的方法为:假设给定一个特征空间上的训练数据集为,T={(x1,y1),(x2,y2),…,(xn,yn)}其中,xi∈X=Rn,yi∈Y={+1,-1},i=1,2,…,n,xi为第i个特征向量,也称为实例,yi为xi的类标签,当yi=+1时,称为正例;当yi=-1时,称为负例,(xi,yi)称为样本点。超平面函数(判别函数)定义为:f(x)=wTx+b=0其中,w是法向量,b为阈值(偏移量)w*在此表示法向量的最优值。b*表示阈值(偏移量)的最优值。理论上b*的值是不定的,当程序达到最优后,用任意一个标准支持向量机0<αi<C的样本带入计算公式,得到的b*都是可以的。求取b*的方法有很多,Libsvm采取了更为鲁棒的方法求,求所有支持向量的平均值。设是目标函数对偶问题的一个解,是α*的一个分量。本专利技术提供了一种分数阶C-支持向量机,其通过上述的分数阶C-支持向量机的设计方法设计而成。本专利技术的分数阶C-支持向量机的分类效果具有高精确度和高准确度的特点。本专利技术提供了一种心脏病数据分类方法,该心脏病数据分类方法采用上述的分数阶C-支持向量机对心脏病数据进行分类。通过分数阶C-支持向量机对心脏病数据进行分析,可以得到较整数阶分类精确度更高的结果,以为心脏病的诊断提供更加准确的数据支撑。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:1、本专利技术对于分数阶C-支持向量机的设计和优化方法非常简单,仅需在现有方案基础上进行少量修改即可得到预期效果。2、本专利技术的向量机可实现对数据的分数阶次导数的分类,使得对于数据的分类结果更加精确。3、本专利技术的心脏病数据分类方法可以对心脏病数据进行高准确率分类,进而为心脏病的诊断提供准确的数据支撑。附图说明本专利技术将通过例子并参照附图的方式说明,其中:图1是利用本专利技术的分数阶C-支持向量机对heart_scale进行分类的准确率示意图。图2是SMO算法流程图。具体实施方式本说明书中公开的所有特征,或公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合。本说明书(包括任何附加权利要求、摘要)中公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。实施例一本实施例公开了一种分数阶C-支持向量机的设计方法,分数阶梯度向量设计为:ψ(v)(α)=b0α1-vQα-eb0α1-v其中,v是分数阶导数的阶次,0≤v≤1,Γ(z)是分数阶的基本函数,Gamma函数的积分定义为:Q是一个n乘n对称矩阵,Qij=yiyjK(xi,xj),本文档来自技高网...

【技术保护点】
1.一种分数阶C-支持向量机的设计方法,其特征在于,分数阶C-支持向量机的分数阶梯度向量设计为:/nψ

【技术特征摘要】
1.一种分数阶C-支持向量机的设计方法,其特征在于,分数阶C-支持向量机的分数阶梯度向量设计为:
ψ(v)(α)=b0α1-vQα-eb0α1-v



其中,v是分数阶导数的阶次,0≤v≤1,Γ(z)是分数阶的基本函数,其定义为:
Q为n乘n阶对称矩阵,Qij=yiyjK(xi,xj),其中K(xi,xj)是核函数,i、j代表下标,y是数据点集的标签,取值定义为+1或-1;
ψ(α)表示目标函数的对偶形式,ψ(v)(α)表示目标函数的对偶形式的分数阶梯度;
α是拉格朗日乘子,其约束范围是0<αi<C,C>0称为惩罚参数;
n表示数据点集的个数;
所述分数阶C-支持向量机的设计方法包括:
A.选取向量机的拉格朗日乘子α的下标i,j的步骤;
B.更新步骤A中的拉格朗日乘子α的步骤;
C.根据步骤B中所更新的拉格朗日乘子α,更新分数阶导数集合的步骤;
D.根据步骤C中所更新的分数阶导数集合,更新法向量w和阈值b的步骤;和
E.将步骤D中所更新的法向量w和阈值b带入判别函数,确定出分类结果。


2.如权利要求1所述的分数阶C-支持向量机的设计方法,其特征在于,所述步骤A中选取向量机...

【专利技术属性】
技术研发人员:代立才赵春娜刘亚南
申请(专利权)人:云南大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1