The invention discloses an approximate method of support vector machine model based on polynomial fitting and application of this method to the known kernel function support vector machine model for approaching the goal, sample training data based on multivariate polynomial fitting method, polynomial approximation for kernel function; using the polynomial function instead of nuclear the approximate function of support vector machine model; which, according to the precision requirement of the polynomial function and the system hardware resources such as storage space, to ensure the hardware resources to meet the accuracy requirements under the premise of model calculation, determine the polynomial kernel function instead of the highest order. The polynomial approximation method of support vector machine model, can effectively reduce the complexity of the support vector machine algorithm, to overcome the traditional support vector machine model for classification of resource consumption big shortcomings, meet the wireless sensor, wearable devices demand system for economic use of CPU platform based on support vector machine.
【技术实现步骤摘要】
一种基于多元多项式拟合的支持向量机模型近似方法及其应用
本专利技术涉及一种基于多元多项式拟合的支持向量机模型近似方法及其应用
技术介绍
支持向量机(SupportVectorMachine,SVM)是基于统计学习理论(StatisticalLearningTheory,SLT)的一种新的机器学习算法。通常应用在模式识别、分类和回归分析等方面。核函数是支持向量机的核心组成部分,通过引入核函数,将原空间中线性不可分的数据样本映射到高维特征空间中,实现数据的线性分类,克服了传统机器学习方法存在的维数灾难和局部最小化问题。然而支持向量机的训练过程实际上是求解一个二次规划问题,其时间复杂度为O(n3),由于要存储核矩阵,其空间复杂度为O(n2)。所以当训练集规模很大时,即使一般的通用计算机也无法正常处理,因此需要对传统的支持向量机算法进行改进。于是国内外研究人员提出了一些支持向量机的简化算法。其中大部分基于分解迭代的思想,即将原始的二次规划问题分解成若干规模较小的二次规划问题,包括Vapnik等人提出的分块(Chunking)算法及Platt提出的串行最小优化(SequentialMinimalOptimation,SMO)算法。还有一些思想是通过选取部分训练集的方法来降低系统的资源需求,如由Lee和Mangasarian提出的精简支持向量机(ReducedSVM,RSVM)等。机器学习包含两个过程:训练和测试。上述的支持向量机简化方法主要针对的是降低训练过程的资源消耗,很少考虑测试过程的资源需求。在支持向量机的测试过程中,需先存储所有的支持向量及其对应的拉格朗日系 ...
【技术保护点】
一种基于多元多项式拟合的支持向量机模型近似方法,其特征在于,包括以下步骤:步骤一:给定训练数据集T={(x
【技术特征摘要】
1.一种基于多元多项式拟合的支持向量机模型近似方法,其特征在于,包括以下步骤:步骤一:给定训练数据集T={(xi,yi)|i=1,2,…,l},其中,l为训练数据集T中样本数据的个数,xi是n维样本数据,yi是与xi对应的类别标签,yi∈{-1,1};利用训练数据集中数据训练支持向量机,得到传统的支持向量机模型其中,αi*和b*分别是拉格朗日系数和偏置量;K(xi,x0)为核函数;x0为未知类别标签的n维输入数据,x0=[x01,x02,…,x0n],其中,x0k为x0的第k维分量,k=1,…,n;y是模型输出的与x0对应的类别标签;步骤二:将训练数据集T中的样本数据xj(j=1,2,…,l)依次代入支持向量机模型y,计算核函数部分的输出将得到的l个函数值记为数值序列F=[f(x1),f(x2),…,f(xl)];步骤三:采用多元多项式拟合方法,利用训练数据集T中样本数据和步骤二所得数值序列F建立超定方程组,求解超定方程组得到多元多项式的系数α;步骤四:利用步骤三中求解得到的多元多项式的系数α与未知类别标签的n维输入数据x0构建多项式,替代支持向量机模型y的核函数部分,得到近似的支持向量机模型y'=sgn[X'α+b*];其中,d为多元多项式的次数,α=(α0,α11,…,α1n,…,αd1,…,αdn)T为多元多项式的系数。2.根据权利要求1所述的基于多元多项式拟合的支持向量机模型近似方法,其特征在于,所述步骤一中传统的支持向量机模型y的训练方法如下:对训练数据集T,求解最优分类超平面(ω·x)+b=0,使得不同类别的样本数据分开并保证分类间隔最大;其中,ω为分类超平面的法向量,b是分类超平面的偏移量;当样本数据线性可分时,将求解最优分类超平面的问题转化为求解如下二次规划问题:其中,<xi,xj>为两个n维样本数据xi和xj的内积,即<xi,xj>=xi·xj;αi为引入的拉格朗日系数,C是一个正常数,称为惩罚因子,用来权衡最大化分类间隔和最小误差;解式(1)得到最终的决策函数,即支持向量机模型y为:其中,αi*和b*通过(1)式求解;αi*为使min后的函数值最小的αi的取值;选取正的支持向量xj,则这种情况下xi与x0的内积<xi,x0>视为核函数K(xi,x0);当样本数据线性不可分时,支持向量机通过引入核函数K将样本数据映射到高维特征空间,然后在高维特征空间内进行分类;将其最优分类超平面的求解问题转化为求解如下二次规划问题:
【专利技术属性】
技术研发人员:刘少强,徐文,杨胜跃,樊晓平,闫晓艳,
申请(专利权)人:中南大学,
类型:发明
国别省市:湖南,43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。