一种基于随机扰动的支持向量机奇异问题处理方法技术

技术编号：19009617 阅读：57 留言：0更新日期：2018-09-22 09:25

本发明专利技术公开了一种基于随机扰动的支持向量机奇异问题处理方法，步骤1：读取两组不同类别的数据集作为训练样本，随机重复添加较少类别的数据点，使得两类数据点的数量相同，对每一个样本数据点的特征向量进行归一化处理。步骤2：选择核函数，计算内核矩阵K；步骤3：初始化随机扰动系数η、拉格朗日乘子α、辅助集合

A SVM singular problem processing method based on random perturbation

The invention discloses a support vector machine singular problem processing method based on random perturbation. Step 1: Reading two groups of different classes of data sets as training samples, adding less classes of data points randomly and repeatedly, making the number of two classes of data points the same, normalizing the feature vectors of each sample data point. Reason. Step 2: Select kernel function and calculate kernel matrix K; Step 3: Initialize random perturbation coefficient_, Lagrange multiplier alpha, auxiliary set

全部详细技术资料下载

【技术实现步骤摘要】
一种基于随机扰动的支持向量机奇异问题处理方法
本专利技术属于机器学习领域，涉及支持向量机正则化路径方法中奇异问题的处理，具体地说是一种基于随机扰动的支持向量机正则化路径奇异问题处理方法。
技术介绍
近年来，支持向量机(supportvectormachine,SVM)在其理论研究和算法实现方面都取得了突破性进展，而正则化路径(regularizationpath)方法是数值求解SVM分类问题的有效方法之一，该方法在文献HastieT,RossetS,TibshiraniR,etal.TheEntireRegularizationPathfortheSupportVectorMachine.[J].Machine,”J.MachineLearningResearch,2004,5(4):1391-1415中首次提出(SVMpath方法)，它可在相当于一次SVM求解的时间复杂度内，得到所有的正则化参数及对应SVM的解。奇异问题一直是正则化路径方法面临的主要问题之一，奇异问题是指在训练样本中存在重复、近似或线性相关的数据点(即奇点)，使得迭代方程组的系数矩阵不可逆，从而导致方法失效。现阶段，国内外针对正则化路径奇异问题提出了很多有效方法。例如在文献：DaiJ,ChangC,MaiF,etal.OntheSVMpathSingularity.[J].IEEETransactionsonNeuralNetworks&LearningSystems,2013,24(11):1736中，提出了一种扰动方法，通过修改每一个数据点来避免奇点，然而该方法只能实现近似解...
一种基于随机扰动的支持向量机奇异问题处理方法

【技术保护点】
1.一种基于随机扰动的支持向量机奇异问题处理方法，其特征在于，包括如下步骤：步骤1：读取两组不同类别的数据集作为训练样本，随机重复添加较少类别的数据点，使得两类数据点的数量相同，对每一个样本数据点的特征向量进行归一化处理；步骤2：选择核函数，计算内核矩阵K；步骤3：初始化随机扰动系数η、拉格朗日乘子α、辅助集合ε,

【技术特征摘要】
1.一种基于随机扰动的支持向量机奇异问题处理方法，其特征在于，包括如下步骤：步骤1：读取两组不同类别的数据集作为训练样本，随机重复添加较少类别的数据点，使得两类数据点的数量相同，对每一个样本数据点的特征向量进行归一化处理；步骤2：选择核函数，计算内核矩阵K；步骤3：初始化随机扰动系数η、拉格朗日乘子α、辅助集合ε,设置迭代次数计数变量l＝0；步骤4：判断ε是否为空集，若不是空集，直接进入下一步；若是空集，初始化ε,计算正则化参数λ和变量μ；步骤5：构造随机扰动影响下的KKT方程组，并求解该方程组，更新λ,μ,α和ε,步骤6：令l＝l+1，返回步骤4，直到λ＜0.01或集合变为空集终止，输出完整的正则化路径。2.根据权利要求1所述的一种基于随机扰动的支持向量机奇异问题处理方法，其特征在于，所述步骤1的具体实现包括：读取两组不同类别的数据集作为训练样本，其中第i个数据点记为(xi,yi)，xi表示第i个数据点的特征向量，yi是第i个数据点对应的标签；令数据点个数较多的类别的标签为1，数据点个数较少的类别的标签为-1。随机重复添加标签为-1的数据点，使得标签为-1的数据点个数与标签为1的数据点相等，记总的数据点个数为N；将每个数据点的特征向量归一化处理为具有零均值、方差为1的数据。3.根据权利要求1所述的一种基于随机扰动的支持向量机奇异问题处理方法，其特征在于，所述步骤2中：核函数为线性核函数时，其中[·]i,j表示矩阵第i行第j列的元素。4.根据权利要求1所述的一种基于随机扰动的支持向量机奇异问题处理方法，其特征在于，所述步骤2中：核函数为高斯径向基核函数时，5.根据...

【专利技术属性】
技术研发人员：戴继生，王彬羽，
申请(专利权)人：江苏大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人