一种基于分类间隔样本贡献度的SVM样本加权方法技术

技术编号：14828640 阅读：341 留言：0更新日期：2017-03-16 15:05

本发明专利技术公开一种基于分类间隔样本贡献度的SVM样本加权方法，基于对SVM分类算法中不同样本对分类间隔大小影响的分析，并依据实际应用中特定分类效果的偏好，设计了一种随样本不同而自适应变化的权值；通过计算不同样本对SVM算法产生分类间隔的贡献度的大小，为其分配相应的权值，使对分类间隔增加贡献度大的样本在分类器模型构建的过程中起到更大的作用，进而提高最终分类器模型的后续潜在分类能力。应用本文方法进行了笔迹鉴权，实验结果证明与其它组合核函数选取方法相比，本文提出的方法具有更好表现。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模式识别方法，特别是涉及一种基于分类间隔样本贡献度的支持向量机(SupportVectorMachine，简称SVM)样本加权方法。
技术介绍
随着人工智能的越来越成熟，其在生产生活中得到了更多实际应用。机器学习技术作为人工智能技术中最核心算法进一步吸引了人们的目光，成为模式识别和分类算法中的研究热点。其中，统计学习理论自从提出以来就得到了广泛的应用，基于SVM的分类算法因为其结构简单、泛化能力强、学习和预测时间短、能实现全局最优等卓越性能而得到广泛关注和良好发展。特别是，SVM分类算法在解决小样本，非线性和高维模式识别上具有很大优势，被广泛应用于人脸识别，笔迹鉴定和其他相关领域。SVM算法通过满足Mercer条件的核函数，把原始空间上样本的非线性问题变换为高维空间的线性问题，实现了非线性问题的线性化，也直接关系到SVM分类算法的性能。分类器模型训练中，为对分类有利的样本分配较大的权值是一种常用的手段，有利于训练获得的分类器模型后续的分类。基于SVM分类模型原理中，分类间隔大意味着能以充分大的确信度对训练数据进行分类。也就是说，不仅能将正负样本点分开，而且对最难分的样本点也有足够大的确信度将他们分开。这样具有较大间隔的超平面对未知的样本也将有很好的分类预测能力。基于以上考虑，本专利提出一种基于分类间隔样本贡献度的SVM样本加权方法。基于测试样本对SVM分类器模型形成的分类间隔的贡献度，为不同样本点提供不同大小的自适应权值。让对提高分类模型性能有益的样本点具有较大权值，进而达到使构建的分类器模型对后续样本有更好的分类预测能力。
技术实现思路
针对...
一种基于分类间隔样本贡献度的SVM样本加权方法

【技术保护点】
一种基于分类间隔样本贡献度的SVM样本加权方法，其特征在于，包括如下步骤：步骤(1)初始分类间隔计算利用全部测试样本，基于SVM算法，训练分类器模型，并给出分类器模型的初始分类间隔，设为d0；步骤(2)计算没有当前样本点时的分类间隔利用除去当前样本点的全部测试样本，基于SVM算法，训练分类器模型，并给出分类器模型当前的分类间隔di；步骤(3)分类间隔增量计算利用公式Δdi＝di‑d0计算当前样本的分类间隔增量；步骤(4)循环计算重复步骤(2)到(3)，直到每一个样本对应的分类间隔增量都被计算；步骤(5)分类间隔增量最大值选取从全部样本对应的分类间隔增量中选取出分类增量的最大值Δdmax；步骤(6)加权系数计算根据公式hi＝1+Δdi/Δdmax，由样本对应的分类间隔增量计算每一个样本对应的权值系数hi；步骤(7)样本加权根据计算所得加权系数为样本加权。

【技术特征摘要】
1.一种基于分类间隔样本贡献度的SVM样本加权方法，其特征在于，包括如下步骤：步骤(1)初始分类间隔计算利用全部测试样本，基于SVM算法，训练分类器模型，并给出分类器模型的初始分类间隔，设为d0；步骤(2)计算没有当前样本点时的分类间隔利用除去当前样本点的全部测试样本，基于SVM算法，训练分类器模型，并给出分类器模型当前的分类间隔di；步骤(3)分类间隔增量计算利用公式Δdi＝di...

【专利技术属性】
技术研发人员：曹万鹏，
申请(专利权)人：北京工业大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人