支持向量机的主动学习方法技术

技术编号：21090999 阅读：34 留言：0更新日期：2019-05-11 10:29

本发明专利技术提供一种支持向量机的主动学习方法。利用最大最小距离法从初始训练集中选择尽可能远的样本作为K‑means算法的初始聚类中心，能够避免K‑means算法在初值选取时出现聚类中心过于临近的问题，同时在迭代过程中设定一个距离阈值来去除掉一部分距离当前最优分类超平面远的样本点，并对于剩余的样本点应用K‑means算法进行聚类以确定能够满足指标的最优分类超平面，能够提高划分初始样本集的效率。

全部详细技术资料下载

【技术实现步骤摘要】
支持向量机的主动学习方法
本专利技术涉及计算机
，尤其涉及一种支持向量机的主动学习方法。
技术介绍
主动学习算法(如图1所示)的主要目的就是利用现成的知识，使用最少的训练数据得到较好性能的分类结果。与传统的被动学习相比较，主动学习在每次迭代过程中都是选取那些最具价值的样本进行标注，这就减少了对无意义的样本点标注的时间。在主动学习算法的训练阶段，由于主动的加入并标注少量的最有可能成为支持向量的训练样本点，从而极大的提高了支持向量机的训练效率。K-means算法是一种经典的以距离作为相似性评价指标的聚类算法，该算法具有简单易行、不需要距离矩阵且时间复杂度接近于线性等优点，很适合大规模数据处理。但是在基于K-means算法的主动学习过程中，K-means算法中的聚类数据K需要预先给定，支持向量机是面向二类的分类问题，即K＝2，另外，K-means算法对初始值的选取的依赖程度比较大。而且目前在选择初始样本点的时候，总是随机地或者根据先验概率，并且先验概率的分布也没有一个好的衡量标准，这就会造成分类器在训练的初始阶段迭代次数相对较多，降低了分类效率；同时，在选择最有价...

【技术保护点】
1.一种支持向量机的主动学习方法，其特征在于，所述方法包括：1)利用最大最小距离法对初始训练样本集进行聚类得到两个初始聚类中心；2)以所述初始聚类中心作为K‑means算法的初始迭代值，对所述初始训练样本集进行聚类得到两个更新聚类中心；3)以所述更新聚类中心作为主动学习的初始样本集，并结合SMO算法进行运算得到最优分类超平面；4)应用步骤3)中确定的最优分类超平面对所述初始训练样本集进行测试，以确定所述最优分类超平面是否能够满足指标；5)如果所述最优分类超平面不能够满足指标，分别计算所述初始训练样本集中的正样本点和负样本点到所述初始最优分类超平面的距离；6)将所述正样本点和负样本点到所述最优分...

【技术特征摘要】
1.一种支持向量机的主动学习方法，其特征在于，所述方法包括：1)利用最大最小距离法对初始训练样本集进行聚类得到两个初始聚类中心；2)以所述初始聚类中心作为K-means算法的初始迭代值，对所述初始训练样本集进行聚类得到两个更新聚类中心；3)以所述更新聚类中心作为主动学习的初始样本集，并结合SMO算法进行运算得到最优分类超平面；4)应用步骤3)中确定的最优分类超平面对所述初始训练样本集进行测试，以确定所述最优分类超平面是否能够满足指标；5)如果所述最优分类超平面不能够满足指标，分别计算所述初始训练样本集中的正样本点和负样本点到所述初始最优分类超平面的距离；6)将所述正样本点和...

【专利技术属性】
技术研发人员：欧阳一昭，郭庆，谢莹莹，宋怀明，蒋丹东，
申请(专利权)人：中科曙光国际信息产业有限公司，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人