【技术实现步骤摘要】
支持向量机的主动学习方法
本专利技术涉及计算机
,尤其涉及一种支持向量机的主动学习方法。
技术介绍
主动学习算法(如图1所示)的主要目的就是利用现成的知识,使用最少的训练数据得到较好性能的分类结果。与传统的被动学习相比较,主动学习在每次迭代过程中都是选取那些最具价值的样本进行标注,这就减少了对无意义的样本点标注的时间。在主动学习算法的训练阶段,由于主动的加入并标注少量的最有可能成为支持向量的训练样本点,从而极大的提高了支持向量机的训练效率。K-means算法是一种经典的以距离作为相似性评价指标的聚类算法,该算法具有简单易行、不需要距离矩阵且时间复杂度接近于线性等优点,很适合大规模数据处理。但是在基于K-means算法的主动学习过程中,K-means算法中的聚类数据K需要预先给定,支持向量机是面向二类的分类问题,即K=2,另外,K-means算法对初始值的选取的依赖程度比较大。而且目前在选择初始样本点的时候,总是随机地或者根据先验概率,并且先验概率的分布也没有一个好的衡量标准,这就会造成分类器在训练的初始阶段迭代次数相对较多,降低了分类效率;同时,在选择最有价 ...
【技术保护点】
1.一种支持向量机的主动学习方法,其特征在于,所述方法包括:1)利用最大最小距离法对初始训练样本集进行聚类得到两个初始聚类中心;2)以所述初始聚类中心作为K‑means算法的初始迭代值,对所述初始训练样本集进行聚类得到两个更新聚类中心;3)以所述更新聚类中心作为主动学习的初始样本集,并结合SMO算法进行运算得到最优分类超平面;4)应用步骤3)中确定的最优分类超平面对所述初始训练样本集进行测试,以确定所述最优分类超平面是否能够满足指标;5)如果所述最优分类超平面不能够满足指标,分别计算所述初始训练样本集中的正样本点和负样本点到所述初始最优分类超平面的距离;6)将所述正样本点和 ...
【技术特征摘要】
1.一种支持向量机的主动学习方法,其特征在于,所述方法包括:1)利用最大最小距离法对初始训练样本集进行聚类得到两个初始聚类中心;2)以所述初始聚类中心作为K-means算法的初始迭代值,对所述初始训练样本集进行聚类得到两个更新聚类中心;3)以所述更新聚类中心作为主动学习的初始样本集,并结合SMO算法进行运算得到最优分类超平面;4)应用步骤3)中确定的最优分类超平面对所述初始训练样本集进行测试,以确定所述最优分类超平面是否能够满足指标;5)如果所述最优分类超平面不能够满足指标,分别计算所述初始训练样本集中的正样本点和负样本点到所述初始最优分类超平面的距离;6)将所述正样本点和...
【专利技术属性】
技术研发人员:欧阳一昭,郭庆,谢莹莹,宋怀明,蒋丹东,
申请(专利权)人:中科曙光国际信息产业有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。