一种基于Ransac算法的鲁棒AdaBoost分类器构建方法技术

技术编号：18084655 阅读：67 留言：0更新日期：2018-05-31 12:58

本发明专利技术提出了一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，包括以下步骤：根据Ransac算法，构建立样本子集；抽取样本；利用AdaBoost算法训练强分类器；计算分类模型对应分类精度；构建分类器模型Ci；判断满足该新构建分类器模型的全部训练样本；重复上述步骤，直到基于Ransac算法估计下的一个模型Ci和其对应的一致集；判断已建立的不同分类器模型数量是否已超过Nmax；确定为最终选取的分类器模型，计算对应分类精度。本发明专利技术构建方法由含有外点的样本建立了最佳的分类器模型，并且利用Ransac算法的迭代过程去除了外点对分类器模型构建的影响。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Ransac算法的鲁棒AdaBoost分类器构建方法
本专利技术涉及鲁棒分类器
，具体涉及一种基于Ransac算法的鲁棒AdaBoost分类器构建方法。
技术介绍
AdaBoost一词是来源于AdaptiveBoosting(自适应增强)的缩写，是由YoavFreund和RobertSchapire提出的机器学习元算法，它的设计指导原则是确保当前训练样本有最高分类精度。通过将不同的弱分类器(这里所谓的弱分类器是指分类精度稍稍好于随机猜测)合理的组合起来，形成强分类器，尽管每个弱分类器的分类精度不高，但最终的强分类器在分类性能上会得到巨大提升。AdaBoost算法在某种意义上讲是自适应的，通过调整之前被弱分类器错分样本的权值，提高后续弱分类器对错分样本的重视程度，实现最终分类器模型的设计。正是基于此，合理的设计一组弱分类器，可以组合成强分类器，获得一个整体上令人满意的分类精度。但是，像任何事情都具有两面性一样，尽管AdaBoost算法优点众多，但其对外点敏感，在一些情况下更容易受此影响而导致分类器整体性能的降级、失效。这是因为不断对不能正确分类的样本进行加权，尤其是对外点的不断加权，使得外点的权值过快增长。过大的外点权值会引起分类器算法不断向外点偏离，进而背离大部分正常样本，不可避免的会造成所设计分类器模型的降级。
技术实现思路
针对现有技术的不足，本专利技术提出一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，去除潜在外点。本专利技术的技术方案是这样实现的：一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，包括以下步骤：(...

【技术保护点】
一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，其特征在于，包括以下步骤：(1)根据Ransac算法，设置每次初始构建分类器的样本子集为R，样本个数为n；(2)从训练样本集中随机抽取n个样本，作为样本子集R；(3)基于这些样本，利用AdaBoost算法训练强分类器，使得分类器模型最符合当前样本；(4)基于AdaBoost算法用新构建的分类器模型Ci分类剩余的样本，并计算分类模型对应分类精度；(5)用所有这些正确的样本重新基AdaBoost算法构建分类器模型Ci；(6)用这个新构建的分类器模型再次判断满足该新构建分类器模型的全部训练样本，即样本子集为R的一致集，并更新当前迭代次数j＝j+1；(7)重复上述步骤4到步骤6直到满足分类器模型Ci的样本数量m不再增加或迭代次数已经超过了Tmax，则这m个样本构成内点集，重新训练分类器模型，至此可以获得基于Ransac算法估计下的一个模型Ci和其对应的一致集；(8)更新i＝i+1，判断已建立的不同分类器模型数量是否已超过Nmax，如未超过转回步骤(2)；(9)比较全部分类器模型对应的正确分类样本数，基于Ransac算法寻找最大一致集...

【技术特征摘要】
1.一种基于Ransac算法的鲁棒AdaBoost分类器构建方法，其特征在于，包括以下步骤：(1)根据Ransac算法，设置每次初始构建分类器的样本子集为R，样本个数为n；(2)从训练样本集中随机抽取n个样本，作为样本子集R；(3)基于这些样本，利用AdaBoost算法训练强分类器，使得分类器模型最符合当前样本；(4)基于AdaBoost算法用新构建的分类器模型Ci分类剩余的样本，并计算分类模型对应分类精度；(5)用所有这些正确的样本重新基AdaBoost算法构建分类器模型Ci；(6)用这个新构建的分类器模型再次判断满足该新构建分类器模型的全...

【专利技术属性】
技术研发人员：罗宇，黄文超，吴家慧，李文琪，
申请(专利权)人：佛山市厚德众创科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人