一种随机强分类器的构建方法和系统技术方案

技术编号:15691520 阅读:89 留言:0更新日期:2017-06-24 04:47
本发明专利技术公开了一种随机强分类器的构建方法和系统,该方法包括以下步骤:根据预设的弱分类器个数n随机构建n个弱分类器;在原始样本中有放回的随机选取与原始样本个数相同的数据集作为训练样本;根据预设随机率随机选取所述训练样本中属性值对所述n个弱分类器进行训练,得到n个弱分类器的最终预测类别,用投票法综合每个弱分类器的最终预测类别得到强分类器的预测类别。

Method and system for constructing random strong classifier

The invention discloses a construction of a random strong classifier method and system, the method comprises the following steps: according to the preset number of weak classifiers to construct n n random weak classifiers; in the original sample are randomly selected as training samples with the same number of original sample data set back; according to the preset random rate randomly selected the sample attribute in the value of training the N weak classifier to get the final prediction category n weak classifiers, a strong classifier for predicting class final prediction category each weak classifier of the voting method.

【技术实现步骤摘要】
一种随机强分类器的构建方法和系统
本专利技术涉及强分类器
,尤其涉及一种随机强分类器的构建方法和系统。
技术介绍
决策树是一个树结构,其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。决策树的决策过程非常直观,容易被人理解。目前决策树已经成功运用于医学、制造产业、天文学、分支生物学以及商业等诸多领域。决策树算法有着训练时间复杂度较低,预测的过程比较快速,模型容易展示等良好的特性;但是单个决策树容易过拟合。目前,从现有的分类算法中找到一个好的强分类算法比较难,所以需要一种可以把若干个弱分类器整合成一个强分类器的方法,传统的随机森林算法是把多个决策树组合起来,即在变量的使用和数据的使用上进行随机化,生成很多分类树,再汇总分类树的结果,这种算法的弱分类器都相同,弱分类器只有决策树,处理的方向单一效果不好。
技术实现思路
基于
技术介绍
存在的技术问题,本专利技术提出了一种随机强分类器的构本文档来自技高网...
一种随机强分类器的构建方法和系统

【技术保护点】
一种随机强分类器的构建方法,其特征在于,所述方法包括以下步骤:S1、根据预设的弱分类器个数n随机构建n个弱分类器;S2、在原始样本中有放回的随机选取与原始样本个数相同的数据集作为训练样本;S3、根据预设随机率随机选取所述训练样本中属性值对所述n个弱分类器进行训练,得到n个弱分类器的最终预测类别,用投票法综合每个弱分类器的最终预测类别得到强分类器的预测类别。

【技术特征摘要】
1.一种随机强分类器的构建方法,其特征在于,所述方法包括以下步骤:S1、根据预设的弱分类器个数n随机构建n个弱分类器;S2、在原始样本中有放回的随机选取与原始样本个数相同的数据集作为训练样本;S3、根据预设随机率随机选取所述训练样本中属性值对所述n个弱分类器进行训练,得到n个弱分类器的最终预测类别,用投票法综合每个弱分类器的最终预测类别得到强分类器的预测类别。2.根据权利要求1所述的随机强分类器的构建方法,其特征在于,在S3中,根据预设随机率随机选取所述训练样本中属性值对所述n个弱分类器进行训练,得到n个弱分类器的最终预测类别,具体包括:S31、根据预设随机率随机选取所述训练样本中属性值;S32、用n个弱分类器分别对所述属性值加噪声干扰得到预测类别,将预测类别与训练样本的实际类别进行比较,得到每个属性的重要性分数,根据所述每个属性的重要性分数得到最终预测类别。3.根据权利要求1所述的随机强分类器的构建方法,其特征在于,在S3中,所述用投票法综合每个弱分类器的最终预测类别得到强分类器的预测类别,具体包括:获取所述n个弱分类器的最终预测类别中的众数,并将所述众数对应的最终预测类别作为强分类器的预测类别。4.根据权利要求1所述的随机强分类器的构建方法,其特征在于,在S3中,根据预设随机率随机选取所述训练样本中属性值对所述n个弱分类器进行训练过程是并行的,且n个弱分类器之间互不干扰。5.根据权利要求1所述的随机强分类器的构建方法,其特征在于,还包括步骤S4,获取测试样本,对测试样本进行步骤S3操作,得到强分类器的目标预测类别,将强分类器的目标预测类别与测试样本的已知类别进行比较对强...

【专利技术属性】
技术研发人员:马阳玲杨周旺刘利刚王士玮
申请(专利权)人:合肥阿巴赛信息科技有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1