当前位置: 首页 > 专利查询>燕山大学专利>正文

基于距离样本约简的BP分类器改进方法技术

技术编号:17597790 阅读:47 留言:0更新日期:2018-03-31 10:44
一种基于距离样本约简的BP分类器改进方法,其内容包括:将样本约简与BP分类器训练融为一个阶段,用“净化”的样本;对样本进行约简处理,去除对分类边界毫无影响的远离分类边界的冗余样本;用待测样本对训练好的BP模型进行多分类检测,输出分类结果,比较输出的待测样本分类类别是否与其本身类别标签一致。计算与标签不一致的分类结果占总待测样本的比例,最后根据这个比例体现分类器的性能。本发明专利技术在训练BP分类器的过程中逐步消除那些远离分界面的冗余样本,加快分类器收敛速度,减少时间消耗,提高整体BP分类器泛化能力,以此提高BP分类的性能。

Improved method of BP classifier based on distance sample reduction

An improved method of BP classifier based on distance sample reduction, including: sample reduction and BP classifier training into one stage, with the \purification\ of the sample; the sample reduction, removal of redundant samples away from the classification boundary effect on classification boundary no; with the sample to be tested for multi classification detection the trained BP model, the output classification results, comparing the output to be tested whether the sample classification with category labels consistent. The classification results that are inconsistent with the label account for the proportion of the total samples to be measured. Finally, the classifier's performance is reflected according to this proportion. In the process of training BP classifier, the proposed method gradually eliminates redundant samples away from the interface, speeds up the classifier convergence, reduces the time consumption and improves the generalization ability of the whole BP classifier, so as to improve the performance of BP classification.

【技术实现步骤摘要】
基于距离样本约简的BP分类器改进方法
本专利技术属于基于距离样本约简的BP分类器(ImprovedBPClassifierviaDistanceforSampleReduction简称DRBP)改进方法,涉及一种物体的多分类方法,特别是一种基于距离样本约简的BP分类器改进的方法。
技术介绍
在过去的人工神经网络模型研究课题中,BP神经网络具有结构严谨简单,并行性强,计算量少,自学习功能等优势,一直备受众多研究人员和研究机构的关注。特别在分类领域中,也一直是一个热点研究对象。然而,影响网络泛化能力的因素除了要具备好的分类器,可靠的数据集同样重要。所以从数据集的角度,提高分类性能的方法被很多研究人员研究,但是几个关键的问题仍然没得到充分的解决。一个模式分类系统一般有以下几个要素组成:数据集筛选,分类器设计,检测系统评估。首先数据集筛选,数据集在进入分类器之前,是存在大量冗余的,而数据集筛选是在保护绝大多数样本信息的基础上,剔除绝大多数冗余样本;然后分类器设计,这是根据训练样本使用某种分类器算法生成的分类物体的模型,BP分类器在模式识别的分类领域中是一种常用的技术,在此领域有着广泛的应用。本文档来自技高网...
基于距离样本约简的BP分类器改进方法

【技术保护点】
一种基于距离样本约简的BP分类器改进的方法,其特征在于:该方法内容包括以下步骤:步骤1:基于样本权重的BP分类器训练:将样本约简与BP分类器训练融为一个阶段,用“净化”的样本,训练BP分类器;步骤2:样本约简:对样本进行约简处理,去除对分类边界毫无影响的远离分类边界的冗余样本;步骤3:待测样本分类结果:用待测样本对训练好的BP模型进行多分类检测,输出分类结果,比较输出的待测样本分类类别是否与其本身类别标签一致;计算与标签不一致的分类结果占总待测样本的比例,最后根据这个比例体现分类器的性能。

【技术特征摘要】
1.一种基于距离样本约简的BP分类器改进的方法,其特征在于:该方法内容包括以下步骤:步骤1:基于样本权重的BP分类器训练:将样本约简与BP分类器训练融为一个阶段,用“净化”的样本,训练BP分类器;步骤2:样本约简:对样本进行约简处理,去除对分类边界毫无影响的远离分类边界的冗余样本;步骤3:待测样本分类结果:用待测样本对训练好的BP模型进行多分类检测,输出分类结果,比较输出的待测样本分类类别是否与其本身类别标签一致;计算与标签不一致的分类结果占总待测样本的比例,最后根据这个比例体现分类器的性能。2.根据权利要求1所述的一种基于距离样本约简的BP分类器改进的方法,其特征在于:在步骤1中,所述将样本约简与BP分类器训练融为一个阶段,用“净化”的样本训练BP分类器,就是一个边约简边训练的过程,就是对基于距离样本约简的BP分类器进行训练;这里所述“净化”的样本就是指约简后的样本,对基于距离样本约简的BP分类器进行训练过程如下:1)输入:数据集D,这是一个带有标签的数据集;权重上线wt;权重下线wb;权重增量dw;2)初始化:初始化网络结构,设置网络参数,数据集交叉归一化处理初始化样本权重为将原样本初始化成新训练样本NewTrain←train;3)更新:更新新训练样本,其更新过程如下:①对新训练样本随机打乱顺序,分成数量基本相同的m批②用新训练样本分批训练BP网络;③用原训练样本检测上一步训练好的BP网络f(x),得到均方误差e,以及分类正确的样本Sgood和分类错误的样本Sbad;④更新样本权重然后归一化样本权重[wb,wt];⑤根据样本权重大小,以初始化样本权重为权重阈值,将大于权重阈值样本权重的样本划分为边界样本Xbad,将小于权重阈值样本权重的样本划分为核样本Xgood;⑥执行samples_reduction,进行样本约简,获取新训练样本Xnew;⑦重复步骤①到步骤⑥,直到...

【专利技术属性】
技术研发人员:闻佳邓佳
申请(专利权)人:燕山大学
类型:发明
国别省市:河北,13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1