【技术实现步骤摘要】
一种贝叶斯决策思想与近邻集结合的代价敏感分类方法
本专利技术涉及一种贝叶斯决策思想与近邻集结合的代价敏感分类方法,属于机器学习分类领域。
技术介绍
在很多实际应用场景中,分类错误会造成一定的损失(也就是代价),对于不同的误分类结果,所需付出的代价其实是各不相同的,在这些领域中,传统的机器学习算法只注重提高分类准确率,默认各个误分类情况下造成的后果是一样的,然而,在实际应用场景中,不同类型的错分代价值相差较大,只考虑减小错误率可能带来更大的损失。显然,将不同情况下的误分代价区分开来更具现实意义,于是提出了代价敏感的分类思想。代价敏感学习是指在分类时考虑到各个类误分情况下所需付出的实际代价的大小,以最小化总体误分代价为目标的一种分类思想。代价敏感学习方法有着广泛的应用,主要分为两种情况,第一种是样本类别分布不均衡的情况,在极端条件下,多数类样本数目占比远大于少数类,此时对于少数类的正确分类显得更为重要,传统的分类算法无法满足这一需求;在第二种情况下,各个类的误分情况所需付出的代价值差别巨大,分类结果会偏向于高误分代价类的 ...
【技术保护点】
1.一种贝叶斯决策思想与近邻集结合的代价敏感分类方法,其特征在于,具体步骤如下:/nStep 1:计算待分类数据与已分类样本数据集中每个样本数据之间的欧氏距离;/nStep 2:找出Step1中较小的K个欧氏距离对应的样本数据,构成待分类数据的近邻集;/nStep 3:对待分类数据的近邻集中的样本数据进行分类,统计每一类中的样本数据个数;/nStep 4:根据决策函数,计算Step3中每一类的决策风险值;/nStep 5:按照最小误分风险的原则,Step4中决策风险值最小的类别即为待分类数据的所属类别。/n
【技术特征摘要】
1.一种贝叶斯决策思想与近邻集结合的代价敏感分类方法,其特征在于,具体步骤如下:
Step1:计算待分类数据与已分类样本数据集中每个样本数据之间的欧氏距离;
Step2:找出Step1中较小的K个欧氏距离对应的样本数据,构成待分类数据的近邻集;
Step3:对待分类数据的近邻集中的样本数据进行分类,统计每一类中的样本数据个数;
Step4:根据决策函数,计算Step3中每一类的决策风险值;
Step5:按照最小误分风险的原则,Step4...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。