【技术实现步骤摘要】
本专利技术属于数据分类,尤其是面向类不平衡与重叠数据分类的半监督学习欠采样方法。
技术介绍
1、类不平衡分类是一个难题,不仅传统的分类器更偏向于大多数类,容易产生错误的预测,而且现有的算法往往难以解决类重叠的这类问题。过采样是一种广泛使用的获取不平衡数据平衡样本的有效方法,但现有的过采样方法往往由于参考样本的选择不当而导致更严重的类重叠。
2、对于分类器来说,不平衡和重叠构成了一个相当困难的场景。
3、数据级和算法级的方法已经被用来尝试解决这种耦合问题。前者侧重于预处理以平衡样本并消除重叠,而后者则引导分类器偏向少数或重叠样本。总的来说,前者的适用范围更广,很好地解决了类不平衡问题。然而,不平衡和重叠耦合更为复杂,对完成分类提出了很大的挑战。
4、过采样是基于现有样本特征的模式学习方法之一,特别针对分类任务,其效果高度依赖于足够的已知信息。然而,在实际操作中,只有部分样本被标注,而其他样本缺乏标注信息,这对于过采样来说是一个非常棘手的问题。显然,基于监督学习的过采样方法已经不再适用。
5、
...【技术保护点】
1.面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:所述步骤1包括以下步骤:
3.根据权利要求2所述的面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:所述步骤1.2中拉格朗日公式计算决策函数的具体实现方法为:
4.根据权利要求3所述的面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:所述步骤1.3中得到的部分伪标签数据集为:
5.根据权利要求4所述的面向类不平衡与重叠数据分类的半监
...【技术特征摘要】
1.面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:所述步骤1包括以下步骤:
3.根据权利要求2所述的面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:所述步骤1.2中拉格朗日公式计算决策函数的具体实现方法为:
4.根据权利要求3所述的面向类不平衡与重叠数据分类的半监督学习欠采样方法,其特征在于:所述步骤1.3中得到的部分伪标签数据集为:...
【专利技术属性】
技术研发人员:隋翯,顾兆军,扬雪影,王双,周景贤,刘春波,李志平,于灏,宋文莉,陈佳,
申请(专利权)人:中国民航大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。