一种基于补子空间的加权协同表示非均衡分类方法技术

技术编号:34133791 阅读:23 留言:0更新日期:2022-07-14 16:06
本发明专利技术公开了一种基于补子空间的加权协同表示非均衡分类方法,用于对非均衡数据进行分类,包括以下内容:对总类别数为c的非均衡数据集进行预处理,得到目标训练样本集X和目标测试样本集;自适应地获取所述目标训练样本集X中各类训练样本子集的权重;基于补子空间确定加权协同表示分类模型;对所述加权协同表示分类模型进行求解,得到最优表示系数,并根据所述最优表示系数重构的误差预测所述目标测试样本集的类别。本发明专利技术将更具判别性的补子空间正则项引入到协同表示建模过程中,并且根据非均衡数据集的原始类别分布信息来自适应地获取每类的权重,从而赋予了少数类更大的权重,有效解决了现有的协同表示方法无法对少数类正确分类的问题。类正确分类的问题。类正确分类的问题。

【技术实现步骤摘要】
一种基于补子空间的加权协同表示非均衡分类方法


[0001]本专利技术涉及非均衡数据分类
,特别涉及一种基于补子空间的加权协同表示非均衡分类方法。

技术介绍

[0002]疾病诊断、故障检测、信息安全等应用领域大量涉及非均衡数据集的分类问题。目前已有的分类技术对少数类的识别率远低于多数类。特别对于严重非均衡数据,少数类的识别精度甚至为0。实际上,在少数类上实现精准分类尤其重要。以疾病诊断为例,重症患者被诊断为健康人付出的代价要远高于健康人被诊断为重症患者的情况。因此,设计出高效精准的非均衡分类方法至关重要。
[0003]现有的非均衡分类方法大致分为基于数据层面和基于算法层面两大类型。基于数据层面的核心思想是通过采样技术实现类别分布的均衡化。但这种技术会破坏原始数据之间的关系,从而限制了它的发展应用。本专利技术致力于提出新的基于算法层面的非均衡分类方法。在众多此类方法中,协同表示分类(Collaborative representation based classification,CRC)方法由于简单、高效、易操作、复杂度低已被广泛应本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于补子空间的加权协同表示非均衡分类方法,其特征在于,包括以下内容:对总类别数为c的非均衡数据集进行预处理,得到目标训练样本集X和目标测试样本集;获取所述目标训练样本集X中各类训练样本子集的权重;利用各类训练样本子集的权重基于补子空间确定加权协同表示分类模型;对所述加权协同表示分类模型进行求解,得到最优表示系数,并根据所述最优表示系数重构的误差预测所述目标测试样本集的类别。2.根据权利要求1所述的一种基于补子空间的加权协同表示非均衡分类方法,其特征在于,对总类别数为c的非均衡数据集进行预处理的步骤为:采用交叉验证法将所述非均衡数据集随机分成n份,其中a份作为原始测试集,b份作为原始训练集;a+b=n;对所述原始测试集和所述原始训练集进行随机交叉验证m次,得到m组训练样本集和m组测试样本集;将m组所述训练样本集和m组所述测试样本集分别转化为列向量数据,并进行归一化处理,得到所述目标训练样本集X和所述目标测试样本集。3.根据权利要求1所述的一种基于补子空间的加权协同表示非均衡分类方法,其特征在于,获取X中各类训练样本子集的权重的方法为:获取第i类训练样本子集的均值E(X
i
)和方差D(X
i
);确定最小方差所在类j,并对第j类训练样本子集的权重赋值,令ω
j
=1;基于所述训练样本子集类别间相关性确定剩余训练样本子集类权重ω
i
;其中,j的表达式为:j(i)=D(X
i
);其中,表示函数j(i)取最小值时变量i的值。4.根据权利要求3所述的一种基于补子空间的加权协同表示非均衡分类方法,其特征在于,基于所述训练样本子集类别间相关性确定剩余训练样本子集类权重ω
i
的方法为:确定i≠j时,第i类训练样本子集的均值E(X
i
)和第j类训练样本子集的均值E(X
j
)之间的相关系数ρ
i
;根据所述相关系数ρ
i
对ω
i
赋值,赋值表达式为:ω

【专利技术属性】
技术研发人员:李艳婷金军委王帅陶红伟吴怀广顿辉朱付保
申请(专利权)人:郑州轻工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1