一种基于CGLOW的全局优化的不平衡数据分类模型制造技术

技术编号：40704621 阅读：2 留言：0更新日期：2024-03-22 11:04

本发明专利技术公开了一种基于CGLOW全局优化的不平衡数据分类模型，属于不平衡数据分类的领域。为了解决实际工业中某些类样本难以获取，造成数据不平衡影响最终分类效果的问题，我们希望以生成的方式补充少数类的样本达到样本平衡，因此我们在可逆卷积生成流模型GLOW的基础上提出了一种条件控制的GLOW,即可以根据条件来生成各种类别的样本，针对不平衡数据集使用该模型生成更多的样本补充不平衡类别的数据，在此基础上建立了一套全局优化的模型框架，以resnet作为最终的分类器，借助resnet的特征提取能力，通过最终的分类损失引导CGLOW生成质量更高的样本，在整个训练过程中对CGLOW与resnet同时进行优化，为不平衡数据分类提供了一种端到端的解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及不平衡图像数据分类的，尤其是涉及一种基于cglow全局优化的不平衡数据分类模型。

技术介绍

1、近年来，随着工业集成化的速度越来越快，深度学习被应用到工业中也越来越广泛，其中基于数据驱动的分类模型被广泛的应用到实际的生产制造中。然而，大多数分类模型基于平衡数据进行的分类任务，在实际的图像分类的场景中，存在某些类的数据稀缺导致类间数据失衡的情况，这在很大程度上会影响模型的分类效果。因此，针对不平衡数据分类的研究具有重要的价值，为了解决这一实际中存在的问题，研究人员进行了深入的研究。总的来说，数据不平衡的解决方法主要分为三类：数据处理方法，模型构建方法，训练优化方法。

2、因此，提供了一种基于cglow的全局优化的不平衡数据分类模型。

技术实现思路

1、本专利技术的目的是提供一种基于cglow全局优化的不平衡数据分类模型，通过使用稀缺数据类训练生成模型，以此来生成更多的样本补充不平衡的类别，并提出了一种条件控制的cglow(可逆卷积生成流模型)，在此基础上建立了一套全局优化的模型框架，使用resnet作为最终的分类器，通过最终的分类损失引导cglow生成质量更高的样本，在整个训练过程中cglow与resnet同时进行优化，进一步提高了不平衡数据的分类准确率，为不平衡数据分类提供了一种端到端的解决方案。

2、为实现上述目的，本专利技术提供了一种基于cglow全局优化的不平衡数据分类模型，包括以下步骤：

3、s1：修改glow模型中的z的先

4、s2：对带有标签的不平衡数据集进行简单的预先增广，使用正向cglow模型作为编码器，将预处理后的数据集成分批次的样本输入编码器进行计算，得到编码器的损失函数值，和n个类别的均值和方差向量；

5、s3：依据编码器的损失函数，利用梯度下降算法计算梯度信息，当梯度反传时更新编码器的内部参数，对cglow进行一次优化；

6、s4：利用不同类别的均值和方差进行重采样，得到每个类别对应的隐变量z，将逆向的cglow模型作为解码器，将隐变量z输入到解码器中，得到各类数量平衡的生成样本；

7、s5：将生成样本输入分类器resnet中进行分类，得到分类结果，计算分类器的损失函数，当梯度反向传播的时候，梯度信息从分类器resnet传输到解码器中，由此完成一次分类器参数的更新和解码器的参数更新，实现对分类器的第一次优化和对cglow的第二次优化；

8、s6：当cglow的损失函数值不再下降时，分类模型训练完成。

9、优选的，所述步骤s1中，修改glow模型中编码器的z的先验分布部分的估计的具体过程如下：

10、将glow中原有的多维标准正态分布，进行修改，修改后的z的先验分布概率密度函数为如下公式：

11、

12、其中l是离散的变量，表示类别信息，μ是均值，σ是方差。

13、优选的，所述步骤s2中，对带有标签的不平衡数据集进行预先增广的方式包括归一化、平移、缩放和加入噪声。

14、优选的，所述步骤s2中，计算编码器的损失函数的具体过程如下：

15、原模型的损失函数如下：

16、

17、使用最大似然做拟合修改z的先验分布，得到的loss_logp为：

18、

19、得到编码器的损失函数如下：

20、lossmle＝loss_logdet+loss_logp

21、上式中，loss_logdet是原有的损失函数，loss_logp是新增的损失函数。

22、优选的，所述步骤s5中,计算生成样本分类损失函数的过程如下：

23、生成样本输入resnet中进行分类，计算这个批量的分类损失，在这一过程中计算的交叉熵损失的公式如下：

24、

25、上式中，n表示的是一个批量的样本数，yi是每个样本的独热编码向量，是模型输出对应的每个样本的输出向量。

26、因此，本专利技术采用上述方法的一种基于cglow的全局优化的不平衡数据分类模型，具有以下好处：

27、(1)在本专利技术中，在cglow模型中，保留生成样本的多样性和精确性同时，通过限制隐变量生成指定类别的样本，使生成变得可控；

28、(2)在本专利技术中，使用分类损失引导生成的过程，滤去了噪声样本，生成质量更高的样本，同时分类精度也得以提升，这种全局的训练框架省去了传统上需要分类模型和生成模型两阶段配合起来的繁琐工作

29、(3)在本专利技术中，使用全局优化的架构，克服样本不平衡产生的影响，通过生成的方法生成各类平衡的样本数据，分类损失参与生成过程的优化，分类和生成共同优化，分类损失引导生成质量更高的样本，质量更高的样本使得分类达到更好的精度。

30、下面通过附图和实施例，对本专利技术的技术方案做进一步的详细描述。

本文档来自技高网...

【技术保护点】

1.一种基于CGLOW全局优化的不平衡数据分类模型，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于CGLOW的全局优化的不平衡数据分类模型，其特征在于：所述步骤S1中，修改GLOW模型中编码器的Z的先验分布部分的估计的具体过程如下：

3.根据权利要求2所述的一种基于CGLOW的全局优化的不平衡数据分类模型，其特征在于：所述步骤S2中，对带有标签的不平衡数据集进行预先增广的方式包括归一化、平移、缩放和加入噪声。

4.根据权利要求3所述的一种基于CGLOW的全局优化的不平衡数据分类模型，其特征在于：所述步骤S2中，计算编码器的损失函数的具体过程如下：

5.根据权利要求4所述的一种基于CGLOW的全局优化的不平衡数据分类模型，其特征在于：所述步骤S5中,计算生成样本分类损失函数的过程如下：

【技术特征摘要】

1.一种基于cglow全局优化的不平衡数据分类模型，其特征在于：包括以下步骤：

2.根据权利要求1所述的一种基于cglow的全局优化的不平衡数据分类模型，其特征在于：所述步骤s1中，修改glow模型中编码器的z的先验分布部分的估计的具体过程如下：

3.根据权利要求2所述的一种基于cglow的全局优化的不平衡数据分类模型，其特征在于：所述步骤s2中，对带...

【专利技术属性】
技术研发人员：焦文华，李俊雄，蔡晓异，朱永军，马小平，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人