分类模型处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：39737949 阅读：5 留言：0更新日期：2023-12-17 23:40

本申请涉及一种分类模型处理方法、装置、计算机设备、存储介质和计算机程序产品。设计人工智能技术，方法包括：获取第一类样本数据和第二类样本数据，第一类样本数据的数量大于第二类样本数据的数量；通过伪装网络对第一类样本数据进行伪装处理，得到伪装为第二类样本数据的伪装样本数据；基于第一类样本数据、第二类样本数据和伪装样本数据构建模型训练数据；通过判别网络对模型训练数据进行判别分类处理，得到判别网络针对模型训练数据的分类判别结果；基于分类判别结果对判别网络进行损失优化处理，得到分类模型。本申请可以实现判别分类处理过程中的样本平衡化，解决分类模型训练过程中的样本不平衡问题，提高分类模型的分类准确率。类准确率。类准确率。

全部详细技术资料下载

【技术实现步骤摘要】
分类模型处理方法、装置、计算机设备和存储介质

[0001]本申请涉及计算机
，特别是涉及一种分类模型处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展，出现了基于人工智能的分类模型，分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型。该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个，从而可以应用于数据预测。例如对于推荐类的点击率预测问题，其一般可以视为一个二分类的问题，即点击和不点击两种分类。然而一般点击率预测中点击和非点击会产生严重类别不平衡的问题。
[0003]目前对于分类过程的类别不平衡问题，一般可以通过上采样的方式来进行类别平衡，然而上采样的方法仅适用于结构良好的数据，无法对推荐场景下高度异构的样本数据进行处理，从而影响分类过程的分类准确性。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高分类准确率的分类模型处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面，本申请提供了一种分类模型处理方法。所述方法包括：
[0006]获取第一类样本数据和第二类样本数据，所述第一类样本数据的数量大于所述第二类样本数据的数量；
[0007]通过伪装网络对所述第一类样本数据进行伪装处理，得到伪装为第二类样本数据的伪装样本数据；
[0008]基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据；
[000...

【技术保护点】

【技术特征摘要】
1.一种分类模型处理方法，其特征在于，所述方法包括：获取第一类样本数据和第二类样本数据，所述第一类样本数据的数量大于所述第二类样本数据的数量；通过伪装网络对所述第一类样本数据进行伪装处理，得到伪装为第二类样本数据的伪装样本数据；基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据；通过判别网络对所述模型训练数据进行判别分类处理，得到所述判别网络针对所述模型训练数据的分类判别结果；基于所述分类判别结果对所述判别网络进行损失优化处理，得到分类模型。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：将所述第一类样本数据输入初始伪装网络，得到初始伪装结果；基于所述初始伪装结果和所述判别网络对所述初始伪装网络进行损失优化处理，得到伪装网络。3.根据权利要求2所述的方法，其特征在于，所述基于所述初始伪装结果和所述判别网络对所述初始伪装网络进行损失优化处理，得到伪装网络包括：通过判别网络对所述初始伪装结果进行判别分类处理，得到所述判别网络针对所述初始伪装结果的分类判别结果；基于所述第一类样本数据、所述初始伪装结果和所述初始伪装结果的分类判别结果确定伪装损失；基于所述伪装损失对所述初始伪装网络进行损失优化处理，得到伪装网络。4.根据权利要求1所述的方法，其特征在于，所述分类判别结果包括分类结果和聚类结果，所述通过判别网络对所述模型训练数据进行判别分类处理，得到所述判别网络针对所述模型训练数据的分类判别结果包括：通过判别网络对所述模型训练数据进行判别处理，确定所述模型训练数据中的真样本数据和伪装样本数据，所述真样本数据包括所述第一类样本数据和所述第二类样本数据；通过判别网络对所述真样本数据进行分类处理，得到分类结果，通过判别网络对所述伪装样本数据进行聚类处理，得到聚类结果。5.根据权利要求4所述的方法，其特征在于，所述基于所述分类判别结果对所述判别网络进行损失优化处理，得到分类模型包括：基于所述分类结果和所述聚类结果进行损失识别处理，得到所述判别网络的判别损失；基于所述判别损失对所述判别网络进行损失优化处理，得到分类模型。6.根据权利要求5所述的方法，其特征在于，所述基于所述分类结果和所述聚类结果进行损失识别处理，得到所述判别网络的判别损失包括：对比所述分类结果与所述真样本数据的数据标签，得到所述判别网络的第一损失；基于所述聚类结果确定所述伪装样本数据的数据标签；根据所述伪装样本数据的数据标签的标签类型，得到所述判别网络的第二损失；基于所述第一损失和所述第二损失之和，得到所述判别网络的判别损失。7.根据权利要求1至6中任意一项所述的方法，其特征在于，所述第一类样本数据和第
二类样本数据...

【专利技术属性】
技术研发人员：郭潇阳，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人