分类模型处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:39737949 阅读:5 留言:0更新日期:2023-12-17 23:40
本申请涉及一种分类模型处理方法、装置、计算机设备、存储介质和计算机程序产品。设计人工智能技术,方法包括:获取第一类样本数据和第二类样本数据,第一类样本数据的数量大于第二类样本数据的数量;通过伪装网络对第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据;基于第一类样本数据、第二类样本数据和伪装样本数据构建模型训练数据;通过判别网络对模型训练数据进行判别分类处理,得到判别网络针对模型训练数据的分类判别结果;基于分类判别结果对判别网络进行损失优化处理,得到分类模型。本申请可以实现判别分类处理过程中的样本平衡化,解决分类模型训练过程中的样本不平衡问题,提高分类模型的分类准确率。类准确率。类准确率。

【技术实现步骤摘要】
分类模型处理方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种分类模型处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展,出现了基于人工智能的分类模型,分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型。该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个,从而可以应用于数据预测。例如对于推荐类的点击率预测问题,其一般可以视为一个二分类的问题,即点击和不点击两种分类。然而一般点击率预测中点击和非点击会产生严重类别不平衡的问题。
[0003]目前对于分类过程的类别不平衡问题,一般可以通过上采样的方式来进行类别平衡,然而上采样的方法仅适用于结构良好的数据,无法对推荐场景下高度异构的样本数据进行处理,从而影响分类过程的分类准确性。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高分类准确率的分类模型处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种分类模型处理方法。所述方法包括:
[0006]获取第一类样本数据和第二类样本数据,所述第一类样本数据的数量大于所述第二类样本数据的数量;
[0007]通过伪装网络对所述第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据;
[0008]基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据;
[0009]通过判别网络对所述模型训练数据进行判别分类处理,得到所述判别网络针对所述模型训练数据的分类判别结果;
[0010]基于所述分类判别结果对所述判别网络进行损失优化处理,得到分类模型。
[0011]第二方面,本申请还提供了一种分类模型处理装置。所述装置包括:
[0012]样本获取模块,用于获取第一类样本数据和第二类样本数据,所述第一类样本数据的数量大于所述第二类样本数据的数量;
[0013]样本伪装模块,用于通过伪装网络对所述第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据;
[0014]训练数据构建模块,用于基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据;
[0015]样本判别模块,用于通过判别网络对所述模型训练数据进行判别分类处理,得到所述判别网络针对所述模型训练数据的分类判别结果;
[0016]模型优化模块,用于基于所述分类判别结果对所述判别网络进行损失优化处理,得到分类模型。
[0017]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0018]获取第一类样本数据和第二类样本数据,所述第一类样本数据的数量大于所述第二类样本数据的数量;
[0019]通过伪装网络对所述第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据;
[0020]基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据;
[0021]通过判别网络对所述模型训练数据进行判别分类处理,得到所述判别网络针对所述模型训练数据的分类判别结果;
[0022]基于所述分类判别结果对所述判别网络进行损失优化处理,得到分类模型。
[0023]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0024]获取第一类样本数据和第二类样本数据,所述第一类样本数据的数量大于所述第二类样本数据的数量;
[0025]通过伪装网络对所述第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据;
[0026]基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据;
[0027]通过判别网络对所述模型训练数据进行判别分类处理,得到所述判别网络针对所述模型训练数据的分类判别结果;
[0028]基于所述分类判别结果对所述判别网络进行损失优化处理,得到分类模型。
[0029]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[0030]获取第一类样本数据和第二类样本数据,所述第一类样本数据的数量大于所述第二类样本数据的数量;
[0031]通过伪装网络对所述第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据;
[0032]基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据;
[0033]通过判别网络对所述模型训练数据进行判别分类处理,得到所述判别网络针对所述模型训练数据的分类判别结果;
[0034]基于所述分类判别结果对所述判别网络进行损失优化处理,得到分类模型。
[0035]上述分类模型处理方法、装置、计算机设备、存储介质和计算机程序产品,通过在获取样本数量不平衡的第一类样本数据和第二类样本数据后,通过伪装网络来对数量较多的第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据,而后基于第一类样本数据、第二类样本数据和伪装样本数据来构建模型训练数据。并通过判别网络
对模型训练数据进行判别分类处理,得到判别网络针对模型训练数据的分类判别结果,基于分类判别结果对判别网络进行损失优化处理,得到分类模型。本申请由伪装后的样本结合原有样本对判别网络进行损失优化的模型训练处理,由于伪装网络能在原有第一类样本数据的基础上生成伪装为第二类样本的伪装样本数据,从而可以实现判别分类处理过程中的样本平衡化,解决分类模型训练过程中的样本不平衡问题,提高分类模型的分类准确率。
附图说明
[0036]图1为一个实施例中分类模型处理方法的应用环境图;
[0037]图2为一个实施例中分类模型处理方法的流程示意图;
[0038]图3为一个实施例中伪装网络的结构示意图;
[0039]图4为一个实施例中判别网络的结构示意图;
[0040]图5为一个实施例中对象评级分类的流程示意图;
[0041]图6为一个实施例中对象评级分类的界面示意图;
[0042]图7为一个实施例中伪装判别网络的网络结构示意图;
[0043]图8为另一个实施例中分类模型处理方法的流程示意图;
[0044]图9为一个实施例中分类模型处理装置的结构框图;
[0045]图10为一个实施例中计算机设备的内部结构图。
具体实施方式
[0046]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0047]本申请涉及人工智能技术,人工本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类模型处理方法,其特征在于,所述方法包括:获取第一类样本数据和第二类样本数据,所述第一类样本数据的数量大于所述第二类样本数据的数量;通过伪装网络对所述第一类样本数据进行伪装处理,得到伪装为第二类样本数据的伪装样本数据;基于所述第一类样本数据、第二类样本数据和所述伪装样本数据构建模型训练数据;通过判别网络对所述模型训练数据进行判别分类处理,得到所述判别网络针对所述模型训练数据的分类判别结果;基于所述分类判别结果对所述判别网络进行损失优化处理,得到分类模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:将所述第一类样本数据输入初始伪装网络,得到初始伪装结果;基于所述初始伪装结果和所述判别网络对所述初始伪装网络进行损失优化处理,得到伪装网络。3.根据权利要求2所述的方法,其特征在于,所述基于所述初始伪装结果和所述判别网络对所述初始伪装网络进行损失优化处理,得到伪装网络包括:通过判别网络对所述初始伪装结果进行判别分类处理,得到所述判别网络针对所述初始伪装结果的分类判别结果;基于所述第一类样本数据、所述初始伪装结果和所述初始伪装结果的分类判别结果确定伪装损失;基于所述伪装损失对所述初始伪装网络进行损失优化处理,得到伪装网络。4.根据权利要求1所述的方法,其特征在于,所述分类判别结果包括分类结果和聚类结果,所述通过判别网络对所述模型训练数据进行判别分类处理,得到所述判别网络针对所述模型训练数据的分类判别结果包括:通过判别网络对所述模型训练数据进行判别处理,确定所述模型训练数据中的真样本数据和伪装样本数据,所述真样本数据包括所述第一类样本数据和所述第二类样本数据;通过判别网络对所述真样本数据进行分类处理,得到分类结果,通过判别网络对所述伪装样本数据进行聚类处理,得到聚类结果。5.根据权利要求4所述的方法,其特征在于,所述基于所述分类判别结果对所述判别网络进行损失优化处理,得到分类模型包括:基于所述分类结果和所述聚类结果进行损失识别处理,得到所述判别网络的判别损失;基于所述判别损失对所述判别网络进行损失优化处理,得到分类模型。6.根据权利要求5所述的方法,其特征在于,所述基于所述分类结果和所述聚类结果进行损失识别处理,得到所述判别网络的判别损失包括:对比所述分类结果与所述真样本数据的数据标签,得到所述判别网络的第一损失;基于所述聚类结果确定所述伪装样本数据的数据标签;根据所述伪装样本数据的数据标签的标签类型,得到所述判别网络的第二损失;基于所述第一损失和所述第二损失之和,得到所述判别网络的判别损失。7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述第一类样本数据和第
二类样本数据...

【专利技术属性】
技术研发人员:郭潇阳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1