一种分类模型训练方法及计算机设备技术

技术编号:28376176 阅读:22 留言:0更新日期:2021-05-08 00:03
本申请涉及模型训练技术领域,提供了一种分类模型训练方法、分类模型训练装置、计算机设备及计算机可读存储介质。其中,一种分类模型训练方法,从初始样本集合中挖掘出正样本集合,以及与正样本集合对应的候选样本集合,由于候选样本集合是基于正样本集合从初始样本集合中挖掘得到,因此候选样本集合中的样本是考虑了样本的全局分布得到,并且利用预先构建的生成式对抗网络,基于候选样本集合与正样本集合进行样本训练,输出的补充样本集合不具有特征偏性,再将基于补充样本集合与正样本集合得到的目标样本集合,用于对预设分类模型进行训练,由于目标训练样本集合中因正负样本均衡且无特征偏性,因此使得训练后的分类模型具有更好的鲁棒性。

【技术实现步骤摘要】
一种分类模型训练方法及计算机设备
本专利技术属于涉及模型训练及区块链技术,尤其涉及一种分类模型训练方法、分类模型训练装置、计算机设备及计算机可读存储介质。
技术介绍
随着人工智能技术的不断发展,基于神经网络开发的机器学习模型也根据不同的需求在更新迭代。然而,现有的分类模型在训练过程中,由于训练样本不足,因此常常需要基于初始样本进行样本扩充,进而得到具有一定样本数量的训练样本。例如,当初始样本集合中的正样本数量较少时,通过简单复制正样本的方式能够快速提高初始样本集合中的正样本占比;或者,通过减少初始样本集合中的负样本占比,使得样本集合中的正样本占比提升。但是,无论是增加初始样本集合中正样本数量还是减少负样本数量,都会导致所得训练样本存在特征偏性,而利用该训练样本对分类模型进行训练,则容易导致训练后的分类模型存在鲁棒性较差的问题。
技术实现思路
有鉴于此,本申请实施例提供了一种分类模型训练方法、分类模型训练装置、计算机设备及计算机可读存储介质,以解决现有的分类模型训练方案中,存在训练后的分类模型存在鲁棒性较差的问题。本申请实施例的第一方面提供了一种分类模型训练方法,包括:从初始样本集合中挖掘出正样本集合,以及与所述正样本集合对应的候选样本集合;利用预先构建的生成式对抗网络,基于所述候选样本集合与所述正样本集合输出补充样本集合;利用基于所述补充样本集合与所述正样本集合得到的目标样本集合,对预设分类模型进行训练,得到训练后的分类模型。本申请实施例的第二方面提供了一种分类模型训练装置,包括:挖掘单元,用于从初始样本集合中挖掘出正样本集合,以及与所述正样本集合对应的候选样本集合;输出单元,用于利用预先构建的生成式对抗网络,基于所述候选样本集合与所述正样本集合输出补充样本集合;训练单元,用于利用基于所述补充样本集合与所述正样本集合得到的目标样本集合,对预设分类模型进行训练,得到训练后的分类模型。本申请实施例的第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面的各个步骤。本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方面的各个步骤。实施本申请实施例提供的一种分类模型训练方法、分类模型训练装置、计算机设备及计算机可读存储介质具有以下有益效果:本申请实施例,从初始样本集合中挖掘出正样本集合,以及与正样本集合对应的候选样本集合,由于候选样本集合是基于正样本集合从初始样本集合中挖掘得到,因此候选样本集合中的样本是考虑了样本的全局分布得到,并且利用预先构建的生成式对抗网络,基于候选样本集合与正样本集合进行样本训练,输出的补充样本集合不具有特征偏性,再将基于补充样本集合与正样本集合得到的目标样本集合,用于对预设分类模型进行训练,由于目标训练样本集合中因正负样本均衡且无特征偏性,因此不会导致模型容易失效,提高了分类模型的训练效率,使得训练后的分类模型具有更好的鲁棒性。附图说明为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种分类模型训练方法的实现流程图;图2是本申请实施例中生成式对抗网络的原理图;图3是本申请另一实施例提供的一种分类模型训练方法的实现流程图;图4是本申请实施例提供的一种分类模型训练装置的结构框图;图5是本申请实施例提供的一种计算机设备的示意图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本实施例提供的一种分类模型训练方法,执行主体为终端设备,具体可以是配置有该方法功能的计算机设备。需要说明的是,执行本实施例提供的一种分类模型训练方法的终端设备,可以是用于配置训练样本并利用该训练样本训练分类模型的终端设备。这里,终端设备上构建有预设分类模型,在对分类模型进行训练时,可以是先基于本地存储的数据样本进行训练样本配置,或者是先接收其他终端或服务器发送的数据样本后进行训练样本配置,此处不做限制。终端设备在获取到数据样本后,也即获取到初始样本集合后,通过执行本实施例提供的分类模型训练方法,实现对预设分类模型进行训练,得到训练后的分类模型。至于对训练后的分类模型的应用,可以是由训练该分类模型的终端设备执行相应的模型脚本实现对对训练后的分类模型的应用,也可以是由该终端设备将相应的模型脚本发送给其他终端设备或服务器,由其他终端或服务器根据业务需求,基于该模型脚本实现对训练后的分类模型的应用。例如,在分布式系统中,训练分类模型的终端设备作为分布式系统中的某个节点,当该终端设备完成模型训练后,将用于描述训练后的分类模型的模型脚本发送给分布式系统中的其他终端节点,由其他终端节点执行该模型脚本,进而实现对训练后的分类模型的应用。图1示出了本申请第一实施例提供的分类模型训练方法的实现流程图,详述如下:S11:从初始样本集合中挖掘出正样本集合,以及与所述正样本集合对应的候选样本集合。在步骤S11中,初始样本集合中的初始样本为未进行任何筛选或清洗过的样本数据。正样本集合中的正样本,用于训练分类模型的正向输出逻辑,也即用于训练分类模型描述正向数据关系的样本,且正样本集合为初始样本集合的子集。初始样本集合中还包含有不符合预设样本条件的样本,也即负样本集合。需要说明的是,候选样本集合中的候选样本是与正样本之间的相似度较高的样本。这里,候选样本集合中的候选样本是从负样本集合中筛选得到的样本,也即候选样本集合是负样本集合的子集。在本实施例中,终端设备通过对初始样本集合中的所有样本进行遍历,通过识别所有样本相应的数据,进而从中确定出能够用于训练分类模型描述正向数据关系的样本为正样本,得到正样本集合;确定能够用于训练分类模型描述负向数据关系的样本为负样本,得到负样本集合,再通过比较负样本集合中各负样本与正样本之间的相似度,进而将相似度较高的负样本作为候选样本,得到候选样本集合。应当理解的是,由于候选样本集合中的候选样本是从负样本集合中挖掘得到,因此该候选样本集合中的样本数量必然少于初始样本集合中负样本集合的样本数量。这里,候选样本集合同时也是对负样本集合中,样本特征接近正样本的特殊样本的统称,也即候选样本集合中的样本并非正样本,而是与正样本较为接近或者较相似的负样本。作为一个实施例,步骤S11具体包括:根据预设样本条件从所述初始样本集合中确定出正样本集合与负样本集合;从所述负样本集合中确定出本文档来自技高网...

【技术保护点】
1.一种分类模型训练方法,其特征在于,包括:/n从初始样本集合中挖掘出正样本集合,以及与所述正样本集合对应的候选样本集合;/n利用预先构建的生成式对抗网络,基于所述候选样本集合与所述正样本集合输出补充样本集合;/n利用基于所述补充样本集合与所述正样本集合得到的目标样本集合,对预设分类模型进行训练,得到训练后的分类模型。/n

【技术特征摘要】
1.一种分类模型训练方法,其特征在于,包括:
从初始样本集合中挖掘出正样本集合,以及与所述正样本集合对应的候选样本集合;
利用预先构建的生成式对抗网络,基于所述候选样本集合与所述正样本集合输出补充样本集合;
利用基于所述补充样本集合与所述正样本集合得到的目标样本集合,对预设分类模型进行训练,得到训练后的分类模型。


2.根据权利要求1所述的分类模型训练方法,其特征在于,所述从初始样本集合中挖掘出正样本集合,以及与所述正样本集合对应的候选样本集合,包括:
根据预设样本条件从所述初始样本集合中确定出正样本集合与负样本集合;
从所述负样本集合中确定出候选样本集合。


3.根据权利要求2所述的分类模型训练方法,其特征在于,所述从所述负样本集合中确定出候选样本集合,包括:
测算所述负样本与参考样本之间的相似度;其中,所述参考样本为所述正样本集合中的任一正样本;
若所述相似度等于或大于预设阈值,则将所述负样本作为参考样本,得到参考样本集合。


4.根据权利要求3所述的分类模型训练方法,其特征在于,所述测算所述负样本与参考样本之间的相似度,包括:
通过以下公式测算得到所述负样本与参考样本之间的相似度;



其中,DM(x,y)为所述相似度;x为所述参考样本中目标维度的第一数据;y为所述负样本中目标维度的第二数据;T表示装置;∑-1表示所述第一数据与所述第二数据之间特征向量的协方差矩阵。


5.根据权利要求1所述的分类模型训练方法,其特征在于,所述生成式对抗网络包括生成模型与判别模型;
所述利用预先构建的生成式对抗网络,基于所述候选样本集合与所述正样本集合输出补充样本集合,包括:
通过所述生成模型根据所述候选样本集合生成第一样本集合;

【专利技术属性】
技术研发人员:杨德杰
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1