基于样本筛选的模型训练方法、装置、设备及存储介质制造方法及图纸

技术编号:29615611 阅读:36 留言:0更新日期:2021-08-10 18:31
本申请适用于人工智能技术领域,提供一种基于样本筛选的模型训练方法、装置、设备及存储介质,该方法包括:将训练数据集输入至第一分类器中,得到输出的第一分类结果,将第一分类结果中属于目标类别的样本数据作为第一舍弃样本,从训练数据集中去除第一舍弃样本得到第一更新训练数据集;将第一更新训练数据集输入至第二分类器中,得到输出的第二分类结果,将第二分类结果中属于目标类别的样本数据作为第二舍弃样本,从第一更新训练数据集中去除第二舍弃样本得到第二更新训练数据集,以此类推直至分类器输出的分类结果符合模型收敛要求;将分类器进行级联,得到目标分类判别模型,提升模型分类精度。

【技术实现步骤摘要】
基于样本筛选的模型训练方法、装置、设备及存储介质
本申请属于人工智能
,尤其涉及一种基于样本筛选的模型训练方法、装置、设备及存储介质。
技术介绍
数据不均衡是分类任务中严重影响分类性能的问题之一,因此解决样本不均衡一直是业内热点。现有的数据分类过程中,由于各样本类别中数据分布不均衡的缘故,导致模型训练过程中,有可能发生当前网络参数下易分的样本在网络参数修改后变成难分样本,同样难分样本也可能发生变化,难分、易分样本不稳定,使得模型训练过程震荡而无法收敛,进而影响模型的训练过程,影响训练后模型的分类性能。
技术实现思路
本申请实施例提供了一种基于样本筛选的模型训练方法、装置、设备及存储介质,以解决现有技术中由于各样本类别中数据分布不均衡导致的难分、易分样本不稳定使模型训练过程震荡而无法收敛,影响模型的训练过程及训练后模型的分类性能的问题。本申请实施例的第一方面提供了一种基于样本筛选的模型训练方法,包括:获取训练数据集;将所述训练数据集输入至第一分类器中,得到输出的第一分类结果,所述第一分类结本文档来自技高网...

【技术保护点】
1.一种基于样本筛选的模型训练方法,其特征在于,包括:/n获取训练数据集;/n将所述训练数据集输入至第一分类器中,得到输出的第一分类结果,所述第一分类结果中包括所述训练数据集中不同样本数据所属的类别;/n将所述第一分类结果中属于目标类别的样本数据作为第一舍弃样本,从所述训练数据集中去除所述第一舍弃样本得到第一更新训练数据集;/n将所述第一更新训练数据集输入至第二分类器中,得到输出的第二分类结果,所述第二分类结果中包括所述第一更新训练数据集中不同样本数据所属的类别;/n将所述第二分类结果中属于所述目标类别的样本数据作为第二舍弃样本,从所述第一更新训练数据集中去除所述第二舍弃样本得到第二更新训练数...

【技术特征摘要】
1.一种基于样本筛选的模型训练方法,其特征在于,包括:
获取训练数据集;
将所述训练数据集输入至第一分类器中,得到输出的第一分类结果,所述第一分类结果中包括所述训练数据集中不同样本数据所属的类别;
将所述第一分类结果中属于目标类别的样本数据作为第一舍弃样本,从所述训练数据集中去除所述第一舍弃样本得到第一更新训练数据集;
将所述第一更新训练数据集输入至第二分类器中,得到输出的第二分类结果,所述第二分类结果中包括所述第一更新训练数据集中不同样本数据所属的类别;
将所述第二分类结果中属于所述目标类别的样本数据作为第二舍弃样本,从所述第一更新训练数据集中去除所述第二舍弃样本得到第二更新训练数据集,以此类推,直至分类器输出的分类结果符合模型收敛要求;
将所有的分类器进行级联,得到目标分类判别模型。


2.根据权利要求1所述的模型训练方法,其特征在于,所述将所述第二分类结果中属于所述目标类别的样本数据作为第二舍弃样本,从所述更新训练数据集中去除所述第二舍弃样本得到第二更新训练数据集之后,还包括:
对已使用的分类器的个数进行累计,得到分类器数量值;
判断所述分类器数量值是否达到阈值;
若所述分类器数量值未达到所述数量阈值,则执行以此类推,直至分类器输出的分类结果符合模型收敛要求的步骤。


3.根据权利要求2所述的模型训练方法,其特征在于,所述判断所述分类器数量值是否达到阈值之前,还包括:
判断当前分类器输出的分类结果是否符合模型收敛要求;
若所述分类结果不符合所述模型收敛要求,则执行所述判断所述分类器数量值是否达到阈值的步骤。


4.根据权利要求1至3任一项所述的模型训练方法,其特征在于,所述将所述第二分类结果中属于所述目标类别的样本数据作为第二舍弃样本,从所述更新训练数据集中去除所述第二舍弃样本得到第二更新训练数据集之后,还包括:
判断所述第二分类结果是否符合模型收敛要求;
若所述第二分类结果不符合模型收敛要求,则将所述第二更新训练数据集输入至第三分类器中,得到输出的第三分类结果,所述第三分类结果中包括所述第二更新训练数据集中不同样本数据所属的类别;
将所述第三分类结果中属于所述目标类别的样本数据作为第三舍弃样本,从所述更新训练数据集中去除所述第三舍弃样本得到第三更...

【专利技术属性】
技术研发人员:陈筱钱江庄伯金
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1