一种分类模型训练方法和一种分类模型训练装置制造方法及图纸

技术编号：29092624 阅读：16 留言：0更新日期：2021-06-30 10:00

本发明专利技术公开了一种分类模型训练方法和一种分类模型训练装置。该方法包括：从训练集中抽取部分样本作为初始训练集，用初始训练集训练分类模型；若得到的分类模型未达到预期效果，则根据分类模型对训练集的分类结果，更新当前初始训练集，更新方式包括：向初始训练集中加入至少部分分类错误的样本，和/或，从初始训练集中剔除部分分类正确的样本；利用更新后的初始训练集重新训练分类模型，直至分类模型达到预期效果或直至满足训练结束条件。本申请根据每次训练后分类模型对训练集的分类结果，分批次向初始训练集中添加分类错误的样本，和/或剔除分类正确的样本，可逐渐优化训练效果，克服类别之间样本不平衡问题，训练速度更快，且训练结果更佳。且训练结果更佳。且训练结果更佳。

全部详细技术资料下载

【技术实现步骤摘要】
一种分类模型训练方法和一种分类模型训练装置

[0001]本专利技术涉及机器学习
，特别涉及一种分类模型训练方法和一种分类模型训练装置。

技术介绍

[0002]随着深度学习的发展，AI(Artificial Intelligence，人工智能)在智能制造领域的作用越来越大，例如，在很多实际工程部署当中，AI在质量把控、缺陷检测方面起到了巨大的作用。
[0003]但是，在现有的工业大数据背景下，一次AI训练所需要的数据集越来越大，并且类别之间不平衡，往往一个数据集有几千到几万张图片，其中，有的类别会有几千张图，有的类别却只有几十张，差距在一到两个数量级。在这种特征下，带来了两个问题，一是：大数据集下训练时间会较长，数据集越大，训练时间越长。二是类别之间的不平衡，容易造成模型对分类的侧重不同，导致模型训练结果不好。

技术实现思路

[0004]鉴于现有技术分类模型的训练集数据多、类别间不平衡，导致训练时间长和训练结果不佳的问题，提出了本申请的一种分类模型训练方法和一种分类模型训练装置，以便克服上述问题。
[0005]为了实现上述目的，本申请采用了如下技术方案：
[0006]依据本申请的一个方面，提供了一种分类模型训练方法，该方法包括：
[0007]从训练集中抽取部分样本作为初始训练集，用初始训练集训练分类模型；
[0008]若得到的分类模型未达到预期效果，则根据分类模型对训练集的分类结果，更新当前初始训练集，更新方式包括：向初始训练集中加入至少部分分类错误的样本，...

【技术保护点】

【技术特征摘要】
1.一种分类模型训练方法，其特征在于，该方法包括：从训练集中抽取部分样本作为初始训练集，用所述初始训练集训练分类模型；若得到的分类模型未达到预期效果，则根据所述分类模型对所述训练集的分类结果，更新当前初始训练集，更新方式包括：向所述初始训练集中加入至少部分分类错误的样本，和/或，从所述初始训练集中剔除部分分类正确的样本；利用更新后的初始训练集重新训练所述分类模型，直至所述分类模型达到预期效果或直至满足训练结束条件。2.根据权利要求1所述的分类模型训练方法，其特征在于，所述从训练集中抽取部分样本作为初始训练集，包括：以所述训练集中数量最少的一类负样本的样本个数为基准，按照预设比例分别选取相同数量的各类负样本，形成所述初始训练集的负样本集合。3.根据权利要求2所述的分类模型训练方法，其特征在于，所述从训练集中抽取部分样本作为初始训练集，还包括：从所述训练集中选取部分正样本与所述负样本集合共同组成所述初始训练集，所述正样本在所述初始训练集中的占比不超过一半。4.根据权利要求1所述的分类模型训练方法，其特征在于，所述向所述初始训练集中加入至少部分分类错误的样本，包括：从所述初始训练集以外的训练集样本中，挑选至少部分分类错误的样本加入所述初始训练集中；若分类错误的样本中各类负样本间的样本个数差异小于预设标准，则将全部分类错误的负样本加入所述初始训练集中；若差异不小于预设标准，则以数量最少的一类负样本的样本个数为基准，或者，以预设的固定数量为基准，挑选相应数量的各类负样本加入所述初始训练集中。5.根据权利要求4所述的分类模型训练方法，其特征在于，以数量最少的一类负样本的样本个数为基准，挑选相应数量的各类负样本加入所述初始训练集中，包括：以数量最少的一类负样本的样本个数为基准，按照预设比例分别选取相...

【专利技术属性】
技术研发人员：邸顺然，
申请(专利权)人：歌尔股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人