一种图像类别分类的训练方法及装置制造方法及图纸

技术编号：28980531 阅读：21 留言：0更新日期：2021-06-23 09:27

本申请实施例公开了一种图像类别分类的训练方法及装置，用于提高数据分类的训练效率，节省系统资源。本申请实施例方法包括：获取预检测样本图像集；构建训练模型；将预检测样本图像集输入至训练模型确定正类及正类数量；通过训练模型将预检测样本图像集的图像数据平均分布于多张视觉处理器上；确定正类中心及负类中心；确定随机选取的负类中心的数量；根据随机选取的负类中心与正类中心计算总损失值；判断总损失值是否达到第一预设值；若否，则根据总损失值更新训练模型，对负类中心的数据进行二次随机选取，并根据二次选取的负类中心与正类中心二次计算总损失值，直至总损失值达到第一预设值时，确定训练模型训练完成。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像类别分类的训练方法及装置
本申请实施例涉及智能安防领域，尤其涉及一种图像类别分类的训练方法及装置。
技术介绍
随着当今社会的科学技术的发展，图像处理以及模式识别技术得到快速进步，基于视频图像处理的方式在实际生活中在很多领域得到实际应用。在实际应用中通常是通过收集大量数据完成训练，随着深度学习技术的发展和相关产品的落地，数据的种类和规模越来越大，以人脸识别为例，如今，绝大部分做人脸识别的团队或者公司都拥有几百万的账户或者千万级别的账户，上亿甚至是几十亿的数据，由于目前只能通过硬件的方式来对图像数据进行分类，而训练数据分类时应用到的视觉处理器(GPU，GraphicsProcessingUnit)数量以及显存又十分有限，使得训练这种千万级别账户的图像分类繁琐，训练效率低。
技术实现思路
本申请实施例提供了一种图像类别分类的训练方法及装置，用于提高数据分类的训练效率，节省系统资源。本申请实施例在第一方面提供了一种图像类别分类的训练方法，包括：获取预检测样本图像集；构建训练模型，所述训练模型为设置有图像特征长度以及类别数量的神经网络模型；将所述预检测样本图像集输入至所述训练模型确定正类及正类数量，所述正类为所述预检测样本图像集中的同类图像数据分布，所述正类的数量为所述预检测样本图像集中图像所属类别的类别数量；通过所述训练模型将所述预检测样本图像集的图像数据平均分布于多张视觉处理器上；根据所述正类在多张视觉处理器的平均分布的情况确定正类中心及负类中心；...

【技术保护点】
1.一种图像类别分类的训练方法，其特征在于，包括：/n获取预检测样本图像集；/n构建训练模型，所述训练模型为设置有图像特征长度以及类别数量的神经网络模型；/n将所述预检测样本图像集输入至所述训练模型确定正类及正类数量，所述正类为所述预检测样本图像集中的同类图像数据分布，所述正类的数量为所述预检测样本图像集中图像所属类别的类别数量；/n通过所述训练模型将所述预检测样本图像集的图像数据平均分布于多张视觉处理器上；/n根据所述正类在多张视觉处理器的平均分布的情况确定正类中心及负类中心；/n根据所述正类的数量按照预设规则确定随机选取的负类中心的数量，所述负类中心为所述预检测样本图像集中任意两种不同类别的图像数据分布的中心；/n根据所述随机选取的负类中心与所述正类中心计算总损失值；/n判断所述总损失值是否达到第一预设值；/n若否，则根据所述总损失值更新所述训练模型，对所述负类中心的数据进行二次随机选取，并根据二次选取的负类中心与所述正类中心二次计算总损失值，直至总损失值达到第一预设值时，则确定所述训练模型训练完成。/n

【技术特征摘要】
1.一种图像类别分类的训练方法，其特征在于，包括：
获取预检测样本图像集；
构建训练模型，所述训练模型为设置有图像特征长度以及类别数量的神经网络模型；
将所述预检测样本图像集输入至所述训练模型确定正类及正类数量，所述正类为所述预检测样本图像集中的同类图像数据分布，所述正类的数量为所述预检测样本图像集中图像所属类别的类别数量；
通过所述训练模型将所述预检测样本图像集的图像数据平均分布于多张视觉处理器上；
根据所述正类在多张视觉处理器的平均分布的情况确定正类中心及负类中心；
根据所述正类的数量按照预设规则确定随机选取的负类中心的数量，所述负类中心为所述预检测样本图像集中任意两种不同类别的图像数据分布的中心；
根据所述随机选取的负类中心与所述正类中心计算总损失值；
判断所述总损失值是否达到第一预设值；
若否，则根据所述总损失值更新所述训练模型，对所述负类中心的数据进行二次随机选取，并根据二次选取的负类中心与所述正类中心二次计算总损失值，直至总损失值达到第一预设值时，则确定所述训练模型训练完成。

2.根据权利要求1所述的训练方法，其特征在于，所述根据所述正类的数量按照预设规则确定随机选取的负类中心的数量，包括：
设置负类中心采样率；
确定视觉处理器上的图像数据的总类别个数，所述总类别个数为所述预检测样本图像集正类的个数；
根据所述负类中心采样率与所述总类别个数确定需要随机选取的负类中心的数量。

3.根据权利要求2所述的训练方法，其特征在于，所述根据所述随机选取的负类中心与所述正类中心计算总损失值，包括：
计算所述随机选取的负类中心的负类损失值；
分别计算各个所述正类中心的正类损失值；
将所述负类损失值与各个正类损失值进行聚合，计算总损失值。

4.根据权利要求3所述的训练方法，其特征在于，所述预检测样本图像集输入至所述训练模型确定正类及正类数量之前，所述训练方法还包括：
将所述预检测样本图像集进行数据清洗和数据增强。

5.根据权利要求4所述的训练方法，其特征在于，所述判断所述总损失值是否达到第一预设值之后，所述训练方法还包括：
若是，则生成所述训练模型的更新次数值，所述更新次数值为根据总损失值更新所述训练模型的次数；
判断所述训练模型更新次数值是否大于1；
若是，则确定所述训练模型训练完成。

6.根据权利要求5所述的训练方法，其特征在于，所述判断所述训练模型输入次数值是否大于1之后，所述训练方法还包括：
若否，则根据所述总损失值更新所述训练模型，执行步骤：对所述负类中心的数...

【专利技术属性】
技术研发人员：唐健，石伟，潘国峰，高声荣，陶昆，
申请(专利权)人：深圳市捷顺科技实业股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人