一种图像类别分类的训练方法及装置制造方法及图纸

技术编号:28980531 阅读:21 留言:0更新日期:2021-06-23 09:27
本申请实施例公开了一种图像类别分类的训练方法及装置,用于提高数据分类的训练效率,节省系统资源。本申请实施例方法包括:获取预检测样本图像集;构建训练模型;将预检测样本图像集输入至训练模型确定正类及正类数量;通过训练模型将预检测样本图像集的图像数据平均分布于多张视觉处理器上;确定正类中心及负类中心;确定随机选取的负类中心的数量;根据随机选取的负类中心与正类中心计算总损失值;判断总损失值是否达到第一预设值;若否,则根据总损失值更新训练模型,对负类中心的数据进行二次随机选取,并根据二次选取的负类中心与正类中心二次计算总损失值,直至总损失值达到第一预设值时,确定训练模型训练完成。

【技术实现步骤摘要】
一种图像类别分类的训练方法及装置
本申请实施例涉及智能安防领域,尤其涉及一种图像类别分类的训练方法及装置。
技术介绍
随着当今社会的科学技术的发展,图像处理以及模式识别技术得到快速进步,基于视频图像处理的方式在实际生活中在很多领域得到实际应用。在实际应用中通常是通过收集大量数据完成训练,随着深度学习技术的发展和相关产品的落地,数据的种类和规模越来越大,以人脸识别为例,如今,绝大部分做人脸识别的团队或者公司都拥有几百万的账户或者千万级别的账户,上亿甚至是几十亿的数据,由于目前只能通过硬件的方式来对图像数据进行分类,而训练数据分类时应用到的视觉处理器(GPU,GraphicsProcessingUnit)数量以及显存又十分有限,使得训练这种千万级别账户的图像分类繁琐,训练效率低。
技术实现思路
本申请实施例提供了一种图像类别分类的训练方法及装置,用于提高数据分类的训练效率,节省系统资源。本申请实施例在第一方面提供了一种图像类别分类的训练方法,包括:获取预检测样本图像集;构建训练模型,所述训练模型为设置有图像特征长度以及类别数量的神经网络模型;将所述预检测样本图像集输入至所述训练模型确定正类及正类数量,所述正类为所述预检测样本图像集中的同类图像数据分布,所述正类的数量为所述预检测样本图像集中图像所属类别的类别数量;通过所述训练模型将所述预检测样本图像集的图像数据平均分布于多张视觉处理器上;根据所述正类在多张视觉处理器的平均分布的情况确定正类中心及负类中心;根据所述正类的数量按照预设规则确定随机选取的负类中心的数量,所述负类中心为所述预检测样本图像集中任意两种不同类别的图像数据分布的中心;根据所述随机选取的负类中心与所述正类中心计算总损失值;判断所述总损失值是否达到第一预设值;若否,则根据所述总损失值更新所述训练模型,对所述负类中心的数据进行二次随机选取,并根据二次选取的负类中心与所述正类中心二次计算总损失值,直至总损失值达到第一预设值时,则确定所述训练模型训练完成。可选的,所述根据所述正类的数量按照预设规则确定随机选取的负类中心的数量,包括:设置负类中心采样率;确定视觉处理器上的图像数据的总类别个数,所述总类别个数为所述预检测样本图像集正类的个数;根据所述负类中心采样率与所述总类别个数确定需要随机选取的负类中心的数量。可选的,所述根据所述随机选取的负类中心与所述正类中心计算总损失值,包括:计算所述随机选取的负类中心的负类损失值;分别计算各个所述正类中心的正类损失值;将所述负类损失值与各个正类损失值进行聚合,计算总损失值。可选的,所述预检测样本图像集输入至所述训练模型确定正类及正类数量之前,所述训练方法还包括:将所述预检测样本图像集进行数据清洗和数据增强。可选的,所述判断所述总损失值是否达到第一预设值之后,所述训练方法还包括:若是,则生成所述训练模型的更新次数值,所述更新次数值为根据总损失值更新所述训练模型的次数;判断所述训练模型更新次数值是否大于1;若是,则确定所述训练模型训练完成。可选的,所述判断所述训练模型输入次数值是否大于1之后,所述训练方法还包括:若否,则根据所述总损失值更新所述训练模型,执行步骤:对所述负类中心的数据进行二次随机选取,根据二次选取的负类中心与所述正类中心二次计算总损失值,判断二次计算的总损失值是否达到第一预设值。可选的,所述获取预检测样本图像集之后,将所述预检测样本图像集输入至所述训练模型确定正类及正类数量之前,所述训练方法还包括:标注所述预检测样本图像集中每张样本图像的所属类别;根据所述预检测样本图像集设置图像数据库,所述图像数据库为标注有各个所属类别的数量的数据库。本申请实施例在第二方面提供了一种图像类别分类的训练装置,包括:第一获取单元,用于获取预检测样本图像集;模型构建单元,用于构建训练模型,所述训练模型为设置有图像需要的特征长度以及类别数量的模型;样本输入单元,用于将所述预检测样本图像集输入至所述训练模型确定正类及正类数量,所述正类为所述预检测样本图像集中的同类图像数据分布,所述正类的数量为所述预检测样本图像集中图像所属类别的类别数量;数据分布单元,用于通过所述训练模型将所述预检测样本图像集的图像数据平均分布于多张视觉处理器上;第一确定单元,用于根据所述正类在多张视觉处理器的平均分布的情况确定正类中心及负类中心;第二确定单元,用于根据所述正类的数量按照预设规则确定随机选取的负类中心的数量,所述负类中心为所述预检测样本图像集中任意两种不同类别的图像数据分布的中心;损失计算单元,用于根据所述随机选取的负类中心与所述正类中心计算总损失值;第一判断单元,用于判断所述总损失值是否达到第一预设值;第一执行单元,用于当所述第一判断单元确定所述总损失值未达到第一预设值时,根据所述总损失值更新所述训练模型的参数,对所述负类中心的数据进行二次随机选取,并根据二次选取的负类中心与所述正类中心二次计算总损失值,直至总损失值达到第一预设值时,则确定所述训练模型训练完成。可选的,所述第二确定单元,包括:采样率设置模块,用于设置负类中心采样率;第三确定模块,用于确定视觉处理器上的图像数据的总类别个数,所述总类别个数为所述预检测样本图像集的所属类别正类的个数;第四确定模块,用于根据所述负类中心采样率与所述总类别个数确定需要随机选取的负类中心的数量。可选的,所述损失计算单元,包括:负类计算模块,用于计算所述随机选取的负类中心的负类损失值;正类计算模块,用于分别计算各个所述正类中心的正类损失值;聚合计算模块,用于将所述负类损失值与各个正类损失值进行聚合,计算总损失值。可选的,所述训练装置还包括:数据初处理单元,用于将所述预检测样本图像集进行数据清洗和数据增强;第二执行单元,用于当所述第一判断单元确定所述总损失值达到第一预设值时,生成所述训练模型的更新次数值,所述更新次数值为根据总损失值更新所述训练模型的次数;第二判断单元,用于判断所述训练模型更新次数值是否大于1;第三执行单元,用于当所述第二判断单元确定所述训练模型更新次数值大于1时,确定所述训练模型训练完成;第四执行单元,用于当所述第二判断单元确定所述训练模型更新次数值不大于1时,根据所述总损失值更新所述训练模型,执行步骤:对所述负类中心的数据进行二次随机选取,根据二次选取的负类中心与所述正类中心二次计算总损失值,判断二次计算的总损失值是否达到第一预设值;数据标注单元,用于标注所述预检测样本图像集中每张样本图像的所属类别;数据汇总单元,用于根据所述预检测样本图像集设置图像数据库,所述图像数据库为标注有各个所属类别的数量的数据库。本申请实施例在第本文档来自技高网...

【技术保护点】
1.一种图像类别分类的训练方法,其特征在于,包括:/n获取预检测样本图像集;/n构建训练模型,所述训练模型为设置有图像特征长度以及类别数量的神经网络模型;/n将所述预检测样本图像集输入至所述训练模型确定正类及正类数量,所述正类为所述预检测样本图像集中的同类图像数据分布,所述正类的数量为所述预检测样本图像集中图像所属类别的类别数量;/n通过所述训练模型将所述预检测样本图像集的图像数据平均分布于多张视觉处理器上;/n根据所述正类在多张视觉处理器的平均分布的情况确定正类中心及负类中心;/n根据所述正类的数量按照预设规则确定随机选取的负类中心的数量,所述负类中心为所述预检测样本图像集中任意两种不同类别的图像数据分布的中心;/n根据所述随机选取的负类中心与所述正类中心计算总损失值;/n判断所述总损失值是否达到第一预设值;/n若否,则根据所述总损失值更新所述训练模型,对所述负类中心的数据进行二次随机选取,并根据二次选取的负类中心与所述正类中心二次计算总损失值,直至总损失值达到第一预设值时,则确定所述训练模型训练完成。/n

【技术特征摘要】
1.一种图像类别分类的训练方法,其特征在于,包括:
获取预检测样本图像集;
构建训练模型,所述训练模型为设置有图像特征长度以及类别数量的神经网络模型;
将所述预检测样本图像集输入至所述训练模型确定正类及正类数量,所述正类为所述预检测样本图像集中的同类图像数据分布,所述正类的数量为所述预检测样本图像集中图像所属类别的类别数量;
通过所述训练模型将所述预检测样本图像集的图像数据平均分布于多张视觉处理器上;
根据所述正类在多张视觉处理器的平均分布的情况确定正类中心及负类中心;
根据所述正类的数量按照预设规则确定随机选取的负类中心的数量,所述负类中心为所述预检测样本图像集中任意两种不同类别的图像数据分布的中心;
根据所述随机选取的负类中心与所述正类中心计算总损失值;
判断所述总损失值是否达到第一预设值;
若否,则根据所述总损失值更新所述训练模型,对所述负类中心的数据进行二次随机选取,并根据二次选取的负类中心与所述正类中心二次计算总损失值,直至总损失值达到第一预设值时,则确定所述训练模型训练完成。


2.根据权利要求1所述的训练方法,其特征在于,所述根据所述正类的数量按照预设规则确定随机选取的负类中心的数量,包括:
设置负类中心采样率;
确定视觉处理器上的图像数据的总类别个数,所述总类别个数为所述预检测样本图像集正类的个数;
根据所述负类中心采样率与所述总类别个数确定需要随机选取的负类中心的数量。


3.根据权利要求2所述的训练方法,其特征在于,所述根据所述随机选取的负类中心与所述正类中心计算总损失值,包括:
计算所述随机选取的负类中心的负类损失值;
分别计算各个所述正类中心的正类损失值;
将所述负类损失值与各个正类损失值进行聚合,计算总损失值。


4.根据权利要求3所述的训练方法,其特征在于,所述预检测样本图像集输入至所述训练模型确定正类及正类数量之前,所述训练方法还包括:
将所述预检测样本图像集进行数据清洗和数据增强。


5.根据权利要求4所述的训练方法,其特征在于,所述判断所述总损失值是否达到第一预设值之后,所述训练方法还包括:
若是,则生成所述训练模型的更新次数值,所述更新次数值为根据总损失值更新所述训练模型的次数;
判断所述训练模型更新次数值是否大于1;
若是,则确定所述训练模型训练完成。


6.根据权利要求5所述的训练方法,其特征在于,所述判断所述训练模型输入次数值是否大于1之后,所述训练方法还包括:
若否,则根据所述总损失值更新所述训练模型,执行步骤:对所述负类中心的数...

【专利技术属性】
技术研发人员:唐健石伟潘国峰高声荣陶昆
申请(专利权)人:深圳市捷顺科技实业股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1