基于难样本的训练方法、装置及电子设备制造方法及图纸

技术编号：19693928 阅读：24 留言：0更新日期：2018-12-08 11:42

本发明专利技术提供了一种基于难样本的训练方法、装置及电子设备，该方法首先利用预训练模型对公开数据集中的样本进行遍历识别，获得被误识别为目标类的负类样本，将该负类样本添加至包括正类样本的第一数据集中，形成第二数据集；然后基于该第二数据集，利用预选代价函数和预先设定的难样本针对性代价函数对初始模型进行训练，得到输出模型。该方式将从公开数据集中挑选出的负类样本，加入后续用于训练的数据集中，然后利用预先设定的难样本针对性代价函数，基于该包含负类样本的数据集进行模型训练，从而加强对易识别为FP的难样本的识别学习，在不增加模型输出类别的情况下，有效抑制FP的同时，提升模型的识别准确率，改善用户的使用体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于难样本的训练方法、装置及电子设备
本专利技术涉及图像处理
，尤其是涉及一种基于难样本的训练方法、装置及电子设备。
技术介绍
随着智能手机相机功能的推广，移动设备并行计算硬件效能大幅进步，人们的物质与精神生活需求的逐渐提高，人工智能与计算机视觉技术在智能手机相机中的应用的市场越来越大。其中基于场景/物体识别的自动后处理技术已经成为了各大手机厂商所需要的技术，与之对应的算法也成为了研究热点。由于上述算法需要在移动终端上部署，在保证一定准确率的同时，这种算法也需要尽量减少参数和计算量，以达到一个较低的能耗。目前市场上存在的算法为了压缩计算量，往往使用的是减少类别数的方法。而单纯减少类别数往往会导致有很多物体或者场景并没有出现在网络训练集中，使得神经网络在真实使用时往往会将某些不属于网络训练集中已有类别的物体或场景分进某个类中，产生FP(FalsePositive，假阳性)，例如将远处拍摄的黄色射灯识别为日出，或者将白色水泥地识别为雪景等。综上，目前市场上在移动终端部署的识别算法往往都存在较多的FP，识别能力下降，严重影响实际的使用体验。
技术实现思路
有鉴于此，本专利技术的目的在于提供一种基于难样本的训练方法、装置及电子设备，以在有效抑制FP的同时，提升模型的识别准确率，改善用户的使用体验。第一方面，本专利技术实施例提供了一种基于难样本的训练方法，包括：遍历步骤，利用预训练模型对公开数据集中的样本进行遍历识别，将被误识别为目标类的负类样本，添加至包括正类样本的第一数据集，形成第二数据集；训练步骤，基于所述第二数据集，利用预选代价函数和预先设定的难样本针对性...

【技术保护点】
1.一种基于难样本的训练方法，其特征在于，包括：遍历步骤，利用预训练模型对公开数据集中的样本进行遍历识别，将被误识别为目标类的负类样本，添加至包括正类样本的第一数据集，形成第二数据集；训练步骤，基于所述第二数据集，利用预选代价函数和预先设定的难样本针对性代价函数对初始模型进行训练，得到输出模型；其中所述预选代价函数包括分类交叉熵函数。

【技术特征摘要】
1.一种基于难样本的训练方法，其特征在于，包括：遍历步骤，利用预训练模型对公开数据集中的样本进行遍历识别，将被误识别为目标类的负类样本，添加至包括正类样本的第一数据集，形成第二数据集；训练步骤，基于所述第二数据集，利用预选代价函数和预先设定的难样本针对性代价函数对初始模型进行训练，得到输出模型；其中所述预选代价函数包括分类交叉熵函数。2.根据权利要求1所述的方法，其特征在于，所述遍历步骤之前，还包括：初始步骤，基于由正类样本组成的第一数据集，对初始模型进行训练，得到预训练模型。3.根据权利要求2所述的方法，其特征在于，所述训练步骤之后，还包括：测试步骤，测试所述输出模型是否满足预期需求；若否，则将所述输出模型作为新的预训练模型，将第二数据集作为新的第一数据集，并返回所述遍历步骤；若是，则将所述输出模型作为最终模型进行输出。4.根据权利要求1、2或3任一项所述的方法，其特征在于，所述预先设定的难样本针对性代价函数用于：在训练步骤中，分别获取初始模型识别出的每个负类样本属于各个目标类的概率；根据每个负类样本属于各个目标类的概率、所述目标类的数量及第二数据集中负类的数量，计算所述难样本针对性代价函数的值。5.根据权利要求4所述的方法，其特征在于，所述难样本针对性代价函数为：其中，f表示所述难样本针对性代价函数；m表示初始模型识别出的负类样本的数量；K表示所述目标类的数量；M表示第二数据集中负类的数量；xi...

【专利技术属性】
技术研发人员：朱星宇，黄鼎，张诚，
申请(专利权)人：北京旷视科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人