神经网络训练方法、图像处理方法及装置制造方法及图纸

技术编号：24411652 阅读：39 留言：0更新日期：2020-06-06 09:29

本公开提供了神经网络训练方法、图像处理方法及装置。其中神经网络训练方法包括：获取总训练集，总训练集包括多个类别的训练数据，其中每个类别包括一个或多个训练数据；基于每个类别包括的训练数据的数量，得到头部训练集，其中，头部训练集中的任一类别包括的训练数据的数量多于非头部训练集中的任一类别包括的训练数据的数量；基于头部训练集的训练数据和第一损失函数调整神经网络的参数，以及基于总训练集的训练数据和第二损失函数调整神经网络的参数，以完成对神经网络的训练。通过训练集中类别的训练数据数量，采用多种训练方法，使提高训练质量，保证训练后神经网络的分类准确性。

Neural network training method, image processing method and device

全部详细技术资料下载

【技术实现步骤摘要】
神经网络训练方法、图像处理方法及装置
本专利技术一般地涉及图像识别
，特别是涉及一种神经网络训练方法、图像处理方法及装置，以及电子设备和计算机可读存储介质。
技术介绍
目前神经网络训练过程中使用的训练集，包括多个类别的训练数据，为了保证训练质量以及分类效果，往往会加大训练集的规模，以包含更多的类别，而在规模增加的同时，训练集的存在长尾问题，即：训练集中一部分类别包括很多训练数据(头部数据)，同时有很多类别中仅包含很少的训练数据(尾部数据)。如果采用分类损失函数对神经网络训练，在这种数据集上，由于类数过多，分类损失函数的实现会对计算资源造成很大负担，同时，通过随机采样，训练数据多的类别通过更容易被采样，使得训练后的神经网络倾向于将样本预测为头部数据；尾部数据会因为数据量少且噪声影响大的缘故反而对分类器的训练无法造成影响或造成负面影响。如果采用三元组损失函数(Tripletloss)对神经网络训练，虽然三元组损失函数的部署不会受训练集规模影响，然而其精度不足。
技术实现思路
为了解决现有技术中存在的上述问题，本专利技术提供一种神经网络训练方法、图像处理方法及装置，以及电子设备和计算机可读存储介质。根据本公开实施例的第一方面，提供一种神经网络训练方法，包括：获取总训练集，总训练集包括多个类别的训练数据，其中每个类别包括一个或多个训练数据；基于每个类别包括的训练数据的数量，得到头部训练集，其中，头部训练集中的任一类别包括的训练数据的数量多于非头部训练集中的任一类别包括的训练数...

【技术保护点】
1.一种神经网络训练方法，其中，所述方法包括：/n获取总训练集，所述总训练集包括多个类别的训练数据，其中每个所述类别包括一个或多个所述训练数据；/n基于每个所述类别包括的训练数据的数量，得到头部训练集，其中，所述头部训练集中的任一所述类别包括的训练数据的数量多于非所述头部训练集中的任一所述类别包括的训练数据的数量；/n基于所述头部训练集的所述训练数据和第一损失函数调整神经网络的参数，以及基于所述总训练集的所述训练数据和第二损失函数调整所述神经网络的参数，以完成对所述神经网络的训练。/n

【技术特征摘要】
1.一种神经网络训练方法，其中，所述方法包括：
获取总训练集，所述总训练集包括多个类别的训练数据，其中每个所述类别包括一个或多个所述训练数据；
基于每个所述类别包括的训练数据的数量，得到头部训练集，其中，所述头部训练集中的任一所述类别包括的训练数据的数量多于非所述头部训练集中的任一所述类别包括的训练数据的数量；
基于所述头部训练集的所述训练数据和第一损失函数调整神经网络的参数，以及基于所述总训练集的所述训练数据和第二损失函数调整所述神经网络的参数，以完成对所述神经网络的训练。

2.根据权利要求1所述的神经网络训练方法，其中，所述基于所述头部训练集的所述训练数据和第一损失函数调整神经网络的参数，包括：
对所述头部训练集中的所述训练数据进行随机采样或PK采样得到第一子训练集；
通过所述神经网络对所述第一子训练集中的所述训练数据进行特征提取，得到第一输出结果；
基于所述第一输出结果和所述第一损失函数，调整所述神经网络的参数，其中所述第一损失函数为分类损失函数。

3.根据权利要求1或2所述的神经网络训练方法，其中，所述基于所述总训练集的所述训练数据和第二损失函数调整所述神经网络的参数，包括：
对所述总训练集中的所述训练数据进行PK采样得到第二子训练集；
通过所述神经网络对所述第二子训练集中的所述训练数据进行特征提取，得到第二输出结果；
基于所述第二输出结果和所述第二损失函数，调整所述神经网络的参数，其中所述第二损失函数为三元组损失函数。

4.根据权利要求1所述的神经网络训练方法，其中，所述基于每个所述类别包括的训练数据的数量，得到头部训练集，包括：
将所述训练数据的数量大于预设阈值的所述类别，划分到所述头部训练集。

5.根据权利要求1所述的神经网络训练方法，其中，...

【专利技术属性】
技术研发人员：胡瀚涛，
申请(专利权)人：北京迈格威科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人