【技术实现步骤摘要】
模型训练方法、装置、设备和存储介质
本申请涉及数据处理
,特别是涉及了一种模型训练方法、装置、设备和存储介质。
技术介绍
计算机设备视觉任务中,通常采用神经网络模型进行数据处理。在执行计算机设备视觉任务时,以训练用于识别图像的神经网络为例,通常是将待识别图像输入神经网络模型中,通过神经网络模型输出图像的识别结果。在通过神经网络模型处理视觉任务之前时,通常会先将大量的样本数据作为神经网络模型的输入,将样本数据对应的标签作为神经网络模型的参考输出,进而根据样本数据的标签与神经网络模型输出的结果之间的偏差,调整神经网络模型的参数,得到最终的神经网络模型,该过程被称为训练神经网络模型。然而,上述训练过程所训练的神经网络模型在执行例如图像识别的任务时,其识别准确度不高。
技术实现思路
基于此,有必要针对传统方法所训练的神经网络模型识别准确度不高的问题,提供了一种模型训练方法、装置、设备和存储介质。第一方面,一种模型训练方法,该方法包括:计算机设备获取计算机视觉任务的训练样本集, ...
【技术保护点】
1.一种模型训练方法,其特征在于,所述方法包括:/n计算机设备获取计算机视觉任务的训练样本集,所述训练样本集包括多个训练样本和每个训练样本的识别标签;/n所述计算机设备将所述多个训练样本作为初始神经网络模型的输入,将对应的训练样本的识别标签作为所述初始神经网络模型的参考输出,以目标损失函数的值对所述初始神经网络模型进行训练,得到目标神经网络模型;/n其中,所述目标损失函数为基于平均绝对误差函数MAE和分类交叉熵函数CCE进行融合后得到的函数。/n
【技术特征摘要】
1.一种模型训练方法,其特征在于,所述方法包括:
计算机设备获取计算机视觉任务的训练样本集,所述训练样本集包括多个训练样本和每个训练样本的识别标签;
所述计算机设备将所述多个训练样本作为初始神经网络模型的输入,将对应的训练样本的识别标签作为所述初始神经网络模型的参考输出,以目标损失函数的值对所述初始神经网络模型进行训练,得到目标神经网络模型;
其中,所述目标损失函数为基于平均绝对误差函数MAE和分类交叉熵函数CCE进行融合后得到的函数。
2.根据权利要求1所述方法,其特征在于,所述目标损失函数的获取方法,包括:
所述计算机设备基于所述训练样本集,获取所述训练样本集中错误样本的占比信息;
所述计算机设备根据所述占比信息确定与所述错误样本数量有关的权重因子;
所述计算机设备根据所述权重因子、所述MAE和所述CCE确定所述目标损失函数。
3.根据权利要求2所述方法,其特征在于,所述权重因子为q,所述q的范围为不小于0且不大于1,所述计算机设备根据所述权重因子、所述MAE和所述CCE确定所述目标损失函数,包括:
根据公式q*MAE+(1-q)*CCE确定所述目标损失函数。
4.根据权利要求2或3所述方法,其特征在于,所述占比信息所指示的错误样本的占比越大,则所述权重因子越大;所述占比信息所指示的错误样本的占比越小,则所述权重因子越小。
5.根据权利要求3所述方法,其特征在于,所述计算机设备根据所述占比信息确定与所述错误样本数量有关的权重因子,包括:
所述计算机设备根据所述占比信息自适应确定多个权重因子;
对应的,所述计算机设备根据所述权重因子、所述MAE和所述CCE确定所述目标损失函数,包括:
所述计算机设备根据所述多个权重因子、所述MAE和所述CCE确定多个候选损失函数;
所述计算机设备根据每个候选损失函数对应的神经网络模型与所述计算机设备的计算资源匹配度,确定所述目标损失函数;所述目标损失函数对应的神经网络模型与所述计算机设备的计算资源的匹配度最高。
6.根据权利要求2-5任一项所述方...
【专利技术属性】
技术研发人员:周康明,胡威,
申请(专利权)人:上海眼控科技股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。