【技术实现步骤摘要】
一种神经网络模型训练方法、装置、电子设备及存储介质
本申请涉及模型训练的
,特别是涉及一种神经网络模型训练方法、装置、电子设备及存储介质。
技术介绍
目前,人工智能已经可以代替人类完成认知、识别、分析、决策等功能的一项技术。通过人工智能可以实现:图像识别、语音识别、智能生活、自动驾驶等,从而为人们的生活提供极大的便利。然而,应用在人工智能领域的神经网络的结构往往过于庞大,对于计算资源和存储资源的要求很高,因此,目前大多数的基于深度神经网络的应用均需依赖于有着海量计算资源的云平台,从而给人工智能及其相关服务的发展带来了极大的局限性。
技术实现思路
本申请实施例的目的在于提供一种神经网络模型训练方法、装置、电子设备及存储介质,用以解决如何提高神经网络部署的便利性的问题。具体技术方案如下:本申请实施例的第一方面,首先提供了一种神经网络模型训练方法,所述方法包括:根据预设的多组分割点将待训练的图像分类网络模型分割为多组子网络模型,其中,每一组子网络模型均包括第一子网络模型、第二子网络模型和第三子网络模型;针对各组子网络模型,将样本图像输入所述第一子网络模型,并以所述第一子网络模型的输出作为所述第二子网络模型的输入,以所述第二子网络模型的输出作为所述第一子网络模型的输入,生成所述第三子网络模型输出的图像分类结果;针对各组子网络模型,通过预设损失函数分别计算所述第一子网络模型的输出对应的第一损失、所述第二子网络模型的输出对应的第二损失和所述第三子网络模型输出的图像
【技术保护点】
1.一种神经网络模型训练方法,其特征在于,所述方法包括:/n根据预设的多组分割点将待训练的图像分类网络模型分割为多组子网络模型,其中,每一组子网络模型均包括第一子网络模型、第二子网络模型和第三子网络模型;/n针对各组子网络模型,将样本图像输入所述第一子网络模型,并以所述第一子网络模型的输出作为所述第二子网络模型的输入,以所述第二子网络模型的输出作为所述第一子网络模型的输入,生成所述第三子网络模型输出的图像分类结果;/n针对各组子网络模型,通过预设损失函数分别计算所述第一子网络模型的输出对应的第一损失、所述第二子网络模型的输出对应的第二损失和所述第三子网络模型输出的图像分类结果对应的第三损失;/n针对各组子网络模型,分别通过对应的所述第一损失、所述第二损失和所述第三损失,对对应的所述第一子网络模型、所述第二子网络模型和所述第三子网络模型进行联合训练,得到第一待输出子网络模型、第二待输出子网络模型和第三待输出子网络模型;/n针对各组子网络模型,分别计算所述第一待输出子网络模型、所述第二待输出子网络模型和所述第三待输出子网络模型对应的多项性能参数;/n根据各组子网络模型对应的多项性能参数,通 ...
【技术特征摘要】
1.一种神经网络模型训练方法,其特征在于,所述方法包括:
根据预设的多组分割点将待训练的图像分类网络模型分割为多组子网络模型,其中,每一组子网络模型均包括第一子网络模型、第二子网络模型和第三子网络模型;
针对各组子网络模型,将样本图像输入所述第一子网络模型,并以所述第一子网络模型的输出作为所述第二子网络模型的输入,以所述第二子网络模型的输出作为所述第一子网络模型的输入,生成所述第三子网络模型输出的图像分类结果;
针对各组子网络模型,通过预设损失函数分别计算所述第一子网络模型的输出对应的第一损失、所述第二子网络模型的输出对应的第二损失和所述第三子网络模型输出的图像分类结果对应的第三损失;
针对各组子网络模型,分别通过对应的所述第一损失、所述第二损失和所述第三损失,对对应的所述第一子网络模型、所述第二子网络模型和所述第三子网络模型进行联合训练,得到第一待输出子网络模型、第二待输出子网络模型和第三待输出子网络模型;
针对各组子网络模型,分别计算所述第一待输出子网络模型、所述第二待输出子网络模型和所述第三待输出子网络模型对应的多项性能参数;
根据各组子网络模型对应的多项性能参数,通过预设熵权模型,分别计算各组子网络模型对应的综合性能得分;
选取所述各组子网络模型中综合性能得分最高的一组作为目标子网络模型。
2.根据权利要求1所述的方法,其特征在于,所述针对各组子网络模型,分别计算所述第一待输出子网络模型、所述第二待输出子网络模型和所述第三待输出子网络模型对应的多项性能参数,包括:
针对各组子网络模型,分别计算所述第一待输出子网络模型、所述第二待输出子网络模型和所述第三待输出子网络模型对应的模型准确率、端到端时延和数据退出率。
3.根据权利要求2所述的方法,其特征在于,所述针对各组子网络模型,将样本图像输入所述第一子网络模型,并以所述第一子网络模型的输出作为所述第二子网络模型的输入,以所述第二子网络模型的输出作为所述第一子网络模型的输入,生成所述第三子网络模型输出的图像分类结果,包括:
针对各组子网络模型,将样本图像输入所述第一子网络模型,得到所述第一子网络模型的输出;
根据所述第一子网络模型的输出,通过预设熵值法计算对应的第一可信度;
当所述第一可信度大于预设阈值时,将所述第一子网络模型的输出输入到所述第二子网络模型,得到所述第二子网络模型的输出;
根据所述第二子网络模型的输出,通过预设熵值法计算对应的第二可信度;
当所述第二可信度大于所述预设阈值时,将所述第二子网络模型的输出输入到所述第三子网络模型,得到所述第三子网络模型输出的图像分类结果。
4.根据权利要求3所述的方法,其特征在于,所述预设阈值为通过预设公式:
entropy(y)=∑c∈cyclogyc,计算得到的数值,
其中,entropy()表示熵值法,y是各子模型模型的输出对应的各个标签的预测概率向量,C是分类任务中的所有标签集合。
5.根据权利要求1所述的方法,其特征在于,所述针对各组子网络模型,通过预设损失函数分别计算所述第一子网络模型的输出对应的第一损失、所述第二子网络模型的输出对应的第二损失和所述第三子网络模型输出的图像分类结果对应的第三损失,包括:
针对各组子网络模型,通过预设损失函数:
youtput_n=ycut_n(x;ω;b);
其中,n表示第n个分割点,x为输入数据,ω和b分别表示从输入到当前分割点...
【专利技术属性】
技术研发人员:高志鹏,苗东,芮兰兰,莫梓嘉,赵晨,林怡静,谭清,付伟,
申请(专利权)人:北京邮电大学,北京驱云科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。