【技术实现步骤摘要】
深度学习模型训练方法、装置、计算机设备及存储介质
本申请涉及人工智能
,特别是涉及一种深度学习模型训练方法、装置、计算机设备及存储介质。
技术介绍
在机器学习中,损失函数(lossfunction)是衡量深度学习模型的输出和目标结果之间差异的指标。机器学习算法以最小化损失函数为目标进行模型的训练。损失函数的选择依赖于参数数量、机器学习算法、梯度下降的效率、导数求取的难易等等。根据机器学习的任务的不同,损失函数有不同的设计。在图像处理中最常用的损失函数包括:均方误差,即L2损失,它定义为预测值与目标值之间差值的平方和;平均绝对误差,即L1损失,它定义为预测值与目标值之间差绝对值的和;结构相似性误差,即SSIM损失,它将图像的结构信息定义为独立于亮度、对比度的属性,并将失真建模为亮度、对比度和结构三个要素的组合。用均值作为亮度的估计,标准差作为对比度的估计,协方差作为结构相似程度的估计。在实际的应用场景中,单个损失函数往往不能满足需求,研究者倾向于使用复合损失函数,复合损失函数由多个子损失函数组合而成。复合损失函数 ...
【技术保护点】
1.一种深度学习模型训练方法,其特征在于,所述方法包括:/n构建初始深度学习模型,所述初始深度学习模型的损失函数包括多个子损失函数,所述多个子损失函数中的至少一个与图像噪声抑制、图像边界保持以及图像结构相似性保持三个参数中的一个参数相关;/n将所述初始深度学习模型转化为具有多个同等结构的克隆模型,且每个所述克隆模型对应一个所述子损失函数;/n分别对每一所述克隆模型进行训练,得到多个训练完备的克隆模型;/n根据每一训练完备的所述克隆模型对应的权重系数,将多个训练完备的所述克隆模型的输出数据进行加权组合,得到训练完备的深度学习模型。/n
【技术特征摘要】
1.一种深度学习模型训练方法,其特征在于,所述方法包括:
构建初始深度学习模型,所述初始深度学习模型的损失函数包括多个子损失函数,所述多个子损失函数中的至少一个与图像噪声抑制、图像边界保持以及图像结构相似性保持三个参数中的一个参数相关;
将所述初始深度学习模型转化为具有多个同等结构的克隆模型,且每个所述克隆模型对应一个所述子损失函数;
分别对每一所述克隆模型进行训练,得到多个训练完备的克隆模型;
根据每一训练完备的所述克隆模型对应的权重系数,将多个训练完备的所述克隆模型的输出数据进行加权组合,得到训练完备的深度学习模型。
2.根据权利要求1所述的方法,其特征在于,所述分别对每一所述克隆模型进行训练,得到多个训练完备的克隆模型包括:
将训练样本分别输入至每一所述克隆模型;
通过误差反向传播更新每一所述克隆模型的参数,直至误差收敛,得到多个训练完备的克隆模型。
3.根据权利要求1所述的方法,其特征在于,多个训练完备的所述克隆模型对应的权重系数之和为1。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述子损失函数的类型,对至少一个训练完备的所述克隆模型对应的所述权重系数进行调整,改变训练完备的深度学习模型的输出结果。
5.根据权利要求4所述的方法,其特征在于,所述根据所述子损失函数的类型,对至少一个训练完备的所述克隆模型对应的权重系数进行调整,改变训练完备的深度学习模型的输出结果包括:
在预先存储的权重系数组合库中选择与目标处理结果对应的权重系数组合;所述权重系数组合库中包括多个权重系数组合以及所述权重系数组合对应的输出结果。
...
【专利技术属性】
技术研发人员:吕杨,
申请(专利权)人:上海联影医疗科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。