【技术实现步骤摘要】
图像分割模型的训练与蒸馏方法、电子设备和存储介质
[0001]本专利技术涉及图像处理
,更具体地涉及一种图像分割模型的训练方法、应用于图像分割模型的知识蒸馏方法、电子设备和存储介质。
技术介绍
[0002]近年来,图像分割一直是一个活跃的研究领域,例如该技术可以帮助修复医疗领域的漏洞,并帮助大众。在图像分割领域,通常使用图像分割模型对图像进行分割。图像分割模型可以使用训练样本图像,基于损失函数进行训练。
[0003]现有图像分割模型的损失函数可以表示为:其中,N为每次迭代的样本总数,M表示样本类别总数,c表示当前类别,c=i表示第i类别为当前类别c。此外,T
c
是指c类的真实值或标签值,例如,若像素是c类,那么T
c
就等于1,否则T
c
就等于0,P
c
是指c类的预测值。该损失函数应用在样本不均衡以及小目标或者细小目标的场景下,可能存在漏检率高,交并比(IOU)低等问题。
技术实现思路
[0004]考虑到上述问题而提出了本专利技术。本专利技术提供了一种图像分割模型的训练方法、应用于图像分割模型的知识蒸馏方法、电子设备和存储介质。
[0005]根据本专利技术的第一方面,提供了一种图像分割模型的训练方法,包括:获取训练样本图像;将训练样本图像输入至图像分割模型中,并基于第一预设损失函数对图像分割模型进行迭代训练;其中,第一预设损失函数包括以下交叉熵之和:第一类别所对应的交叉熵:基于第一类别在预设logits调整参数 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种图像分割模型的训练方法,其特征在于,包括:获取训练样本图像;将所述训练样本图像输入至图像分割模型中,并基于第一预设损失函数对所述图像分割模型进行迭代训练;其中,所述第一预设损失函数包括以下交叉熵之和:第一类别所对应的交叉熵:基于所述第一类别在预设logits调整参数下得到的预测值而计算得到交叉熵值;带有衰减倍数的第二类别所对应的交叉熵:所述衰减倍数在第一预设衰减参数下将(1
‑
所述第二类别的预测值)非线性衰减。2.如权利要求1所述的方法,其中,所述第一类别为稀有类,所述第二类别为非稀有类,稀有类是指所述训练样本图像所包含的所有类别中标注数量或标注比例小于预设阈值的类别。3.如权利要求1所述的方法,其中,所述第一预设衰减参数为γ;所述衰减倍数为(1
‑
所述第二类别的预测值)的γ次方,γ为非负数。4.如权利要求3所述的方法,其中,γ的取值范围为[1,5]。5.如权利要求1所述的方法,其中,基于每个所述第一类别的logits值与预设logits调整参数m之差获得该第一类别的预测值,m为非负数。6.如权利要求5所述的方法,其中,m的取值范围为[0.5,1.5]。7.如权利要求1
‑
6任一项所述的方法,其中,所述第一预设损失函数的公式如下:其中,N表示每次迭代训练时所述训练样本图像的总数量;T
c=i
表示当前类别c为第一类别i时的真实值;表示当前类别c为第一类别i时基于所述预设logits调整参数m下获得的预测值;T
c≠i
表示当前类别c为任一第二类别时的真实值;P
c≠i
表示当前类别c为任一第二类别时的预测值;γ表示所述第一预设衰减参数。8.一种图像分割模型的训练方法,其特征在于,包括:获取训练样本图像;将所述训练样本图像输入至图像分割模型中,并基于第二预设损失函数对所述图像分割模型进行迭代训练;其中,所述第二预设损失函数包括多个类别所对应的交叉熵之和;每个所述类别的所述交叉熵带有预设衰减倍数,所述衰减倍数在第二预设衰减参数下将(1
‑
该类别的预测值)非线性衰减;每个所述类别在预设logits调整参数下得到该类别的预测值,根据所述预测值计算该类别的交叉熵。9.如权利要求8所述的方法,其中,所述第二预设衰减参数为γ;所述衰减倍数为(1
‑
对应类别所对应的预测值)的γ次方,γ为非负数。
10.如权利要求9所述的方法,其中,γ的取值范围为[1,5]。11.如权利要求8所述的方法,其中,基于每个所述类别的logits值与预设logits调整参数m之差获得该类别的预测值,m为非负数。12.如权利要求11所述的方法,其中,m的取值范围为[0.5,1.5]。13.如权利要求8
‑
技术研发人员:陈燕娟,孙新,张共济,
申请(专利权)人:苏州镁伽科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。