图像分割模型的训练与蒸馏方法、电子设备、存储介质技术

技术编号:36204527 阅读:13 留言:0更新日期:2023-01-04 11:59
本发明专利技术实施例提供一种图像分割模型的训练与蒸馏方法、电子设备、存储介质。训练方法包括:获取训练样本图像;将训练样本图像输入至图像分割模型中,并基于第三预设损失函数对图像分割模型进行迭代训练;其中,第三预设损失函数包括:在目标类别下的真实样本像素集合和实际预测样本像素集合的多种交集一一对应的多种概率值,每种概率值与对应交集中的像素属于目标类别的真实值和预测值相关,并且每种概率值的预测值在第三预设损失函数中被配置为在第三预设衰减参数的作用下进行非线性衰减。这有助于加速模型的收敛速度,便于在较短时间内获得性能较好的图像分割模型。内获得性能较好的图像分割模型。内获得性能较好的图像分割模型。

【技术实现步骤摘要】
图像分割模型的训练与蒸馏方法、电子设备、存储介质


[0001]本专利技术涉及图像处理
,更具体地涉及一种图像分割模型的训练方法、应用于图像分割模型的知识蒸馏方法、电子设备和存储介质。

技术介绍

[0002]近年来,图像分割一直是一个活跃的研究领域,例如该技术可以帮助修复医疗领域的漏洞,并帮助大众。在图像分割领域,通常使用图像分割模型对图像进行分割。图像分割模型通常使用训练样本图像,基于损失函数进行训练。
[0003]目前,训练图像分割模型存在以下问题:不仅模型收敛速度慢,训练费时;而且,在前后景样本数量不均衡的场景下,训练的模型效果比较差,漏检率高,无法得到一个性能较佳的模型。

技术实现思路

[0004]考虑到上述问题而提出了本专利技术。本专利技术提供了一种图像分割模型的训练方法、应用于图像分割模型的知识蒸馏方法、电子设备和存储介质。
[0005]根据本专利技术一方面,提供了一种图像分割模型的训练方法。训练方法包括:获取训练样本图像;将训练样本图像输入至图像分割模型中,并基于第三预设损失函数对图像分割模型进行迭代训练;其中,第三预设损失函数包括:在目标类别下的真实样本像素集合和实际预测样本像素集合的多种交集一一对应的多种概率值,每种概率值与对应交集中的像素属于目标类别的真实值和预测值相关,并且每种概率值的预测值在第三预设损失函数中被配置为在第三预设衰减参数的作用下进行非线性衰减。
[0006]示例性地,真实样本像素集合包括真实正样本像素集合和真实负样本像素集合,实际预测样本像素集合包括实际预测正样本像素集合和实际预测负样本像素集合,多种交集包括第一交集、第二交集和第三交集,其中,第一交集为目标类别下真实正样本像素集合和实际预测正样本像素集合的交集;第二交集为目标类别下真实正样本像素集合和实际预测负样本像素集合的交集;第三交集为目标类别下真实负样本像素集合和实际预测正样本像素集合的交集。
[0007]示例性地,第二交集和第三交集对应的概率值具有对应的权重系数,第二交集所对应的概率值的权重系数大于第三交集所对应的概率值的权重系数。
[0008]示例性地,第三预设损失函数=1

预设损失系数,预设损失系数为交并比函数,多种概率值存在于交并比函数的分母中。
[0009]示例性地,第三预设损失函数为dice损失函数。
[0010]示例性地,第三预设损失函数仅与所有训练样本图像所包含的所有类别中用于作为目标类别的稀有类相关,或者,第三预设损失函数与所有训练样本图像所包含的用于作为目标类别的所有类别相关,其中,稀有类是指训练样本图像所包含的所有类别中标注数量或标注比例小于预设阈值的类别。
[0011]示例性地,dice损失函数的dice损失系数中的分子和分母均为在概率值的基础上加上平滑项系数,平滑项系数不等于0。
[0012]示例性地,预设损失系数的分母包括TP、αFN、βFP之和,α和β是权重系数;TP=T
c
*P
cn1
,TP表示在目标类别c下第一交集中所有像素的真实值T
c
和预测值P
c
的n1次方的乘积并求和;FN=(1

P
c
)
n2
*T
c
,FN表示在目标类别c下第二交集中所有像素的真实值T
c
和预测值(1

P
c
)的n2次方的乘积并求和;FP=P
cn3
*(1

Tc),FP表示在目标类别c下第三交集中所有像素的真实值1

Tc和预测值P
c
的n3次方的乘积并求和;n1、n2和n3分别为第三预设衰减参数,且分别大于1。
[0013]示例性地,n1=n2=n3。
[0014]示例性地,n1=n2=n3=2。
[0015]示例性地,若目标类别越稀有,则该目标类别下的第二交集所对应的概率值的权重系数越大。
[0016]示例性地,不同目标类别下的所第二交集和第三交集所对应的概率值的权重系数分别单独设置。
[0017]根据本专利技术的另一方面,还提供了一种应用于图像分割模型的知识蒸馏方法。该知识蒸馏方法包括:获取训练样本图像;将训练样本图像分别输入学生分割模型和教师分割模型中进行模型训练,在训练过程中基于蒸馏损失函数来计算损失;其中,蒸馏损失函数包括基于软目标计算的软损失函数和基于硬目标计算的硬损失函数,其中,硬损失函数采用上述的第三预设损失函数实现。
[0018]示例性地,软损失函数采用第一预设损失函数或第二预设损失函数实现,
[0019]其中,第一预设损失函数包括以下交叉熵之和:
[0020]第一类别所对应的交叉熵:基于第一类别在预设logits调整参数下得到的预测值而计算得到交叉熵值;
[0021]带有衰减倍数的第二类别所对应的交叉熵:衰减倍数在第一预设衰减参数下将(1

第二类别的预测值)非线性衰减;
[0022]其中,第二预设损失函数包括多个类别所对应的交叉熵之和;
[0023]每个类别的交叉熵带有预设衰减倍数,衰减倍数在第二预设衰减参数下将(1

该类别的预测值)非线性衰减;
[0024]每个类别在预设logits调整参数下得到该类别的预测值,根据预测值计算该类别的交叉熵。
[0025]示例性地,第一类别为稀有类,第二类别为非稀有类,稀有类是指训练样本图像所包含的所有类别中标注数量或标注比例小于预设阈值的类别。
[0026]示例性地,第一预设衰减参数为γ,衰减倍数为(1

第二类别的预测值)的γ次方,γ为非负数;或者,
[0027]第二预设衰减参数为γ,衰减倍数为(1

对应类别所对应的预测值)的γ次方,γ为非负数。
[0028]根据本专利技术的又一方面,还提供了一种电子设备,包括处理器和存储器,存储器中存储有计算机程序,处理器执行计算机程序以实现上述的图像分割模型的训练方法以及上述的知识蒸馏方法。
[0029]根据本专利技术的再一方面,还提供了一种存储介质,存储有计算机程序/指令,计算机程序/指令被处理器执行时实现上述的图像分割模型的训练方法以及上述的知识蒸馏方法。
[0030]根据本专利技术实施例的多图像分割模型的训练方法、应用于图像分割模型的知识蒸馏方法、电子设备和存储介质,通过预设衰减参数对预测值进行非线性衰减,这有助于加速模型的收敛速度,便于在较短时间内获得性能较好的图像分割模型,尤其在前后景样本数量不均衡的情形下,漏检率低。
附图说明
[0031]通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分割模型的训练方法,其特征在于,包括:获取训练样本图像;将所述训练样本图像输入至图像分割模型中,并基于第三预设损失函数对所述图像分割模型进行迭代训练;其中,所述第三预设损失函数包括:在目标类别下的真实样本像素集合和实际预测样本像素集合的多种交集一一对应的多种概率值,每种概率值与对应交集中的像素属于所述目标类别的真实值和预测值相关,并且每种概率值的所述预测值在所述第三预设损失函数中被配置为在第三预设衰减参数的作用下进行非线性衰减。2.根据权利要求1所述的方法,其特征在于,所述真实样本像素集合包括真实正样本像素集合和真实负样本像素集合,所述实际预测样本像素集合包括实际预测正样本像素集合和实际预测负样本像素集合,所述多种交集包括第一交集、第二交集和第三交集,其中,所述第一交集为所述目标类别下真实正样本像素集合和实际预测正样本像素集合的交集;所述第二交集为所述目标类别下真实正样本像素集合和实际预测负样本像素集合的交集;所述第三交集为所述目标类别下真实负样本像素集合和实际预测正样本像素集合的交集。3.根据权利要求2所述的方法,其特征在于,所述第二交集和所述第三交集对应的所述概率值具有对应的权重系数,所述第二交集所对应的概率值的权重系数大于所述第三交集所对应的概率值的权重系数。4.根据权利要求1

3任一项所述的方法,其特征在于,所述第三预设损失函数=1

预设损失系数,所述预设损失系数为交并比函数,所述多种概率值存在于所述交并比函数的分母中。5.根据权利要求4所述的方法,其特征在于,所述第三预设损失函数为dice损失函数。6.根据权利要求1

3任一项所述的方法,其特征在于,所述第三预设损失函数仅与所有训练样本图像所包含的所有类别中用于作为所述目标类别的稀有类相关,或者,所述第三预设损失函数与所有训练样本图像所包含的用于作为所述目标类别的所有类别相关,其中,所述稀有类是指所述训练样本图像所包含的所有类别中标注数量或标注比例小于预设阈值的类别。7.根据权利要求5所述的方法,其特征在于,所述dice损失函数的dice损失系数中的分子和分母均为在概率值的基础上加上平滑项系数,所述平滑项系数不等于0。8.根据权利要求4所述的方法,其特征在于,所述预设损失系数的分母包括TP、αFN、βFP之和,α和β是权重系数;TP=T
c
*P
cn1
,TP表示在所述目标类别c下所述第一交集中所有像素的真实值T
c
和预测值P
c
的n1次方的乘积并求和;FN=(1

P
c
)
n2
*T
c
,FN表示在所述目标类别c下所述第二交集中所有像素的真实值T
c
和预测值(1

P
c
)的n2次方的乘积并求和;FP=P
cn3
*(1

T
c<...

【专利技术属性】
技术研发人员:张共济孙新陈燕娟
申请(专利权)人:苏州镁伽科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1