图像分割模型的训练与蒸馏方法、电子设备、存储介质技术

技术编号：36204527 阅读：13 留言：0更新日期：2023-01-04 11:59

本发明专利技术实施例提供一种图像分割模型的训练与蒸馏方法、电子设备、存储介质。训练方法包括：获取训练样本图像；将训练样本图像输入至图像分割模型中，并基于第三预设损失函数对图像分割模型进行迭代训练；其中，第三预设损失函数包括：在目标类别下的真实样本像素集合和实际预测样本像素集合的多种交集一一对应的多种概率值，每种概率值与对应交集中的像素属于目标类别的真实值和预测值相关，并且每种概率值的预测值在第三预设损失函数中被配置为在第三预设衰减参数的作用下进行非线性衰减。这有助于加速模型的收敛速度，便于在较短时间内获得性能较好的图像分割模型。内获得性能较好的图像分割模型。内获得性能较好的图像分割模型。

全部详细技术资料下载

【技术实现步骤摘要】
图像分割模型的训练与蒸馏方法、电子设备、存储介质

[0001]本专利技术涉及图像处理
，更具体地涉及一种图像分割模型的训练方法、应用于图像分割模型的知识蒸馏方法、电子设备和存储介质。

技术介绍

[0002]近年来，图像分割一直是一个活跃的研究领域，例如该技术可以帮助修复医疗领域的漏洞，并帮助大众。在图像分割领域，通常使用图像分割模型对图像进行分割。图像分割模型通常使用训练样本图像，基于损失函数进行训练。
[0003]目前，训练图像分割模型存在以下问题：不仅模型收敛速度慢，训练费时；而且，在前后景样本数量不均衡的场景下，训练的模型效果比较差，漏检率高，无法得到一个性能较佳的模型。

技术实现思路

[0004]考虑到上述问题而提出了本专利技术。本专利技术提供了一种图像分割模型的训练方法、应用于图像分割模型的知识蒸馏方法、电子设备和存储介质。
[0005]根据本专利技术一方面，提供了一种图像分割模型的训练方法。训练方法包括：获取训练样本图像；将训练样本图像输入至图像分割模型中，并基于第三预设损失函数对图像分割模型进行迭代训练；其中，第三预设损失函数包括：在目标类别下的真实样本像素集合和实际预测样本像素集合的多种交集一一对应的多种概率值，每种概率值与对应交集中的像素属于目标类别的真实值和预测值相关，并且每种概率值的预测值在第三预设损失函数中被配置为在第三预设衰减参数的作用下进行非线性衰减。
[0006]示例性地，真实样本像素集合包括真实正样本像素集合和真实负样本像素集合，实际预测样...

【技术保护点】

【技术特征摘要】
1.一种图像分割模型的训练方法，其特征在于，包括：获取训练样本图像；将所述训练样本图像输入至图像分割模型中，并基于第三预设损失函数对所述图像分割模型进行迭代训练；其中，所述第三预设损失函数包括：在目标类别下的真实样本像素集合和实际预测样本像素集合的多种交集一一对应的多种概率值，每种概率值与对应交集中的像素属于所述目标类别的真实值和预测值相关，并且每种概率值的所述预测值在所述第三预设损失函数中被配置为在第三预设衰减参数的作用下进行非线性衰减。2.根据权利要求1所述的方法，其特征在于，所述真实样本像素集合包括真实正样本像素集合和真实负样本像素集合，所述实际预测样本像素集合包括实际预测正样本像素集合和实际预测负样本像素集合，所述多种交集包括第一交集、第二交集和第三交集，其中，所述第一交集为所述目标类别下真实正样本像素集合和实际预测正样本像素集合的交集；所述第二交集为所述目标类别下真实正样本像素集合和实际预测负样本像素集合的交集；所述第三交集为所述目标类别下真实负样本像素集合和实际预测正样本像素集合的交集。3.根据权利要求2所述的方法，其特征在于，所述第二交集和所述第三交集对应的所述概率值具有对应的权重系数，所述第二交集所对应的概率值的权重系数大于所述第三交集所对应的概率值的权重系数。4.根据权利要求1
‑
3任一项所述的方法，其特征在于，所述第三预设损失函数＝1
‑
预设损失系数，所述预设损失系数为交并比函数，所述多种概率值存在于所述交并比函数的分母中。5.根据权利要求4所述的方法，其特征在于，所述第三预设损失函数为dice损失函数。6.根据权利要求1
‑
3任一项所述的方法，其特征在于，所述第三预设损失函数仅与所有训练样本图像所包含的所有类别中用于作为所述目标类别的稀有类相关，或者，所述第三预设损失函数与所有训练样本图像所包含的用于作为所述目标类别的所有类别相关，其中，所述稀有类是指所述训练样本图像所包含的所有类别中标注数量或标注比例小于预设阈值的类别。7.根据权利要求5所述的方法，其特征在于，所述dice损失函数的dice损失系数中的分子和分母均为在概率值的基础上加上平滑项系数，所述平滑项系数不等于0。8.根据权利要求4所述的方法，其特征在于，所述预设损失系数的分母包括TP、αFN、βFP之和，α和β是权重系数；TP＝T
c
*P
cn1
，TP表示在所述目标类别c下所述第一交集中所有像素的真实值T
c
和预测值P
c
的n1次方的乘积并求和；FN＝(1
‑
P
c
)
n2
*T
c
，FN表示在所述目标类别c下所述第二交集中所有像素的真实值T
c
和预测值(1
‑
P
c
)的n2次方的乘积并求和；FP＝P
cn3
*(1
‑
T
c<...

【专利技术属性】
技术研发人员：张共济，孙新，陈燕娟，
申请(专利权)人：苏州镁伽科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人