分割模型的训练方法、图像分割方法、装置、设备和介质制造方法及图纸

技术编号：39042679 阅读：14 留言：0更新日期：2023-10-10 11:55

本公开提供了一种分割模型的训练方法，涉及人工智能技术领域，尤其涉及计算机视觉技术领域和深度学习技术领域，可应用于智慧城市场景下。具体实现方案为：将第一样本图像输入第一分割模型，得到第一分割模型的第一中间网络的梯度信息；根据第一中间网络的梯度信息和第一中间网络输出的第一中间特征，得到与第一中间网络对应的第一中间掩码特征；根据至少一个第二中间掩码特征和至少一个第一中间掩码特征，确定第一蒸馏损失，其中，至少一个第二中间掩码特征是根据第二中间网络的梯度信息和第二中间网络输出的至少一个第二中间特征得到的；以及根据第一蒸馏损失，训练第一分割模型。本公开还提供了一种图像分割方法、装置、电子设备和存储介质。设备和存储介质。设备和存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
分割模型的训练方法、图像分割方法、装置、设备和介质

[0001]本公开涉及人工智能
，尤其涉及计算机视觉
和深度学习
，可应用于智慧城市场景下。更具体地，本公开提供了一种分割模型的训练方法、图像分割方法、装置、电子设备和存储介质。

技术介绍

[0002]随着人工智能技术的发展，深度学习模型的应用场景不断增加。可以基于模型蒸馏技术，提升图像分割模型性能。

技术实现思路

[0003]本公开提供了一种分割模型的训练方法、图像分割方法、装置、设备以及存储介质。
[0004]根据本公开的一方面，提供了一种分割模型的训练方法，该方法包括：将第一样本图像输入第一分割模型，得到第一分割模型的第一中间网络的梯度信息；根据第一中间网络的梯度信息和第一中间网络输出的至少一个第一中间特征，得到与第一中间网络对应的至少一个第一中间掩码特征；根据至少一个第二中间掩码特征和至少一个第一中间掩码特征，确定第一蒸馏损失，其中，至少一个第二中间掩码特征与第二分割模型的第二中间网络对应，至少一个第二中间掩码特征是根据第二中间网络的梯度信息和第二中间网络输出的至少一个第二中间特征得到的，第二中间网络的梯度信息是将第二样本图像输入第二分割模型得到的，第二分割模型的参数量大于第一分割模型的参数量；以及根据第一蒸馏损失，训练第一分割模型。
[0005]根据本公开的另一方面，提供了一种图像分割方法，该方法包括：将目标图像输入第一分割模型，得到目标分割结果，其中，目标分割结果包括目标图像中目标实例的目标掩码以及目标实...

【技术保护点】

【技术特征摘要】
1.一种分割模型的训练方法，包括：将第一样本图像输入第一分割模型，得到所述第一分割模型的第一中间网络的梯度信息；根据所述第一中间网络的梯度信息和所述第一中间网络输出的至少一个第一中间特征，得到与所述第一中间网络对应的至少一个第一中间掩码特征；根据至少一个第二中间掩码特征和至少一个所述第一中间掩码特征，确定第一蒸馏损失，其中，至少一个所述第二中间掩码特征与第二分割模型的第二中间网络对应，至少一个所述第二中间掩码特征是根据所述第二中间网络的梯度信息和所述第二中间网络输出的至少一个第二中间特征得到的，所述第二中间网络的梯度信息是将第二样本图像输入所述第二分割模型得到的，所述第二分割模型的参数量大于所述第一分割模型的参数量；以及根据所述第一蒸馏损失，训练所述第一分割模型。2.根据权利要求1所述的方法，其中，所述第一中间网络的梯度信息包括至少一个所述第一中间特征的梯度信息，所述第一中间特征的梯度信息包括所述第一中间特征的多个第一中间特征值各自的梯度，所述根据所述第一中间网络的梯度信息和所述第一中间网络输出的至少一个第一中间特征，得到与所述第一中间网络对应的至少一个第一中间掩码特征包括：根据预设梯度阈值和所述第一中间特征的多个第一中间特征值各自的梯度，得到所述第一中间掩码特征。3.根据权利要求2所述的方法，其中，所述根据预设梯度阈值和所述第一中间特征的多个第一中间特征值各自的梯度，得到第一中间掩码特征包括：针对第一中间特征的多个第一中间特征值，将梯度大于或等于所述预设梯度阈值的所述第一中间特征值替换为第一预设值以及将梯度小于所述预设梯度阈值的所述第一中间特征值替换为第二预设值，得到所述第一中间掩码特征。4.根据权利要求1所述的方法，其中，所述第二中间网络的梯度信息包括至少一个所述第二中间特征的梯度信息，所述第二中间特征的梯度信息包括所述第二中间特征的多个第二中间特征值各自的梯度，所述第二中间掩码特征是根据预设梯度阈值和所述第二中间特征的多个第二中间特征值各自的梯度得到的。5.根据权利要求1所述的方法，其中，所述根据所述第一蒸馏损失，训练所述第一分割模型包括：利用注意力机制处理至少一个所述第一中间掩码特征，得到至少一个第一注意力特征；根据至少一个第二注意力特征和至少一个所述第一注意力特征，确定注意力蒸馏损失，其中，至少一个所述第二注意力特征是利用注意力机制处理至少一个第二中间掩码特征得到的；根据所述第一蒸馏损失和所述注意力蒸馏损失，训练所述第一分割模型。6.根据权利要求1所述的方法，其中，所述根据所述第一蒸馏损失，训练所述第一分割模型包括：对至少一个所述第一中间掩码特征进行归一化处理，得到至少一个第一中间归一化特
征；根据至少一个第二中间归一化特征和至少一个所述第一中间归一化特征，确定第二蒸馏损失，其中，至少一个所述第二中间归一化特征是对至少一个所述第二中间掩码特征进行归一化处理得到的；根据所述第一蒸馏损失和所述第二蒸馏损失，训练所述第一分割模型。7.根据权利要求1所述的方法，其中，所述第一分割模型还包括第一输出网络，所述将第一样本图像输入第一分割模型还包括：将所述第一样本图像输入所述第一分割模型，得到所述第一输出网络输出的第一分割特征。8.根据权利要求6所述的方法，其中，所述第二分割模型还包括第二输出网络，所述根据第一蒸馏损失，训练第一分割模型包括：根据第二分割特征和所述第一分割特征，确定第三蒸馏损失，其中，所述第二分割特征与所述第二输出网络对应，所述第二分割特征是将所述第二样本图像输入所述第二分割模型得到的；根据所述第一蒸馏损失和所述第三蒸馏损失，训练所述第一分割模型。9.根据权利要求1所述的方法，其中，所述第一分割模型还包括第一输出网络，所述将第一样本图像输入第一分割模型还包括：将所述第一样本图像输入所述第一分割模型，得到所述第一输出网络输出的第一实例特征和第一类别特征，其中，所述第一实例特征用于指示所述第一样本图像中的第一样本像素是否属于一个样本实例，所述第一类别特征用于指示所述第一样本图像中至少一个样本实例的类别。10.根据权利要求8所述的方法，其中，所述根据第一蒸馏损失，训练所述第一分割模型包括：根据所述第一实例特征和所述第一类别特征，确定第一通道维度特征；根据第二通道维度特征和所述第一通道维度特征，确定通道维度蒸馏损失，其中，所述第二通道维度特征是根据所述第二实例特征和所述第二类别特征确定的，所述第二实例特征和所述第二类别特征是将所述第二样本图像输入所述第二分割模型得到的；以及根据所述第一蒸馏损失和所述通道维度蒸馏损失，训练所述第一分割模型。11.根据权利要求1所述的方法，其中，所述根据第一蒸馏损失，训练所述第一分割模型包括：根据所述第一分割模型输出的第一分割结果和所述第一样本图像的第一标签，确定分割损失；根据所述第一蒸馏损失和所述分割损失，训练所述第一分割模型。12.根据权利要求1所述的方法，其中，所述第一分割模型为第一实例分割模型，所述第二分割模型为第二实例分割模型。13.一种图像分割方法，包括：将目标图像输入第一分割模型，得到目标分割结果，其中，所述目标分割结果包括所述目标图像中目标实例的目标掩码以及所述目标实例的类别，所述第一分割模型是利用如权利要求1至11任一项所述的方法训练的。
14.一种分割模型的训练装置，包括：第一获得模块，用于将第一样本图像输入第一分割模型，得到所述第一分割模型的第一中间网络的梯度信息；第二获得模块，用于根据所述第一中间网络的梯度信息和所述第一中间网络输出的至少一个第一中间特征，得到与所述第一中间网络对应的至少一个第一中间掩码特...

【专利技术属性】
技术研发人员：沈智勇，赵一麟，陆勤，龚建，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人