一种图像的语义分割方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38927912 阅读：8 留言：0更新日期：2023-09-25 09:34

本公开实施例公开了一种图像的语义分割方法、装置、电子设备及存储介质，该方法包括：将待分割图像输入学生模型；学生模型根据第一教师模型和第二教师模型提供的监督信息训练得到，其中第一教师模型的深度大于学生模型的深度和第二教师模型的深度，第二教师模型的宽度大于学生模型的宽度和第一教师模型的宽度；基于学生模型输出待分割图像的语义分割结果。通过利用更深、更宽的两个教师模型，为轻量化的学生模型提供不同方面的监督信息，能够实现从两个复杂模型到简单模型的知识蒸馏，可以保证基于监督信息训练的学生模型具有较佳的语义分割效果。并且，轻量化的学生模型可以大大减少资源耗费，有利于资源受限设备上的模型部署。署。署。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像的语义分割方法、装置、电子设备及存储介质

[0001]本公开实施例涉及计算机
，尤其涉及一种图像的语义分割方法、装置、电子设备及存储介质。

技术介绍

[0002]图像语义分割技术是以语义属性作为划分标准实现逐像素分类预测的技术。
[0003]现有技术中，为保证语义分割效果，语义分割模型的深度、宽度通常较大。其中，模型的深度可以认为是模型的网络层数，模型的宽度可以认为是每层网络中的通道数。
[0004]现有技术的不足之处至少包括：应用大体量的语义分割模型需要以大量的资源作为代价，例如需要消耗大量计算资源和部署空间资源等。这对将语义分割模型部署至资源受限的设备带来巨大挑战。

技术实现思路

[0005]本公开实施例提供了一种图像的语义分割方法、装置、电子设备及存储介质，能够在保证语义分割效果的基础上，采用轻量化模型实现图像语义分割，大大减少了资源耗费，有利于资源受限设备上的模型部署。
[0006]第一方面，本公开实施例提供了一种图像的语义分割方法，包括：
[0007]将待分割图像输入学生模型；所述学生模型根据第一教师模型和第二教师模型提供的监督信息训练得到，其中所述第一教师模型的深度大于所述学生模型的深度和所述第二教师模型的深度，所述第二教师模型的宽度大于所述学生模型的宽度和所述第一教师模型的宽度；
[0008]基于所述学生模型输出所述待分割图像的语义分割结果。
[0009]第二方面，本公开实施例还提供了一种图像的语义分割装置，包括：
[...

【技术保护点】

【技术特征摘要】
1.一种图像的语义分割方法，其特征在于，包括：将待分割图像输入学生模型；所述学生模型根据第一教师模型和第二教师模型提供的监督信息训练得到，其中所述第一教师模型的深度大于所述学生模型的深度和所述第二教师模型的深度，所述第二教师模型的宽度大于所述学生模型的宽度和所述第一教师模型的宽度；基于所述学生模型输出所述待分割图像的语义分割结果。2.根据权利要求1所述的方法，其特征在于，所述学生模型根据下述步骤训练得到：基于所述第一教师模型、所述第二教师模型和所述学生模型，分别输出样本图像的第一分割结果、第二分割结果和第三分割结果；根据所述第一分割结果、第二分割结果和第三分割结果确定学生模型的全局语义损失，局部特征损失和一致性损失；将所述全局语义损失、所述局部特征损失和所述一致性损失作为监督信息，训练所述学生模型。3.根据权利要求2所述的方法，其特征在于，所述根据所述第一分割结果、第二分割结果和第三分割结果确定学生模型的全局语义损失，局部特征损失和一致性损失，包括：根据所述第三分割结果与所述第一分割结果的差异，确定所述学生模型的全局语义损失；根据所述学生模型确定的用于生成所述第三分割结果的特征图像，与所述第二教师模型确定的用于生成所述第二分割结果的特征图像之间的差异，确定所述学生模型的局部特征损失；根据所述第三分割结果分别与所述第一分割结果和所述第二分割结果的差异，确定所述学生模型的一致性损失。4.根据权利要求3所述的方法，其特征在于，所述全局语义损失根据下述步骤确定：将所述第一分割结果和所述第三分割结果进行逐通道池化，分别得到第一全局向量和第二全局向量；将所述第一全局向量和所述第二全局向量间各维度的差值之和，作为所述学生模型的全局语义损失。5.根据权利要求3所述的方法，其特征在于，所述局部特征损失根据下述步骤确定：将所述第二教师模型确定的特征图像和所述学生模型确定的特征图像进行逐通道、逐像素求取特征差值，并根据各所述特征差值确定局部特征损失。6.根据权利要求3所述的方法，其特征在于，所述一致性损失根据下述步骤确定：将所述第三分割结果分别与所述第一分割结果和所述第二分割...

【专利技术属性】
技术研发人员：吴捷，覃杰，肖学锋，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人