语义分割模型训练方法及装置、图像语义分割方法及装置制造方法及图纸

技术编号：27061248 阅读：9 留言：0更新日期：2021-01-15 14:41

本公开提供了一种语义分割模型训练方法、图像语义分割方法、语义分割模型训练装置、图像语义分割装置、电子设备和计算机可读存储介质，其中语义分割模型训练方法包括：获取训练集，训练集包括图像以及对应的标注信息；将图像进行特征提取，得到图像的特征数据；基于特征数据，得到第一分割框信息以及第一语义分割信息；基于特征数据、第一分割框信息以及第一语义分割信息，得到图像的第二分割框信息以及第二语义分割信息；基于第二分割框信息与标注信息、和/或基于第二语义分割信息与标注信息，确定损失值；基于损失值，调整语义分割模型的参数。语义分割模型训练方法能够方便获取训练数据，从而通过大量的、高质量的数据能够提高训练效果。

全部详细技术资料下载

【技术实现步骤摘要】
语义分割模型训练方法及装置、图像语义分割方法及装置
本公开一般地涉及图像处理领域，具体涉及一种语义分割模型训练方法、图像语义分割方法、语义分割模型训练装置、图像语义分割装置、电子设备和计算机可读存储介质。
技术介绍
在图像处理领域中，在一些应用场景下，需要对图像中的某些图像进行目标识别、或需要对图像中存在的文本进行文本识别，或者需要对图像中的一些内容进行替换等。在很多情况下需要对图像中的一些目标内容进行语义分割，图像的语义分割是对图像在像素级别上的分类，通过语义分割模型将图像中的属于同类的目标内容分为一类，例如图像中的存在一车辆，判断属于该车辆的像素并将全部属于该车辆的像素分割出来，确定该车辆在像素级别的边界分割框。目标内容可以是特定的人物、物体或文字等，将目标内容在图像确定像素级别的边界并进行分割。而目前语义分割的准确性差，尤其在自然场景图像中，训练数据少、训练成本高，训练出的语义分割模型准确率低。
技术实现思路
为了解决现有技术中存在的上述问题，本公开的第一方面提供一种语义分割模型训练方法，其中，所述方法包括：获取训练集，其中，所述训练集包括多个图像、以及所述图像对应的标注信息，任一图像对应的标注信息包括分割框标注和/或语义分割标注；将所述图像进行特征提取，得到所述图像的特征数据；基于所述特征数据，得到第一分割框信息以及第一语义分割信息；基于所述特征数据、所述第一分割框信息以及所述第一语义分割信息，得到所述图像的第二分割框信息以及第二语义分割信息；基于所述第二分割框信息与所述标注信息、和/或基...

【技术保护点】
1.一种语义分割模型训练方法，其中，所述方法包括：/n获取训练集，其中，所述训练集包括多个图像、以及所述图像对应的标注信息，任一图像对应的标注信息包括分割框标注和/或语义分割标注；/n将所述图像进行特征提取，得到所述图像的特征数据；/n基于所述特征数据，得到第一分割框信息以及第一语义分割信息；/n基于所述特征数据、所述第一分割框信息以及所述第一语义分割信息，得到所述图像的第二分割框信息以及第二语义分割信息；/n基于所述第二分割框信息与所述标注信息、和/或基于所述第二语义分割信息与所述标注信息，确定损失值；/n基于所述损失值，调整所述语义分割模型的参数。/n

【技术特征摘要】
1.一种语义分割模型训练方法，其中，所述方法包括：
获取训练集，其中，所述训练集包括多个图像、以及所述图像对应的标注信息，任一图像对应的标注信息包括分割框标注和/或语义分割标注；
将所述图像进行特征提取，得到所述图像的特征数据；
基于所述特征数据，得到第一分割框信息以及第一语义分割信息；
基于所述特征数据、所述第一分割框信息以及所述第一语义分割信息，得到所述图像的第二分割框信息以及第二语义分割信息；
基于所述第二分割框信息与所述标注信息、和/或基于所述第二语义分割信息与所述标注信息，确定损失值；
基于所述损失值，调整所述语义分割模型的参数。

2.根据权利要求1所述的语义分割模型训练方法，其中，所述语义分割模型包括：分割框解码单元以及语义解码单元；
所述基于所述特征数据，得到第一分割框信息以及第一语义分割信息，包括：
基于所述特征数据，通过所述分割框解码单元进行解码，得到所述第一分割框信息；
基于所述特征数据，通过所述语义解码单元进行解码，得到所述第一语义分割信息。

3.根据权利要求2所述的语义分割模型训练方法，其中，所述基于所述特征数据、所述第一分割框信息以及所述第一语义分割信息，得到所述图像的第二分割框信息以及第二语义分割信息，包括：
基于所述特征数据以及所述第一语义分割信息，通过所述分割框解码单元进行解码，得到所述第二分割框信息；
基于所述特征数据以及所述第一分割框信息，通过所述语义解码单元进行解码，得到所述第二语义分割信息。

4.根据权利要求1所述的语义分割模型训练方法，其中，所述语义分割模型还包括：编码单元；
所述将所述图像进行特征提取，得到所述图像的特征数据，包括：
基于所述图像，通过所述编码单元进行编码，得到所述图像的特征数据。

5.根据权利要求1-4任一项所述的语义分割模型训练方法，其中，所述损失值包括第一损失值；
所述基于所述第二分割框信息与所述标注信息、和/或基于所述第二语义分割信息与所述标注信息，确定损失值，包括：
若所述图像对应的标注信息仅包括所述分割框标注，则基于所述分割框标注以及所述第二分割框信息，确定所述第一损失值；
若所述图像对应的标注信息仅包括所述语义分割标注，则基于所述语义分割标注以及所述第二语义分割信息，确定所述第一损失值；
若所述图像对应的标注信息包括所述分割框标注和所述语义分割标注，则基于所述分割框标注以及所述第二分割框信息、且基于所述语义分割标注以及所述第二语义分割信息，确定所述第一损失值。

6.根据权利要求5所述的语义分割模型训练方法，其中，所述损失值包括第二损失值；
所述基于所述第二分割框信息与所述标注信息、和/或基于所述第二语义分割信息与所述标注信息，确定损失值，包括：
若所述图像对应的标注信息包括所述分割框标注，则基于所述第二语义分割信息以及所述分割框标注，确定所述第二损失值；
若所述图像对应的标注信息不包括所述分割框标注，则基于所述第二语义分割信息以及所述第二分割框信息，确定所述第二损失值。

7.根据权利要求5所述的...

【专利技术属性】
技术研发人员：赵姗，王氚，刘帅成，
申请(专利权)人：北京迈格威科技有限公司，成都旷视金智科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人