语义分割及网络训练方法和装置、设备、介质、程序制造方法及图纸

技术编号：18445612 阅读：30 留言：0更新日期：2018-07-14 10:39

本公开实施例公开了一种语义分割及网络训练方法和装置、设备、介质、程序，其中方法包括：对图像进行处理，获得所述图像对应的至少一个第一图像特征，和全局语义信息；基于所述全局语义信息和所述第一图像特征，得到第二图像特征；基于所述第二图像特征，获得所述图像的语义分割结果。本公开上述实施例，获得的图像语义分割结果，能够基于全局语义信息得到图像的语义分割结果，从而有利于提高语义分割性能。

Semantic segmentation and network training method and device, equipment, medium, and program

The present disclosure embodiment discloses a semantic segmentation and network training method and device, device, medium, and program. The method includes: processing the image, obtaining at least one first image feature corresponding to the image, and global semantic information; based on the global semantic information and the first image features, To second image features; based on the second image features, the semantic segmentation result of the image is obtained. The results of the image semantic segmentation obtained by the present example can obtain the semantic segmentation results of the image based on the global semantic information, thus improving the performance of the semantic segmentation.

全部详细技术资料下载

【技术实现步骤摘要】
语义分割及网络训练方法和装置、设备、介质、程序
本公开涉及计算机视觉技术，尤其是一种语义分割及网络训练方法和装置、设备、介质、程序。
技术介绍
场景分析(Sceneparsing)是基于语义分割，对描述场景的图像中的每一个像素赋予一个类别，并对不同的类别标注不同的颜色。场景分析是目标识别、图像检索、视频标注等的基础，在复杂场景中如果能够更好的利用场景分析对于场景理解的像素级理解非常关键，近年来已成为计算机视觉领域的研究热点。
技术实现思路
本公开实施例提供的一种语义分割技术。根据本公开实施例的一个方面，提供的一种语义分割方法，包括：对图像进行处理，得到所述图像的第一图像特征和所述图像的全局语义信息；基于所述全局语义信息和所述第一图像特征，得到第二图像特征；基于所述第二图像特征，获得所述图像的语义分割结果。在基于本专利技术上述方法的另一个实施例中，所述全局语义信息包括与至少一个语义类别对应的至少一个缩放因子向量。在基于本专利技术上述方法的另一个实施例中，所述基于所述全局语义信息和所述第一图像特征，得到第二图像特征，包括：对所述全局语义信息和所述第一图像特征进行卷积处理，得到第二图像特征。在基于本专利技术上述方法的另一个实施例中，所述对图像进行处理，得到所述图像的第一图像特征，包括：对所述图像进行卷积处理，得到所述图像的第一图像特征。在基于本专利技术上述方法的另一个实施例中，所述对图像进行处理，得到所述图像的全局语义信息，包括：基于所述第一图像特征，得到所述全局语义信息。在基于本专利技术上述方法的另一个实施例中，所述基于所述第一图像特征，得到所述全局语义信息，包括...

【技术保护点】
1.一种语义分割方法，其特征在于，包括：对图像进行处理，得到所述图像的第一图像特征和所述图像的全局语义信息；基于所述全局语义信息和所述第一图像特征，得到第二图像特征；基于所述第二图像特征，获得所述图像的语义分割结果。

【技术特征摘要】
1.一种语义分割方法，其特征在于，包括：对图像进行处理，得到所述图像的第一图像特征和所述图像的全局语义信息；基于所述全局语义信息和所述第一图像特征，得到第二图像特征；基于所述第二图像特征，获得所述图像的语义分割结果。2.根据权利要求1所述的方法，其特征在于，所述全局语义信息包括与至少一个语义类别对应的至少一个缩放因子向量。3.根据权利要求1或2所述的方法，其特征在于，所述基于所述全局语义信息和所述第一图像特征，得到第二图像特征，包括：对所述全局语义信息和所述第一图像特征进行卷积处理，得到第二图像特征。4.一种语义分割网络的训练方法，其特征在于，包括：利用语义分割网络对样本图像进行处理，获得所述样本图像的第一语义分割预测结果；利用语义编码损失网络，获得所述样本图像的第二语义分割预测结果，其中，所述语义编码损失网络包括编码层；基于所述第一语义分割预测结果、第二语义分割预测结果和所述样本图像的标注语义分割信息，训练所述语义分割网络。5.一种语义分割装置，其特征在于，包括：第一处理单元，用于对图像进行处理，得到所述图像的第一图像特征和所述图像的全局语义信息；第二处理单元，用于基于所述全局语义信息和所述第一图像特征，得到第二图像特征；分割单元，用于基于所述第二图像特征，获得所述图像的语义分割结果。...

【专利技术属性】
技术研发人员：石建萍，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人