图像语义分割方法、装置、计算机可读存储介质和芯片制造方法及图纸

技术编号：27746121 阅读：19 留言：0更新日期：2021-03-19 13:40

本申请提供了图像语义分割方法、计算机可读存储介质和芯片。涉及人工智能领域，具体涉及计算机视觉领域。该方法包括：对待处理图像进行卷积处理，得到待处理图像的初始特征图；对初始特征图进行多尺度特征提取，确定第一特征图，其中，第一特征图包括初始特征图的多尺度语义信息；对第一特征图进行卷积处理，得到待处理图像的目标特征图；根据目标特征图确定待处理图像的语义分割图。本申请能够提高语义分割的预测精度。

全部详细技术资料下载

【技术实现步骤摘要】
图像语义分割方法、装置、计算机可读存储介质和芯片
本申请实施例涉及计算机视觉领域，尤其涉及一种图像语义分割方法、装置、计算机可读存储介质和芯片。
技术介绍
计算机视觉是各个应用领域，如制造业、检验、文档分析、医疗诊断，和军事等领域中各种智能/自主系统中不可分割的一部分，它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的，被拍摄对象的数据与信息的学问。形象地说，就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等，从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息，所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说，计算机视觉就是用各种成像系统代替视觉器官获取输入信息，再由计算机来代替大脑对这些输入信息完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界，具有自主适应环境的能力。在计算机视觉领域中，语义分割(semanticsegmentation)是一个很重要的研究方向，语义分割为场景理解提供了比较高层级的信息，语意分割是对图像中的每一个像素进行分类，在很多领域和场景中都有重要的应用。例如，自动驾驶系统，人机交互系统，移动设备的摄影，图像搜索引擎以及增强现实应用。传统方案在进行语义分割时，存在预测精度不高的问题。例如，传统方案可以先获取小尺寸的特征向量，然后再经过上采样后再继续提取特征。这种方式能够在高分辨率的条件下进一步提取特征，当整个模型深度增加时，能够得到更高层次的...

【技术保护点】
1.一种图像语义分割方法，其特征在于，包括：/n获取待处理图像；/n对所述待处理图像进行卷积处理，以得到所述待处理图像的初始特征图；/n对所述初始特征图进行多尺度特征提取，以得到第一特征图，其中，所述第一特征图包括所述初始特征图的多尺度语义信息；/n对所述第一特征图进行卷积处理，以得到所述待处理图像的目标特征图；/n根据所述目标特征图确定所述待处理图像的语义分割图。/n

【技术特征摘要】
1.一种图像语义分割方法，其特征在于，包括：
获取待处理图像；
对所述待处理图像进行卷积处理，以得到所述待处理图像的初始特征图；
对所述初始特征图进行多尺度特征提取，以得到第一特征图，其中，所述第一特征图包括所述初始特征图的多尺度语义信息；
对所述第一特征图进行卷积处理，以得到所述待处理图像的目标特征图；
根据所述目标特征图确定所述待处理图像的语义分割图。

2.如权利要求1所述的方法，其特征在于，在对所述初始特征图进行多尺度特征提取之前，所述方法还包括：
对所述初始特征图进行降维处理，以得到降维处理后的特征图；
对所述初始特征图进行多尺度特征提取，以得到第一特征图包括：
对所述降维处理后的特征图进行多尺度特征提取，以得到所述第一特征图。

3.如权利要求2所述的方法，其特征在于，所述对所述降维处理后的特征图进行多尺度特征提取，以得到所述第一特征图，包括：
对所述降维处理后的特征图分别进行多次不同采样率的池化处理，以得到多个尺度的特征图；
对所述多个尺度的特征图分别进行上采样处理，以得到上采样处理后的多个特征图；
将所述上采样处理后的多个特征图与所述初始特征图进行特征融合，以得到所述第一特征图。

4.如权利要求1至3中任一项所述的方法，其特征在于，对所述第一特征图进行卷积处理，包括：
对所述第一特征图进行尺寸调整，以得到第二特征图，所述第二特征图的尺寸大于所述第一特征图的尺寸；
对所述第二特征图进行卷积处理，以得到所述待处理图像的目标特征图。

5.如权利要求4所述的方法，其特征在于，所述初始特征图包括至少两个尺寸不同的特征图，所述对所述第二特征图进行卷积处理，以得到所述待处理图像的目标特征图，包括：
将所述初始特征图中与所述第二特征图的尺寸大小相同的特征图和所述第二特征图进行特征融合，以得到第三特征图；
对所述第三特征图进行卷积处理，以得到所述待处理图像的目标特征图。

6.权利要求5所述的方法，其特征在于，所述对所述第三特征图进行卷积处理，以得到所述待处理图像的目标特征图，包括：
通过m个卷积层对所述第三特征图进行卷积处理，以得到从第m个卷积层输出的特征图，其中，所述m个卷积层中的第i个卷积层的输入为第i-1个卷积层输出的特征图，以及与所述初始特征图中与所述第i-1个卷积层输出的特征图的尺寸大小相同的特征图，m为大于1的整数，1<i≤m，i为整数；
根据从第m个卷积层输出的特征图确定所述待处理图像的目标特征图。

7.如权利要求6所述的方法，其特征在于，所述根据第m个卷积层输出的特征图确定所述待处理图像的目标特征图，包括：
对从第m个卷积层输出的特征图进行多尺度特征提取，以得到第四特征图，所述第四特征图包括所述第m个卷积层输出的特征图的多尺度语义信息；
根据所述第四特征图确定所述目标特征图。

8.如权利要求7所述的方法，其特征在于，所述根据所述目标特征图确定所述待处理图像的语义分割图，包括：
对所述第四特征图和所述m个卷积层中的至少一个卷积层输出的特征图分别进行上采样处理，以得到至少两个尺寸相同的特征图；
对所述至少两个尺寸相同的特征图进行特征融合处理，以得到所述目标特征图；
根据所述目标特征图确定所述待处理图像的语义分割图。

9.如权利要求1至8中任一项所述的方法，其特征在于，所述待处理图像包括所述待处理的亮度值信息和惯性测量单元IMU信息。

10.如权利要求9所述的方法，其特征在于，所述获取待处理图像包括：
将所述IMU信息进行尺寸调整，尺寸调整后的IMU信息的尺寸与所述待处理图像的尺寸相同；
将所述尺寸调整后的IMU信息与所述待处理图像的亮度值信息进行特征通道拼接。

11.一种图像语义分割装置，其特征在于，包括：

【专利技术属性】
技术研发人员：冯文森，黄杨，廖晶堂，袁超，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人