图像的语义分割方法、装置、电子设备及介质制造方法及图纸

技术编号：26419660 阅读：19 留言：0更新日期：2020-11-20 14:15

本申请公开了一种图像的语义分割方法、装置、电子设备及介质，涉及计算机视觉、深度学习、云计算技术领域。具体实现方案为：通过对输入图像进行特征提取，以生成多个不同粒度的图特征，进而分别对多个不同粒度的图特征进行图非局部处理，以生成多个不同粒度的增强图特征，大量的冗余计算被缩减，极大地减少了计算的复杂度，进一步地，对多个不同粒度的增强图特征进行交叉图非局部处理，以生成多个粒度的上下文推理信息，根据多个粒度的上下文推理信息生成级联上下文推理信息，进而根据级联上下文推理信息对图像进行语义分割，有效地提升了基于深度学习的语义分割系统的特征学习能力和分割精度。

全部详细技术资料下载

【技术实现步骤摘要】
图像的语义分割方法、装置、电子设备及介质
本申请涉及图像处理
，具体涉及计算机视觉、深度学习、云计算
，尤其涉及一种图像的语义分割方法、装置、电子设备及介质。
技术介绍
目前，计算机视觉与机器学习研究者对图像语义分割问题越来越感兴趣，越来越多的应用场景需要精确且高效的分割技术，如自动驾驶、室内导航、甚至虚拟现实与增强现实等。相关技术中，图像语义分割系统大都采用上下文建模的方法进行语义分割，例如，利用条件随机场(ConditionalRandomFields)、多维LSTM(multi-dimensionalLongShort-TermMemory)、膨胀卷积(DilatedConv)和特征金字塔池化(Pyramidpooling)来捕捉上下文依赖，在坐标系空间中利用非局部模块(Non-localBlock)来建模上下文依赖。但是，现有的语义分割方法存在计算复杂度大、语义分割性能低等缺点。
技术实现思路
本申请提供了一种图像的语义分割方法、装置、电子设备以及介质。本申请第一方面实施例提供了一种图像的语义分割方法，包括：对输入图像进行特征提取，以生成多个不同粒度的图特征；分别对所述多个不同粒度的图特征进行图非局部处理，以生成多个不同粒度的增强图特征；对所述多个不同粒度的增强图特征进行通过交叉图非局部处理，以生成多个粒度的上下文推理信息；根据所述多个粒度的上下文推理信息生成级联上下文推理信息；以及根据所述级联上下文推理信息对所述...

【技术保护点】
1.一种图像的语义分割方法，包括：/n对输入图像进行特征提取，以生成多个不同粒度的图特征；/n分别对所述多个不同粒度的图特征进行图非局部处理，以生成多个不同粒度的增强图特征；/n对所述多个不同粒度的增强图特征进行交叉图非局部处理，以生成多个粒度的上下文推理信息；/n根据所述多个粒度的上下文推理信息生成级联上下文推理信息；以及/n根据所述级联上下文推理信息对所述输入图像进行语义分割，以得到图像的分割结果。/n

【技术特征摘要】
1.一种图像的语义分割方法，包括：
对输入图像进行特征提取，以生成多个不同粒度的图特征；
分别对所述多个不同粒度的图特征进行图非局部处理，以生成多个不同粒度的增强图特征；
对所述多个不同粒度的增强图特征进行交叉图非局部处理，以生成多个粒度的上下文推理信息；
根据所述多个粒度的上下文推理信息生成级联上下文推理信息；以及
根据所述级联上下文推理信息对所述输入图像进行语义分割，以得到图像的分割结果。

2.如权利要求1所述的图像的语义分割方法，其中，所述分别对所述多个不同粒度的图特征进行图非局部处理，以生成多个不同粒度的增强图特征，包括：
对所述多个不同粒度的图特征分别进行图投影，以生成多个投影图特征；
对所述多个投影图特征进行图非局部操作，以生成增强的图表示；
对所述增强的图表示进行全局图推理，以生成演进的图表示；
根据所述演进的图表示和分配矩阵对像素级的所述图特征进行增强，以生成所述增强图特征。

3.如权利要求2所述的图像的语义分割方法，其中，所述多个投影图特征包括第一投影图特征、第二投影图特征和第三投影图特征，所述对所述多个投影图特征进行图非局部操作，以生成增强的图表示，包括：
根据所述第一投影图特征和所述第二投影图特征生成图注意力矩阵；
根据所述图注意力矩阵和所述第三投影图特征生成所述增强的图表示。

4.如权利要求2所述的图像的语义分割方法，其中，所述对所述增强的图表示进行全局图推理，以生成演进的图表示，包括：
根据所述增强的图表示生成邻接矩阵；
根据所述增强的图表示和所述邻接矩阵生成所述演进的图表示。

5.如权利要求2所述的图像的语义分割方法，其中，所述根据所述演进的图表示和分配矩阵对像素级的所述图特征进行增强，以生成所述增强图特征，包括：
根据所述演进的图表示和所述分配矩阵生成增强特征；
在所述图特征之上增加所述增强特征以生成所述增强图特征。

6.如权利要求1所述的图像的语义分割方法，其中，所述对所述多个不同粒度的增强图特征进行交叉图非局部处理，以生成多个粒度的上下文推理信息，包括：
获取所述多个不同粒度的增强图特征之中的第一增强图特征和第二增强图特征；
根据所述第一增强图特征和所述第二增强图特征，生成第一注意力矩阵和第二注意力矩阵，其中，所述第一注意力矩阵为所述第一增强图特征至所述第二增强图特征的注意力矩阵，所述第二注意力矩阵为所述第二增强图特征至所述第一增强图特征的注意力矩阵；
根据所述第一增强图特征和所述第二注意力矩阵生成第一注意力融合特征，并根据所述第二增强图特征和所述第一注意力矩阵生成第二注意力融合特征；
根据所述第一注意力融合特征和所述第二注意力融合特征生成所述上下文推理信息。

7.一种图像的语义分割装置，包括：
提取模块，用于对输入图像进行特征提取，以生成多个不同粒度的图特征；
第一处理模块，用于分别对所述...

【专利技术属性】
技术研发人员：伍天意，郭国栋，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人