【技术实现步骤摘要】
一种基于多感受野上下文语义信息的图像语义分割方法
[0001]本专利技术属于图像识别
,具体涉及一种基于多感受野上下文语义信息的图像语义分割方法。
技术介绍
[0002]图像语义分割是图像分析的基础,也是很多应用的基础,例如在自动驾驶系统中的物体识别、无人机应用以及穿戴式设备应用中举足轻重。图像是由像素组成,而“语义分割”顾名思义就是将像素按照图像中表达语义含义的不同进行分组或分割。图像语义分割的目标是将图像的每个像素所属类别进行标注。因此,语义分割是指像素级别的识别图像中的目标组织,即标注出图像中每个像素所属的对象类别。
[0003]在图像分割的发展过程中出现了很多分割方法,例如:基于简单的像素级别的“阈值法”(Thresholding methods)和基于像素聚类的分割方法(Clustering
‑
based segmentation methods),以及“图划分”的分割方法,但是这些分割方法难以满足现在高精度分割性能的要求。随着以全卷积神经网络(Fully convolutional ...
【技术保护点】
【技术特征摘要】
1.一种基于多感受野上下文语义信息的图像语义分割方法,其特征在于,包括以下步骤:步骤一、将输入图像通过卷积操作转换成像素矩阵;步骤二、采用不同扩张率的扩张卷积将同一个像素矩阵转换为多个具有多感受野上下文语义信息的特征图;步骤三、所述具有多感受野上下文语义信息的特征图分别通过不同子网中的转换器编码器进行特征提取和下采样处理,得到多个具有不同感受野的下采样特征图;步骤四、所述下采样特征图通过解码器进行逐步上采样处理,得到相同尺寸和维度的特征图,并生成最终的特征融合图;步骤五、所述特征融合图通过卷积神经网络完成图像分割的预测。2.按照权利要求1所述的一种基于多感受野上下文语义信息的图像语义分割方法,其特征在于,步骤二中所述扩张卷积的输出为:其中,y
i
表示扩张卷积第i个输出,扩张卷积的卷积核大小为k*k,扩张率为r,x
i
为转换器子网络前的扩张卷积的第i个输入特征映射,m为卷积核大小为k*k的滤波器矩阵w[k]的长度。3.按照权利要求1所述的一种基于多感受野上下文语义信息的图像语义分割方法,其特征在于,步骤三中所述转换器包括多头自注意力机制模型和多层感知器模型,所述多头自注意力机制模型和多层感知器模型的输入均进行归一化。4.按照权利要求3所述的一种基于多感受野上下文语义信息的图像语义分割方法,其特征在于,所述多头自注意力机制模型的输出为:Y
out
=concat[y1,y2,...y
i
...y
h
‑1]y
i
=Attentation(qW
iq
,jW
ij
,dW
id
)其中,Y
out
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。