【技术实现步骤摘要】
基于多尺度融合的图像语义分割方法及相关组件
[0001]本申请涉及图像处理
,特别涉及一种基于多尺度融合的图像语义分割方法;还涉及一种基于多尺度融合的图像语义分割装置
、
设备以及计算机可读存储介质
。
技术介绍
[0002]语义分割算法主要基于编解码的架构进行设计,在编码器阶段,图像经过一系列卷积和池化操作变成富含高层语义信息的特征图;在解码器阶段,特征图逐步上采样产生与输入图像相等尺寸的预测结果
。
由于这种编解码的方式需要频繁下采样和上采样,会导致大量关键信息的丢失
。
[0003]为了克服上述问题,当前主流的解决办案是使用不同尺度之间信息融合的方法
。
由于底层特征使得模型能够看到很多图像的纹理细节,对于图像的某一小块来说可能十分精准,但是模型看不见整个对象;高层信息虽然使模型能够看到整个对象,但是下采样次数太多,边缘细节等信息变得模糊
。
因此,通过结合各个尺度特征信息对于上述问题的解决十分重要
。
例如, ...
【技术保护点】
【技术特征摘要】
1.
一种基于多尺度融合的图像语义分割方法,其特征在于,包括:对原始图像进行不同倍数的下采样,得到
N
层特征图;自下向上为第一层至第
N
层;融合第
N
层的所述特征图与第
N
‑1层的所述特征图,得到第一个融合特征图;融合第
N
‑
i
层的所述特征图
、
第
N
‑
(i+1)
层的所述特征图以及第
i
个所述融合特征图,得到第
i+1
个所述融合特征图;
i
依次取值1至
m
;所述
m
小于等于
N
‑2;对各个所述融合特征图进行处理,并将处理结果还原为所述原始图像的大小,得到图像语义分割结果
。2.
根据权利要求1所述的图像语义分割方法,其特征在于,所述对原始图像进行不同倍数的下采样,得到
N
层特征图包括:对所述原始图像进行2倍
、4
倍
、8
倍
、16
倍以及
32
倍的下采样,得到五层所述特征图
。3.
根据权利要求2所述的图像语义分割方法,其特征在于,所述融合第
N
层的所述特征图与第
N
‑1层的所述特征图,得到第一个融合特征图;融合第
N
‑
i
层的所述特征图
、
第
N
‑
(i+1)
层的所述特征图以及第
i
个所述融合特征图,得到第
i+1
个所述融合特征图包括:融合第五层的所述特征图与第四层的所述特征图,得到第一个所述融合特征图;融合第四层的所述特征图
、
第三层的所述特征图以及第一个所述融合特征图,得到第二个所述融合特征图;融合第三层的所述特征图
、
第二层的所述特征图以及第二个所述融合特征图,得到第三个所述融合特征图
。4.
根据权利要求1所述的图像语义分割方法,其特征在于,所述对各个所述融合特征图进行处理包括:通过注意力模块对第一个所述融合特征图进行特征提取,得到第一个特征提取结果;将第
j+1
个所述融合特征图与第
j
个所述特征提取结果相加,并通过所述注意力模块对相加结果进行特征提取,得到第
j+1
个所述特征提取结果;
j
依次取值1至
m
‑1;将第
m+1
个所述融合特征图与第
m
个所述特征提取结果相加
【专利技术属性】
技术研发人员:邹磊,韩雪超,卢天华,倪军,
申请(专利权)人:杭州安脉盛智能技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。