基于密集连接和交叉融合的图像语义实时分割方法技术

技术编号：38194133 阅读：10 留言：0更新日期：2023-07-20 21:14

本发明专利技术涉及一种基于密集连接和交叉融合的图像语义实时分割方法，属于图像语义分割技术领域，包括以下步骤：S1：构建通道交流瓶颈残差单元CBRU，在下采样的同时，补充空间信息和上下文信息；S2：构建密集连接的通道交流瓶颈残差模块DCBR，在CBRU单元间使用元素加密集连接的方法，在各个阶段对深层次语义信息和低层次细节信息进行融合；S3：构建多分辨率交叉融合模块MCFM，将浅层空间信息和深层语义信息相融合；S4：基于步骤S1

全部详细技术资料下载

【技术实现步骤摘要】
基于密集连接和交叉融合的图像语义实时分割方法

[0001]本专利技术属于图像语义分割
，涉及一种基于密集连接和交叉融合的图像语义实时分割方法。

技术介绍

[0002]传统的语义分割算法包括阈值分割、聚类、基于边缘分割、基于图分割和基于区域分割算法等。但以上传统的图像语义分割算法只能运用于简单的分割场景，不能满足自动驾驶场景需求，其对图像的特征描述不够深入，难以区分城市街景中的不同目标类。但在深度学习被应用于图像语义分割之前，传统的图像语义分割算法对简单场景具有积极影响。
[0003]自卷积神经网络提出以来，基于深度学习的语义分割方法在预测精度上不断提高，但依旧由于参数量和计算量过大而无法用于简单的移动设备资源上。直至ENet的出现，实时分割网络算法模型开始展现。
[0004]随着自动驾驶领域的不断发展，对实时性语义分割网络的需求在不断提高。目前，有很多技术减轻了网络模型的沉重，轻量级模型也不断涌现。ESNet遵循对称的编码器
‑
解码器架构，提出一个并行分解卷积单元模块，具有多分支并行卷积、多分支空洞卷积和逐点卷积。ESNet体系结构的对称性降低了网络的复杂性，从而减少了推理时间。并行分解卷积单元模块以一种强大的方式学习非并行特征表示，而不增加计算复杂度。ShelfNet18由多个编码器
‑
解码器分支组成，使用了共享权重和残差块。为了减少推理时间，ShelfNet18提出了信道缩减策略，有效地减少了计算成本。不同编码器
‑
解码器分支的使用改善了...

【技术保护点】

【技术特征摘要】
1.一种基于密集连接和交叉融合的图像语义实时分割方法，其特征在于：包括以下步骤：S1：构建通道交流瓶颈残差单元CBRU，在下采样的同时，补充空间信息和上下文信息；S2：构建密集连接的通道交流瓶颈残差模块DCBR，在CBRU单元间使用元素加密集连接的方法，在各个阶段对深层次语义信息和低层次细节信息进行融合；S3：构建多分辨率交叉融合模块MCFM，将浅层空间信息和深层语义信息相融合；S4：基于步骤S1
‑
S3构建的模块，构建基于密集连接和交叉融合的实时分割网络DCCFNet，对图像语义进行实时分割。2.根据权利要求1所述的基于密集连接和交叉融合的图像语义实时分割方法，其特征在于：所述通道交流瓶颈残差单元CBRU在开头使用3
×
3卷积，将通道数减少为原来的一半；在经过3
×
3卷积之后，特征分别通过两分支的深度卷积操作，使用3
×
1和1
×
3的深度可分离卷积和1
×
3和3
×
1的深度可分离卷积分别对特征进行处理；然后再进行元素加法操作；接着使用空洞卷积对特征进一步提取；再然后使用1
×
1卷积恢复原本通道数；最后利用通道混洗操作对特征进行处理。3.根据权利要求1所述的基于密集连接和交叉融合的图像语义实时分割方法，其特征在于：所述多分辨率交叉融合模块MCFM的处理步骤如下：S31：将1/8分辨率的特征图经过3
×
1和1
×
3的分解卷积进行降维，然后使用1
×
1卷积和Sigmoid激活函数得到注意力图与1/8分辨率的输入特征图相乘，得到x1；S32：将1/2分辨率的特征图分支同样经过3
×
1和1
×
3的分解卷积，然后进行下采样操作，得到分辨率为1/4的特征，得到x3；S33：将1/4分辨率的特征图输入经过3
×

【专利技术属性】
技术研发人员：文凯，杨一鹏，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人