基于多尺度特征和编解码器模型的街景图像语义分割方法技术

技术编号：21972062 阅读：33 留言：0更新日期：2019-08-28 01:36

本发明专利技术公开了一种基于多尺度特征和编解码器模型的街景图像语义分割方法，包括以下步骤：原始图像输入深度卷积神经网络提取初始特征图；将初始特征图输入第一多尺度空间金字塔池化模块输出第一特征图；第一特征图输入第二多尺度空间金字塔池化模块输出第二特征图；第二特征图通过然后利用上采样操作和跳跃连接还原为原始图像大小得到最终的预测图；所述第一多尺度空间金字塔池化模块和第二多尺度空间金字塔池化模块输出特征图由通过1×1卷积、通过四个扩张率不同的atrous卷积以及通过平均池化操作提取的六种尺度的特征图级联后输出。本发明专利技术方法能够提高语义分割结果的精度，对目标边界的像素进行更准确的分类。

Semantic Segmentation of Street Scene Images Based on Multiscale Features and Codec Model

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度特征和编解码器模型的街景图像语义分割方法
本专利技术涉及一种图像语义分割方法，特别是涉及一种基于多尺度特征和编解码器模型的街景图像语义分割方法。
技术介绍
图像分割是图像处理领域中常见的概念，它的目的是将每个像素区域划分给不同的类别。但和语义分割根本的区别在于，图像分割并不知道分割出来的各个类是什么，即只需要分割出不同的区域，大多只是利用像素之间的相似尺度进行划分。而语义分割则是在分割出区域的基础上，对每个区域所属类别进行分类，即实现对一幅图片中的每一个像素点分类。目前图像语义分割研究都是基于FCN(全卷积神经网络)这种结构，针对FCN存在的问题来进行优化。尽管语义分割的方法不同，但基本研究方向是以下两个方面：第一种，基于特征提取的改进，这类方法通过利用不同的特征提取方法，获取更详细的信息以实现更精确的分类；第二种，基于后处理方法的改进，这类方法通过将前面分类的不准确的预测进行一些后处理操作，使得目标边界更加平滑以获得更好的结果。针对目前的语义分割方法，当前主要存在两个问题。1、如何获取有用的多尺度特征。尽管atrous卷积(或dilated卷积)能够在...

【技术保护点】
1.一种基于多尺度特征和编解码器模型的街景图像语义分割方法，其特征在于，包括以下步骤：S1、原始图像输入深度卷积神经网络提取初始特征图；S2、将初始特征图输入第一多尺度空间金字塔池化模块输出第一特征图；S3、将第一特征图输入第二多尺度空间金字塔池化模块输出第二特征图；S4、由所述第二特征图通过1×1卷积和第一上采样层与第一特征图1×1卷积后的特征图相连接还原成第一还原图；S5、所述第一还原图通过第二上采样层与所述初始特征图1×1卷积后相连接得到第二还原图；S6、所述第二还原图通过3×3卷积和第三上采样层还原为原始图像大小得到最终的预测图；所述第一多尺度空间金字塔池化模块和第二多尺度空间金字塔池...

【技术特征摘要】
1.一种基于多尺度特征和编解码器模型的街景图像语义分割方法，其特征在于，包括以下步骤：S1、原始图像输入深度卷积神经网络提取初始特征图；S2、将初始特征图输入第一多尺度空间金字塔池化模块输出第一特征图；S3、将第一特征图输入第二多尺度空间金字塔池化模块输出第二特征图；S4、由所述第二特征图通过1×1卷积和第一上采样层与第一特征图1×1卷积后的特征图相连接还原成第一还原图；S5、所述第一还原图通过第二上采样层与所述初始特征图1×1卷积后相连接得到第二还原图；S6、所述第二还原图通过3×3卷积和第三上采样层还原为原始图像大小得到最终的预测图；所述第一多尺度空间金字塔池化模块和第二多尺度空间金字塔池化模块对输入的特征图处理输出特征图的方法为：将输入的特征图分别通过1×1卷积提取第一种尺度的特征图，通过四个扩张率不同的atrous卷积提取四种不同尺度下的特征...

【专利技术属性】
技术研发人员：龚声蓉，尚叶欣，钟珊，应文豪，潘威，
申请(专利权)人：常熟理工学院，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人