基于宽残差金字塔池化网络的图像分割方法及系统技术方案

技术编号：17781104 阅读：85 留言：0更新日期：2018-04-22 10:24

本发明专利技术公开了一种基于宽残差金字塔池化网络的图像分割方法及系统，其中，方法步骤包括：输入待分割图像；对待分割图像进行标准化；获取WRN‑PPNet模型；对训练图像进行预处理，并通过数据扩展法增加训练图像的模式和数量，得到训练图像集；根据WRN‑PPNet模型和训练图像集进行模型训练，以生成WRN‑PPNet分割模型；根据待分割图像通过WRN‑PPNet分割模型得到图像分割结果。该方法可以基于WRN‑PPNet全自动地对图像进行分割，实现对目标对象分割的目的，不受待分割图像类别的限制，而且适应性强，模型性能好，从而有效提高图像分割的准确性和便捷性。

全部详细技术资料下载

【技术实现步骤摘要】
基于宽残差金字塔池化网络的图像分割方法及系统
本专利技术涉及图像处理和计算机视觉
，特别设计一种基于宽残差金字塔池化网络的图像分割方法及系统。
技术介绍
相关技术中，FCN(fullyconvolutionalnetwork，全卷积网络)开启了深度学习做图像语义分割的大门，此后的图像语义分割深度学习模型多是基于FCN做了一些改进。FCN是利用现存的CNNs(convolutionalneuralnetworks，卷积网络)做视觉模型，学习分层特征，再将分类网络最后的全连接层改为全卷积层，然后输出特征图，以取代分类得分，最后对这些特征图做反卷积，来产生稠密像素级标记的输出图。这种网络模型实现了用CNNs端到端地解决视觉问题。但是FCN缺少不同的特征感知，不能在具体问题和场景中很好的应用，因为它本身存在的空间不变性，使得它不能考虑上下文信息，不能感知实例等等。针对FCN的种种缺陷，研究者们提出了很多改进方法，大致包括：解码变种、整合上下文信息、条件随机场、膨胀卷积、多尺度聚合、特征融合以及递归神经网络。解码变种的方法中比较典型的是SegNet，它包含了编码器(卷积网络)和解码器(反卷积网络)两部分，相对于普通的全卷积网络，它是通过解码网络实现对低分辨率的特征图的处理；整合上下文信息的方法有PSPNet(pyramidsceneparsingnetwork，金字塔场景解析网络)，该方法主要是在网络中使用了PPNet模块；此外还有用CRF(conditionalrandomfields，条件随机场)做后期处理，以提高模型捕捉细节的能力；使用膨胀卷积，通过增大...
基于宽残差金字塔池化网络的图像分割方法及系统

【技术保护点】
一种基于宽残差金字塔池化网络的图像分割方法，其特征在于，包括以下步骤：输入待分割图像；对所述待分割图像进行标准化，以使所述待分割图像的像素均值为0且方差为1；获取WRN‑PPNet模型，其中，所述WRN‑PPNet模型包括WRN模块和PPNet模块，且所述WRN模块提取的特征与所述PPNet模块提取的特征相融合；对训练图像进行预处理，以使所述训练图像的像素均值为0且方差为1，且使得分割对象的像素标签为1且其余部分像素标签为0，并通过数据扩展法增加所述训练图像的模式和数量，得到训练图像集；根据所述WRN‑PPNet模型和所述训练图像集进行模型训练，以生成WRN‑PPNet分割模型；以及根据所述待分割图像通过所述WRN‑PPNet分割模型得到图像分割结果。

【技术特征摘要】
1.一种基于宽残差金字塔池化网络的图像分割方法，其特征在于，包括以下步骤：输入待分割图像；对所述待分割图像进行标准化，以使所述待分割图像的像素均值为0且方差为1；获取WRN-PPNet模型，其中，所述WRN-PPNet模型包括WRN模块和PPNet模块，且所述WRN模块提取的特征与所述PPNet模块提取的特征相融合；对训练图像进行预处理，以使所述训练图像的像素均值为0且方差为1，且使得分割对象的像素标签为1且其余部分像素标签为0，并通过数据扩展法增加所述训练图像的模式和数量，得到训练图像集；根据所述WRN-PPNet模型和所述训练图像集进行模型训练，以生成WRN-PPNet分割模型；以及根据所述待分割图像通过所述WRN-PPNet分割模型得到图像分割结果。2.根据权利要求1所述的基于宽残差金字塔池化网络的图像分割方法，其特征在于，所述WRN模块包括第一宽残差块组、第二宽残差块组和第三宽残差块组，所述第一宽残差块组、所述第二宽残差块组和所述第三宽残差块组均包含四个宽残差块，每个宽残差块包含两个卷积层，卷积核大小均为3*3，且在每个卷积层之前均有一个批标准化BN层，且所述第一宽残差块组中，每个宽残差块输出的特征图FMs的尺寸与其输入的FMs的尺寸相等，第二宽残差块组和第三宽残差块组中，第一个宽残差块输出的FMs的尺寸是其输入的FMs尺寸的二分之一，其余宽残差块输出的FMs的尺寸等于其输入的FMs的尺寸。3.根据权利要求1所述的基于宽残差金字塔池化网络的图像分割方法，其特征在于，所述PPNet模块包括第一池化通路、第二池化通路和第三池化通路，所述第一池化通路的池化窗口大小为4*4，所述第二池化通路的池化窗口大小为2*2，所述第三池化通路的池化窗口大小为1*1，且池化方式均为平均池化。4.根据权利要求3所述的基于宽残差金字塔池化网络的图像分割方法，其特征在于，所述获取WRN-PPNet模型，进一步包括：在所述PPNet模块的池化通路上作反卷积操作，其中，在所述第一池化通路上作两次反卷积操作，并且在所述第二池化通路上作一次反卷积操作，以及在所述第三池化通路上有两个卷积层，且每个反卷积层之前均有两个卷积层，卷积核大小均为3*3。5.根据权利要求4所述的基于宽残差金字塔池化网络的图像分割方法，其特征在于，还包括：通过串联的方式，在模型做分割之前第二次将原输入图像引入所述WRN-PPNet模型，使用两个卷积核为3*3的卷积层，获得模型生成特征与原输入图像的超本地化特征的优化组合。6.一种基于宽残差金...

【专利技术属性】
技术研发人员：王瑜，朱婷，马泽源，
申请(专利权)人：北京工商大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人