【技术实现步骤摘要】
基于宽残差金字塔池化网络的图像分割方法及系统
本专利技术涉及图像处理和计算机视觉
,特别设计一种基于宽残差金字塔池化网络的图像分割方法及系统。
技术介绍
相关技术中,FCN(fullyconvolutionalnetwork,全卷积网络)开启了深度学习做图像语义分割的大门,此后的图像语义分割深度学习模型多是基于FCN做了一些改进。FCN是利用现存的CNNs(convolutionalneuralnetworks,卷积网络)做视觉模型,学习分层特征,再将分类网络最后的全连接层改为全卷积层,然后输出特征图,以取代分类得分,最后对这些特征图做反卷积,来产生稠密像素级标记的输出图。这种网络模型实现了用CNNs端到端地解决视觉问题。但是FCN缺少不同的特征感知,不能在具体问题和场景中很好的应用,因为它本身存在的空间不变性,使得它不能考虑上下文信息,不能感知实例等等。针对FCN的种种缺陷,研究者们提出了很多改进方法,大致包括:解码变种、整合上下文信息、条件随机场、膨胀卷积、多尺度聚合、特征融合以及递归神经网络。解码变种的方法中比较典型的是SegNet,它包含了编码器(卷积网络)和解码器(反卷积网络)两部分,相对于普通的全卷积网络,它是通过解码网络实现对低分辨率的特征图的处理;整合上下文信息的方法有PSPNet(pyramidsceneparsingnetwork,金字塔场景解析网络),该方法主要是在网络中使用了PPNet模块;此外还有用CRF(conditionalrandomfields,条件随机场)做后期处理,以提高模型捕捉细节的能力;使用膨胀卷积,通过增大 ...
【技术保护点】
一种基于宽残差金字塔池化网络的图像分割方法,其特征在于,包括以下步骤:输入待分割图像;对所述待分割图像进行标准化,以使所述待分割图像的像素均值为0且方差为1;获取WRN‑PPNet模型,其中,所述WRN‑PPNet模型包括WRN模块和PPNet模块,且所述WRN模块提取的特征与所述PPNet模块提取的特征相融合;对训练图像进行预处理,以使所述训练图像的像素均值为0且方差为1,且使得分割对象的像素标签为1且其余部分像素标签为0,并通过数据扩展法增加所述训练图像的模式和数量,得到训练图像集;根据所述WRN‑PPNet模型和所述训练图像集进行模型训练,以生成WRN‑PPNet分割模型;以及根据所述待分割图像通过所述WRN‑PPNet分割模型得到图像分割结果。
【技术特征摘要】
1.一种基于宽残差金字塔池化网络的图像分割方法,其特征在于,包括以下步骤:输入待分割图像;对所述待分割图像进行标准化,以使所述待分割图像的像素均值为0且方差为1;获取WRN-PPNet模型,其中,所述WRN-PPNet模型包括WRN模块和PPNet模块,且所述WRN模块提取的特征与所述PPNet模块提取的特征相融合;对训练图像进行预处理,以使所述训练图像的像素均值为0且方差为1,且使得分割对象的像素标签为1且其余部分像素标签为0,并通过数据扩展法增加所述训练图像的模式和数量,得到训练图像集;根据所述WRN-PPNet模型和所述训练图像集进行模型训练,以生成WRN-PPNet分割模型;以及根据所述待分割图像通过所述WRN-PPNet分割模型得到图像分割结果。2.根据权利要求1所述的基于宽残差金字塔池化网络的图像分割方法,其特征在于,所述WRN模块包括第一宽残差块组、第二宽残差块组和第三宽残差块组,所述第一宽残差块组、所述第二宽残差块组和所述第三宽残差块组均包含四个宽残差块,每个宽残差块包含两个卷积层,卷积核大小均为3*3,且在每个卷积层之前均有一个批标准化BN层,且所述第一宽残差块组中,每个宽残差块输出的特征图FMs的尺寸与其输入的FMs的尺寸相等,第二宽残差块组和第三宽残差块组中,第一个宽残差块输出的FMs的尺寸是其输入的FMs尺寸的二分之一,其余宽残差块输出的FMs的尺寸等于其输入的FMs的尺寸。3.根据权利要求1所述的基于宽残差金字塔池化网络的图像分割方法,其特征在于,所述PPNet模块包括第一池化通路、第二池化通路和第三池化通路,所述第一池化通路的池化窗口大小为4*4,所述第二池化通路的池化窗口大小为2*2,所述第三池化通路的池化窗口大小为1*1,且池化方式均为平均池化。4.根据权利要求3所述的基于宽残差金字塔池化网络的图像分割方法,其特征在于,所述获取WRN-PPNet模型,进一步包括:在所述PPNet模块的池化通路上作反卷积操作,其中,在所述第一池化通路上作两次反卷积操作,并且在所述第二池化通路上作一次反卷积操作,以及在所述第三池化通路上有两个卷积层,且每个反卷积层之前均有两个卷积层,卷积核大小均为3*3。5.根据权利要求4所述的基于宽残差金字塔池化网络的图像分割方法,其特征在于,还包括:通过串联的方式,在模型做分割之前第二次将原输入图像引入所述WRN-PPNet模型,使用两个卷积核为3*3的卷积层,获得模型生成特征与原输入图像的超本地化特征的优化组合。6.一种基于宽残差金...
【专利技术属性】
技术研发人员:王瑜,朱婷,马泽源,
申请(专利权)人:北京工商大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。