当前位置: 首页 > 专利查询>浙江大学专利>正文

融合深度学习网络和分水岭算法的图像精确分割方法技术

技术编号:21364166 阅读:34 留言:0更新日期:2019-06-15 09:55
本发明专利技术公开了一种融合深度学习网络和分水岭算法的图像精确分割方法。采用DeepLab识别模型并对待定图像进行识别,得到初始分割图,采用分水岭算法对待定图像进行分割,得到一组待定区域,将待定区域数量与初始分割图点乘,将待定区域划分为待测物区域,否则将待测物区域内的待定区域去除。本发明专利技术综合利用待定点与待测物质心的距离和待定点与前景及背景的灰度差异来判断等点的属性,实现了图像的精确分割。本发明专利技术利用分水岭将相邻灰度相近的像素间分区的特性,采用深度学习方法,建立待测物核心区域,提高检测精度。

An Accurate Image Segmentation Method Based on Fusion of Deep Learning Network and Watershed Algorithms

The invention discloses an accurate image segmentation method combining depth learning network and watershed algorithm. The DeepLab recognition model is used to recognize the undetermined image, and the initial segmentation image is obtained. The watershed algorithm is used to segment the fixed image, and a group of undetermined regions are obtained. The number of undetermined regions is multiplied by the initial segmentation points, and the undetermined regions are divided into the undetermined areas, otherwise the undetermined areas in the undetermined areas are removed. The method integrates the distance between the undetermined point and the center of matter to be measured and the gray difference between the undetermined point and the foreground and background to judge the attributes of the equivalents, thus realizing the accurate segmentation of the image. The invention utilizes the characteristics of watershed dividing adjacent pixels with similar gray levels, adopts deep learning method, establishes the core area of the object to be measured, and improves the detection accuracy.

【技术实现步骤摘要】
融合深度学习网络和分水岭算法的图像精确分割方法
本专利技术涉及一种在现有技术分割图像基础上进一步提高图像分割精度的方法,具体涉及一种融合深度学习网络和分水岭算法的图像精确分割方法。
技术介绍
图像分割是将图像区分为多个特定区域来代表不同的事物的过程,是目标识别中重要的步骤。在猪的行为检测中,需要将猪从各种背景中识别出来,实现猪的图像分割,为进一步的行为分析打下基础。但由于猪场内各种设施的存在及光照条件的不断变化,传统的图像分割方法很容易失效。近年来,深度学习方法在图像分割中得到了应用。FCN是图像分割最早的经典模型(LONGJ,SHELHAMERE,DARRELLT.Fullyconvolutionalnetworksforsemanticsegmentation;proceedingsoftheProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition,F,2015),其主要思想是将图像识别的神经网络模型的最后一层全连接层替换成全卷积层。使得原来输出单个识别结果的模型可以进行像素级别的图像识别。MaskRCNN(HEK,GKIOXARIG,DOLLáRP,etal.Maskr-cnn;proceedingsoftheComputerVision(ICCV),2017IEEEInternationalConferenceon,F,2017[C].IEEE.)是在FasterR-CNN(ENS,HEK,GIRSHICKR,etal.FasterR-CNN:towardsreal-timeobjectdetectionwithregionproposalnetworks;proceedingsoftheInternationalConferenceonNeuralInformationProcessingSystems,F,2015)基础上做了另一条类似FCN结构的分支,其在图像分割领域成绩不俗。SegNet(KENDALLA,BADRINARAYANANV,CIPOLLAR.Bayesiansegnet:Modeluncertaintyindeepconvolutionalencoder-decoderarchitecturesforsceneunderstanding[J].arXivpreprintarXiv:151102680,2015。RONNEBERGERO,FISCHERP,BROXT.U-net:Convolutionalnetworksforbiomedicalimagesegmentation;proceedingsoftheInternationalConferenceonMedicalimagecomputingandcomputer-assistedintervention,F,2015[C].Springer.)的权重比FCN小很多,同时还有简化版的网络用于道路情况的实时分割,简化版的权重仅有5MB。除了原版的SegNet,作者还结合了贝叶斯概率原理设计了BayesianSegNet,它主要利用了Dropout将每次网络的输出变成了不确定的结果,单次网络的前向传播得出预测概率是先验概率,而通过多次传播得到多个输出来确定总体的后验概率,得出置信度。CRFasRNN(ZHENGS,JAYASUMANAS,ROMERA-PAREDESB,etal.Conditionalrandomfieldsasrecurrentneuralnetworks;proceedingsoftheProceedingsoftheIEEEinternationalconferenceoncomputervision,F,2015[C])使用FCN输出像素判别为某一类的概率作为CRF能量方程的一元势能,并设计了一个标签相性函数、像素特征向量(主要为颜色与位置)与高斯核相结合的二元势能来反映像素和周边像素的关系。DeepLab(CHENL-C,PAPANDREOUG,KOKKINOSI,etal.Semanticimagesegmentationwithdeepconvolutionalnetsandfullyconnectedcrfs[J].arXivpreprintarXiv:14127062,2014。CHENL-C,PAPANDREOUG,KOKKINOSI,etal.Deeplab:Semanticimagesegmentationwithdeepconvolutionalnets,atrousconvolution,andfullyconnectedcrfs[J].IEEEtransactionsonpatternanalysisandmachineintelligence,2018,40(4):834-48。CHENL-C,PAPANDREOUG,SCHROFFF,etal.Rethinkingatrousconvolutionforsemanticimagesegmentation[J].arXivpreprintarXiv:170605587,2017。CHENL-C,ZHUY,PAPANDREOUG,etal.Encoder-decoderwithatrousseparableconvolutionforsemanticimagesegmentation[J].arXivpreprintarXiv:180202611,2018)图像分割领域的主流模型。DeepLab的第一个版本引入了空洞卷积代替池化,从而使得网络输出的分辨率不会太低,也就避免了需要引入大尺寸的填充,同时在网络最后接上了条件随机场(CRF),利用图像的空间相关性精细化分割结果。DeepLab的第二个版本使用了空洞空间金字塔池化,即借鉴了空间金字塔池化网络[57]在不同尺度上使用了空洞卷积从而使得分割能适应不同尺度变化。DeepLab的第三版本改进了空洞空间金字塔池化的模块,形成串联结构。最新版本命名为V3+,主要是结合了解码结构,使得输出在上采样的时候与同尺度的图像特征结合,获取更好的精度。在猪个体识别中,由于场景复杂且光照环境多变,采用深度学习模型得到猪分割结果和真实结果不完全一致的,有些情况下,差距还很大,需研究进一步提高分割精度的方法。
技术实现思路
为了解决
技术介绍
中存在的精确分割的问题,本专利技术提供了融合深度学习网络和分水岭算法的图像精确分割方法,对初分割结果周围的区域再进行精分割,能提高图像分割精度。本专利技术所采用技术方案如下:步骤1:采集多幅不同场景、不同时段、不同拍摄角度的待测物图像,对每一幅待测物图像处理获得待测物初步轮廓,将待测物初步轮廓以外的图像区域变为黑色;所述的待测物图像为完整包含有待测物的图像。具体实施中,所述的图像为母猪图像,图像中完整包含有母猪对象。步骤2:对步骤1获得的所有待测物图像采用DeepLab神经网络进行模型训练,得到待测物识别模型;所述待测物图像为模型训练的已知样本图像。步骤3:对待定图像用待测物识别模型进行识别,得到与待定图像大小一致的初始分割图;步骤4:采用分水岭算法对待定图像进行分割,得到一组待定区域本文档来自技高网
...

【技术保护点】
1.一种融合深度学习网络和分水岭算法的图像精确分割方法,其特征在于:包括如下步骤:步骤1:采集多幅不同场景、不同时段、不同拍摄角度的待测物图像,对每一幅待测物图像处理获得待测物初步轮廓,将待测物初步轮廓以外的图像区域变为黑色;步骤2:对步骤1获得的所有待测物图像采用DeepLab神经网络进行模型训练,得到待测物识别模型;步骤3:对待定图像用待测物识别模型进行识别,得到与待定图像大小一致的初始分割图;步骤4:采用分水岭算法对待定图像进行分割,得到一组待定区域,分别用B1、B2…BN表示,N为待定区域数量;步骤5:新建一幅与待定图像大小一致的图像作为参考图像C,然后针对步骤4中的每一个待定区域,采用以下方式处理参考图像C,并根据参考图像C结果处理初始分割图:步骤5.1:选取一个待定区域,计算像素点数量S1,并参考图像C上将与待定区域相同位置图像区域的像素点的灰度值设置为1,其余的像素点的灰度值设置为0;步骤5.2:将参考图像C与初始分割图对应相同位置的像素点逐对相乘,并将相乘的结果更新赋值到参考图像C上;步骤5.3:将参考图像C上所有像素点的灰度值相加,获得灰度值总和S2;步骤5.4:如果S2>S1/2,则在初始分割图上将与待定区域相同位置图像区域的像素点全部赋值为1,否则将与待定区域相同位置图像区域的像素点全部赋值为0;步骤6:重复步骤5对所有待定区域处理后获得的初始分割图作为最后精确分割图,初始分割图上赋值为1的区域代表待测物。...

【技术特征摘要】
1.一种融合深度学习网络和分水岭算法的图像精确分割方法,其特征在于:包括如下步骤:步骤1:采集多幅不同场景、不同时段、不同拍摄角度的待测物图像,对每一幅待测物图像处理获得待测物初步轮廓,将待测物初步轮廓以外的图像区域变为黑色;步骤2:对步骤1获得的所有待测物图像采用DeepLab神经网络进行模型训练,得到待测物识别模型;步骤3:对待定图像用待测物识别模型进行识别,得到与待定图像大小一致的初始分割图;步骤4:采用分水岭算法对待定图像进行分割,得到一组待定区域,分别用B1、B2…BN表示,N为待定区域数量;步骤5:新建一幅与待定图像大小一致的图像作为参考图像C,然后针对步骤4中的每一个待定区域,采用以下方式处理参考图像C,并根据参考图像C结果处理初始分割图:步骤5.1:选取一个待定区域,计算像素点数量S1,并参考图像C上将与待定区域相同位置图像区域的像素点的灰度值设置为1...

【专利技术属性】
技术研发人员:饶秀勤宋晨波张小敏高迎旺应义斌泮进明郑荣进
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1