【技术实现步骤摘要】
一种基于卷积神经网络的立体图像分割方法
本专利技术属于图像处理
,具体是指一种基于卷积神经网络的立体图像分割方法。
技术介绍
图像分割就是把图像分成若干个特定的、具有独特性质的区域并提取出感兴趣目标的技术和过程。现有技术中,对于单幅图像分割取得了巨大的成功,但左右一致性的立体图像分割仍然是一个非常具有挑战性的问题。随着立体图像和视频在最近几年变得越来越流行,立体图像和视频编辑的需求逐渐升温。而立体图像分割则是立体图像和视频编辑领域的一个富有挑战性的热点课题。立体图像分割相比于单个图像分割提出了更多的要求,立体图像分割的物体必须要保证左右视图的一致性。一种最直接的立体图像分割方法是对立体图像左右视图分别采用单个图像分割的方法进行图像分割操作,但是这种方法不但需要消耗大量的时间,而且很难保证获得左右一致性的立体图像分割结果。目前,单个图像的分割技术已经比较成熟,因此,有众多学者开始研究结合立体视差图和单个图像的分割技术,自动产生左右一致性的立体图像分割结果。但是到目前为止还没有一个方法能精确的获得立体视差图,而基于立体视差图的立体图像分割的效果很大程度上都依赖于立体视差图的精度,因此导致此类方法的精度一直很难满足立体图像分割的要求。立体图像分割技术是一项具有挑战性的热点课题,主要目标是获得左右一致性的立体分割效果。目前主流的立体图像分割方法大致可以分为三类:基于区域的立体图像分割方法、基于着色线条的立体图像分割方法和基于轮廓提取的立体图像分割方法。其中,基于区域的立体图像分割方法采用左右视图中每个像素之间的立体相关性,根据立体图像左视图(右视图)的分割结 ...
【技术保护点】
1.一种基于卷积神经网络的立体图像分割方法,其特征在于包括以下步骤:步骤(1):通过立体视差图中的相干性视差像素点,把左分割图迁移到右分割图,具体包括:(1.1)输入立体图像左右视图,采用立体匹配算法,分别计算左视差图
【技术特征摘要】
1.一种基于卷积神经网络的立体图像分割方法,其特征在于包括以下步骤:步骤(1):通过立体视差图中的相干性视差像素点,把左分割图迁移到右分割图,具体包括:(1.1)输入立体图像左右视图,采用立体匹配算法,分别计算左视差图和右视差图(1.2)根据左视差图和右视差图计算右视差图中的相干性视差像素点;(1.3)通过相干性视差像素点,把左分割图迁移到右分割图,产生右视图分割采样点;步骤(2):训练卷积神经网络,提取左视图中的特征和相应的左分割图的值为训练集,训练完后,提取右视图中的特征为输入,产生右视图目标概率图,根据目标概率图,提取可信的像素点;步骤(3):根据相干性视差分割图迁移像素点和目标概率图中的可信像素点,合成右视图分割初始化采样点;步骤(4):利用能量最优化模型,求解右视图分割图,最后对右视图分割图进行二值化,获得最终右视图分割结果。2.根据权利要求1所述的立体图像分割方法,其特征在于:步骤(1.2)中计算右视差图中的相干性视差像素点具体为:右视差图中的相干性视差点满足如下要求:式中:(x,y)为像素的坐标值、和分别为左视差图和右视差图;即一个像素从右视图到左视图的视差值和从左视图到右视图的视差值的差小于1个像素,则认为该像素点为相干性像素点。3.根据权利要求1所述的立体图像分割方法,其特征在于:在步骤(1.3)中通过相干性视差像素点把左分割图迁移到右分割图,具体为:左分割图通过相干性像素点迁移至右分割图:式中:FD和BD分别为通过相干性像素点把左分割图迁移至右分割图的前景和背景采样点;(x,y)为像素的坐标值;PC为右视差图中的相干性像素点集合;Ml为左视图分割图;通过相干性像素点迁移,获得了右视图进行分割的部分初始采样点。4.根据权利要求1所述的立体图像分割方法,其特征在于:在步骤(2)中所述的训练卷积神经网络,提取左视图中的特征和相应的左分割图的值为训练集,训练完后,提取右视图中的特征为输入,产生右视图目标概率图,根据目标概率图,提取可信的像素点,具体包括:(2.1)构建卷积神经网络,包括提取图像补丁特征层,提取空间特征层,合并图像补丁特征和空间特征层,分类层;图像补丁特征层的输入为图像3×3×c的补丁,其中c为图像的通道数,图像补丁特征层由四组卷积层+ReLU激活函数和池化层组成,每组卷积层+ReLU激活函数和池化层进行如下操作:fpool(fReLU(fconv(p)));fconv对应卷积层,fReLU对应ReLU激活函数,fpool对应池化层;图像补丁特征层连接顺序为C1-M1-C2-M2-C3-M3-C4-M4,其中C1层、C2层、C3层和C4层为卷积层+ReLU激活函数,C1层卷积核为64种类型的3×3×c滤波器;C2层卷积核为64种类型的3×3×64滤波器;C3层卷积核为128种类型的3×3×64滤波器;C4层卷积核为256种类型的3×3×128滤波器,ReLU为非线性激活函数,ReLU(x)=max(0,x);M1、M2、M3、M4为池化层,池化层采用取最大值的池化方法,采用的是2×2的池化,步幅为1;空间特征层的输入为像素点的空间坐标,空间特征层FC5为256个神经元的全连接层+ReLU激活函数;合并层采用全连接层+ReLU激活函数合并图像补丁特征和空间特征,合并层FC6为256个神经元的全连接层+ReLU激活函数;最后分类层S7使用了softmax激活函数来输出分类结果;(2.2)卷积神经网络训练和测试图像分割物体的边缘通常是前景和背景之间是线性混合的区域,因此左分割图像素分为三类:前景像素、背景像素和未知像素;本方法对左分割图进行边缘检测,设置边缘半径为1的区域为未知区域,在左分割图中,设置前景像素为1,背景像素为0,未知像素为0.5;卷积神经网络的训练数据集为其中N为训练的样本数;gi为卷积神经网络输入,gi=[Yl(Ni);(xi,yi)],Yl(Ni)是左视图中以(xi,yi)为中心9×9×c图像补丁(c为图像通道数),用于图像补丁特征层的输入;(xi,yi)空间坐标用于空间特征层的输入;zi为卷积神经网络的输出,zi的值为zi=...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。