商品图像分割方法及装置制造方法及图纸

技术编号:17914112 阅读:92 留言:0更新日期:2018-05-10 19:15
本发明专利技术涉及一种商品图像分割方法及装置,所述方法包括获取目标商品图像,对目标商品图像进行预处理以获得目标商品图像各像素点的多通道颜色特征数据,将多通道颜色特征数据输入神经网络模型中进行处理得到目标商品图像各像素点的前景概率和背景概率,神经网络模型是通过对经过预处理的商品图像样本集进行迭代训练得到的,根据目标商品图像各像素点的前景概率和背景概率得到目标商品图像的前景图像和背景图像以对目标商品图像进行分割。采用该方法及装置能够自动、准确高效地对商品图像进行分割。

【技术实现步骤摘要】
商品图像分割方法及装置
本专利技术涉及图像处理领域,特别是涉及一种商品图像分割方法及装置。
技术介绍
随着计算机视觉技术的迅速发展,图像分割引起了人们的广泛关注,是计算机视觉中的一个关键问题。图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程,它是由图像处理到图像分析的关键步骤。图像分割的目的是简化或改变图像的表现形式,使得图像更容易理解和分析。在商品图像的处理中,图像分割过程主要是要将图片分成前景和背景两部分。例如,街拍了一位穿着时髦的行人的图像,在这幅图像中,穿着时髦的行人是图像的前景,而街景是图像的背景,我们希望对商品图像进行分割,从街景中识别出该行人所穿衣服商品以供后续处理。而如何对商品图像进行分割是一个难题。传统的图像分割技术往往需要人工介入,例如需要人为在图片上设定一个前景区域或者是需要事先进行超像素分割、对整幅图像进行建图。人为在图片上设定前景的方法的分割效率和分割准确率都很低,而对图像进行超像素分割和对整幅图像建图的方法的计算量大,非常耗时。
技术实现思路
基于此,有必要针对上述技术问题,提供一种自动的、准确快捷的商品图像分割方法及装置。一种商品图像分割方法,方法包括以下步骤:获取目标商品图像;对目标商品图像进行预处理以获得目标商品图像各像素点的多通道颜色特征数据;将多通道颜色特征数据输入神经网络模型中进行处理得到目标商品图像各像素点的前景概率和背景概率,神经网络模型是通过对经过预处理的商品图像样本集进行迭代训练得到的;根据目标商品图像各像素点的前景概率和背景概率得到目标商品图像的前景图像和背景图像以对目标商品图像进行分割。在其中一个实施例中,神经网络模型包括连接的金字塔卷积神经网络和线性神经网络,对经过预处理的商品图像样本集进行迭代训练的步骤包括:获取商品图像样本集,商品图像样本集包括多张样本商品图像;对每张样本商品图像的各像素点进行类目标注,类目包括前景和背景;对样本商品图像进行预处理以获得各像素点的多通道颜色特征数据;将多通道颜色特征数据输入金字塔卷积神经网络中并输出高维特征数据,将高维特征数据输入至线性神经网络并输出预测的各像素点的前景概率和背景概率,根据各像素点标注的类目计算预测误差并采用有监督的反向传播方法对金字塔卷积神经网络和线性神经网络进行迭代训练得到深度学习的神经网络模型。在其中一个实施例中,对样本商品图像的各像素点进行类目标注的步骤包括:用数字集合{0,1}表示样本商品图像的各像素点的类目,前景和背景分别用1和0表示;采用交互式分割方法将样本商品图像的前景部分分割出来,将前景部分对应的像素点标注为1,将样本商品图像的其余部分对应的像素点标注为0。在其中一个实施例中,金字塔卷积神经网络包括多层输入,对样本商品图像进行预处理以获得各像素点的多通道颜色特征数据的步骤包括:将样本商品图像进行缩放获得多张不同分辨率的图像;获得样本商品图像和经过缩放的图像的多通道颜色特征数据分别作为金字塔卷积神经网络的多层输入。在其中一个实施例中,金字塔卷积神经网络包括多个卷积层、非线性层、池化层和填充层,非线性层中采用的非线性激活函数为双曲正切函数,池化层采用最大池化方式;将多通道颜色特征数据输入金字塔卷积神经网络中并输出高维特征数据,将高维特征数据输入至线性神经网络并输出预测的各像素点的前景概率和背景概率的步骤包括:通过卷积层对颜色特征数据进行卷积运算,通过非线性层对卷积运算结果进行非线性变换,通过池化层对非线性变换结果进行池化操作,通过填充层对图像边缘进行扩充以将经过卷积运算的图像尺寸调整至原图尺寸,将多层输入的运算结果进行整合得到高维特征数据,通过线性神经网络对高维特征数据进行计算得到前景概率和背景概率。在其中一个实施例中,对目标商品图像进行预处理以获得目标商品图像各像素点的多通道颜色特征数据的步骤还包括:将目标商品图像由RGB颜色空间转换为YUV颜色空间,获得各像素点的YUV三通道颜色特征数据;建立目标商品图像在水平方向上呈高斯分布、竖直方向上无差别的灰度图像,获得灰度图像各像素点的的灰度颜色特征数据;将YUV三维颜色特征数据与灰度颜色特征数据进行整合得到各像素点的四通道颜色特征数据。在其中一个实施例中,根据目标商品图像各像素点的前景概率和背景概率得到目标商品图像的前景图像和背景图像的步骤包括:设定预设概率阈值;将目标商品图像各像素点的前景概率和背景概率与预设概率阈值进行比较,当前景概率大于预设概率阈值时对应的像素点记为前景,当背景概率大于预设概率阈值时对应的像素点记为背景,根据比较结果得到目标商品图像的黑白掩码矩阵;将黑白掩码矩阵与目标商品图像进行运算得到目标商品图像的前景图像和背景图像。一种商品图像分割装置,装置包括:目标图像获取处理模块,用于获取目标商品图像;目标图像预处理模块,用于对目标商品图像进行预处理以获得目标商品图像各像素点的多通道颜色特征数据;概率计算模块,用于将多通道颜色特征数据输入神经网络模型中进行处理得到目标商品图像各像素点的前景概率和背景概率,神经网络模型是通过对经过预处理的商品图像样本集进行迭代训练的方法得到的;图像分割模块,用于根据目标商品图像各像素点的前景概率和背景概率得到目标商品图像的前景图像和背景图像以对目标商品图像进行分割。在其中一个实施例中,神经网络模型包括连接的金字塔卷积神经网络和线性神经网络,装置还包括网络训练模块,训练模块包括:样本图像获取模块,用于获取商品图像样本集,商品图像样本集包括多张样本商品图像;图像标注模块,用于对样本商品图像的各像素点进行类目标注,类目包括前景和背景;图像预处理模块,用于对每张样本商品图像进行预处理以获得各像素点的多通道颜色特征数据;训练模块,用于将多通道颜色特征数据输入金字塔卷积神经网络中并输出高维特征数据,将高维特征数据输入至线性神经网络并输出预测的各像素点的前景概率和背景概率,根据各像素点标注的类目计算预测误差并采用有监督的反向传播方法对金字塔卷积神经网络和线性神经网络进行迭代训练得到深度学习的神经网络模型。在其中一个实施例中,图像标注模块包括:标注设置模块,用于用数字集合{0,1}表示样本商品图像的类目,前景和背景分别用1和0表示;交互标注模块,用于采用交互式分割方法将样本商品图像的前景部分分割出来,将前景部分对应的像素点标注为1,将样本商品图像的其余部分对应的像素点标注为0。在其中一个实施例中,金字塔卷积神经网络包括多层输入,图像预处理模块包括:缩放模块,用于将样本商品图像进行缩放获得多张不同分辨率的图像;特征获得模块,用于获得商品图像和经过缩放的图像的多通道颜色特征数据分别作为金字塔卷积神经网络的多层输入。在其中一个实施例中,金字塔卷积神经网络包括多个卷积层、非线性层、池化层和填充层,非线性层中采用的非线性激活函数为双曲正切函数,池化层采用最大池化方式;训练模块还用于通过卷积层对颜色特征数据进行卷积运算,通过非线性层对卷积运算结果进行非线性变换,通过池化层对非线性变换结果进行池化操作,通过填充层对图像边缘进行扩充以将经过卷积运算的图像尺寸调整至原图尺寸,将多层输入的运算结果进行整合得到高维特征数据,通过线性神经网络对高维特征数据进行计算得到前景概率和背景概率。在其本文档来自技高网...
商品图像分割方法及装置

【技术保护点】
一种商品图像分割方法,其特征在于,包括如下步骤:获取目标商品图像;对所述目标商品图像进行预处理以获得所述目标商品图像各像素点的多通道颜色特征数据;将所述多通道颜色特征数据输入神经网络模型中进行处理得到所述目标商品图像各像素点的前景概率和背景概率,所述神经网络模型是通过对经过预处理的商品图像样本集进行迭代训练得到的;根据所述目标商品图像各像素点的所述前景概率和所述背景概率得到所述目标商品图像的前景图像和背景图像以对所述目标商品图像进行分割。

【技术特征摘要】
1.一种商品图像分割方法,其特征在于,包括如下步骤:获取目标商品图像;对所述目标商品图像进行预处理以获得所述目标商品图像各像素点的多通道颜色特征数据;将所述多通道颜色特征数据输入神经网络模型中进行处理得到所述目标商品图像各像素点的前景概率和背景概率,所述神经网络模型是通过对经过预处理的商品图像样本集进行迭代训练得到的;根据所述目标商品图像各像素点的所述前景概率和所述背景概率得到所述目标商品图像的前景图像和背景图像以对所述目标商品图像进行分割。2.根据权利要求1的商品图像分割方法,其特征在于,所述神经网络模型包括连接的金字塔卷积神经网络和线性神经网络,所述对经过预处理的商品图像样本集进行迭代训练的步骤包括:获取所述商品图像样本集,所述商品图像样本集包括多张样本商品图像;对每张所述样本商品图像的各像素点进行类目标注,所述类目包括前景和背景;对所述样本商品图像进行预处理以获得各像素点的所述多通道颜色特征数据;将所述多通道颜色特征数据输入所述金字塔卷积神经网络中并输出高维特征数据,将所述高维特征数据输入至所述线性神经网络并输出预测的各像素点的所述前景概率和所述背景概率,根据各像素点标注的所述类目计算预测误差并采用有监督的反向传播方法对所述金字塔卷积神经网络和所述线性神经网络进行迭代训练得到深度学习的所述神经网络模型。3.根据权利要求2的商品图像分割方法,其特征在于,所述对样本商品图像的各像素点进行类目标注的步骤包括:用数字集合{0,1}表示所述样本商品图像的各像素点的所述类目,前景和背景分别用1和0表示;采用交互式分割方法将所述样本商品图像的前景部分分割出来,将所述前景部分对应的像素点标注为1,将所述样本商品图像的其余部分对应的像素点标注为0。4.根据权利要求2的商品图像分割方法,其特征在于,所述金字塔卷积神经网络包括多层输入,所述对样本商品图像进行预处理以获得各像素点的多通道颜色特征数据的步骤包括:将所述样本商品图像进行缩放获得多张不同分辨率的图像;获得所述样本商品图像和经过缩放的图像的所述多通道颜色特征数据分别作为所述金字塔卷积神经网络的多层输入。5.根据权利要求2的网络模型训练方法,其特征在于,所述金字塔卷积神经网络包括多个卷积层、非线性层、池化层和填充层,所述非线性层中采用的非线性激活函数为双曲正切函数,所述池化层采用最大池化方式;所述将多通道颜色特征数据输入金字塔卷积神经网络中并输出高维特征数据,将高维特征数据输入至线性神经网络并输出预测的各像素点的前景概率和背景概率的步骤包括:通过所述卷积层对所述颜色特征数据进行卷积运算,通过所述非线性层对卷积运算结果进行非线性变换,通过所述池化层对非线性变换结果进行池化操作,通过所述填充层对图像边缘进行扩充以将经过卷积运算的图像尺寸调整至原图尺寸,将多层输入的运算结果进行整合得到所述高维特征数据,通过所述线性神经网络对所述高维特征数据进行计算得到所述前景概率和所述背景概率。6.根据权利要求1的商品图像分割方法,其特征在于,所述对所述目标商品图像进行预处理以获得所述目标商品图像各像素点的多通道颜色特征数据的步骤还包括:将所述目标商品图像由RGB颜色空间转换为YUV颜色空间,获得各像素点的YUV三通道颜色特征数据;建立所述目标商品图像在水平方向上呈高斯分布、竖直方向上无差别的灰度图像,获得所述灰度图像各像素点的的灰度颜色特征数据;将所述YUV三维颜色特征数据与所述灰度颜色特征数据进行整合得到各像素点的四通道颜色特征数据。7.根据权利要求1的商品图像分割方法,其特征在于,所述根据所述目标商品图像各像素点的所述前景概率和所述背景概率得到所述目标商品图像的前景图像和背景图像以对所述目标商品图像进行分割的步骤包括:设定预设概率阈值;将所述目标商品图像各像素点的所述前景概率和所述背景概率与所述预设概率阈值进行比较,当所述所述前景概率大于所述预设概率阈值时对应的像素点记为前景,当所述背景概率大于所述预设概率阈值时对应的像素点记为背景,根据比较结果得到所述目标商品图像的黑白掩码矩阵;将所述黑白掩码矩阵与所述目标商品图像进行运算得到所述目标商品图像的所述...

【专利技术属性】
技术研发人员:李明强
申请(专利权)人:广州图普网络科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1