图像分割方法和装置以及图像分割模型的训练方法和装置制造方法及图纸

技术编号:34849994 阅读:16 留言:0更新日期:2022-09-08 07:49
提供一种图像分割方法和装置以及图像分割模型的训练方法和装置。所述训练方法可包括:获取样本图像的第一图像语义特征,第一图像语义特征与第一分辨率对应;依据第一图像语义特征,获取样本图像的语义编码特征;依据第一图像语义特征,获取样本图像的第二图像语义特征,第二图像语义特征与第二分辨率对应,第二分辨率高于第一分辨率;依据语义编码特征和第二图像语义特征,得到样本图像的图像分割结果;基于图像分割结果和预设图像分割结果的差异,确定训练损失,在训练损失满足预设条件时,获得图像分割模型。获得图像分割模型。获得图像分割模型。

【技术实现步骤摘要】
图像分割方法和装置以及图像分割模型的训练方法和装置


[0001]本公开涉及图像处理领域,尤其涉及一种图像分割方法和图像分割装置、以及图像分割模型的训练方法和训练装置。

技术介绍

[0002]图像显著性目标分割是一项非常重要的计算机视觉任务,它在图像检索、视觉跟踪图像编辑和影视制作中有多种应用。图像显著性目标分割是指通过智能算法模拟人的视觉特点,逐像素提取图像中的显著区域。
[0003]随着深度学习的快速发展,深度神经网络被广泛应用于图像显著性目标分割中,从深度网络提取的高层语义特征能够从复杂场景中更准确地辨别目标对象和背景,从而极大地提升了显著性目标分割的效果,因此,深度学习技术成为了该领域中主流的技术之一。虽然基于深度神经网络的分割方法已经取得了很大的进步,但是仍然存在分割准确率低的问题。

技术实现思路

[0004]本公开提供一种图像分割方法和图像分割装置以及图像分割模型的训练方法和训练装置,以至少解决上述问题。本公开的技术方案如下:
[0005]根据本公开实施例的第一方面,提供一种图像分割模型的训练方法,所述训练方法可包括:获取样本图像的第一图像语义特征,所述第一图像语义特征与第一分辨率对应;依据所述第一图像语义特征,获取所述样本图像的语义编码特征;依据所述第一图像语义特征,获取所述样本图像的第二图像语义特征,所述第二图像语义特征与第二分辨率对应,所述第二分辨率高于所述第一分辨率;依据所述语义编码特征和所述第二图像语义特征,得到所述样本图像的图像分割结果;基于所述图像分割结果和预设图像分割结果的差异,确定训练损失,在所述训练损失满足预设条件时,获得所述图像分割模型。
[0006]作为一种实施方式,获取样本图像的第一图像语义特征,可包括:对所述样本图像进行卷积处理和下采样处理,得到所述样本图像的所述第一图像语义特征。
[0007]作为一种实施方式,依据所述第一图像语义特征,获取所述样本图像的语义编码特征,可包括:对所述第一图像语义特征进行池化处理、全连接处理和特征映射处理中的至少一个操作,得到预设维度的所述语义编码特征。
[0008]作为一种实施方式,依据所述第一图像语义特征,获取所述样本图像的第二图像语义特征,可包括:对所述第一图像语义特征进行卷积处理和上采样处理,得到所述样本图像的所述第二图像语义特征。
[0009]作为一种实施方式,依据所述语义编码特征和所述第二图像语义特征,得到所述样本图像的图像分割结果,可包括:依据所述语义编码特征,对所述第二图像语义特征进行卷积处理,得到所述样本图像的图像分割结果。
[0010]作为一种实施方式,依据所述语义编码特征,对所述第二图像语义特征进行卷积
处理,可包括:基于所述语义编码特征,设置与所述样本图像对应的处理参数;利用设置后的处理参数对所述第二图像语义特征进行卷积处理。
[0011]作为一种实施方式,基于所述语义编码特征,设置与所述样本图像对应的处理参数,可包括:基于所述第二图像语义特征的预设通道数以及用于所述卷积处理的卷积核的预设数量和预设大小,确定所述语义编码特征的预设维度;将所述预设维度的语义编码特征中的每个维度语义编码特征分别设置为用于所述卷积处理的卷积核中的卷积权重。
[0012]作为一种实施方式,利用设置后的处理参数对所述第二图像语义特征进行卷积处理,可包括:对所述第二图像语义特征进行第一卷积处理,得到具有第一特征通道数的图像语义特征,其中,所述第一特征通道数小于所述第二图像语义特征的通道数;对具有第一特征通道数的图像语义特征进行第二卷积处理,得到具有所述第一通道数的图像语义特征;对具有所述第一通道数的图像语义特征进行第三卷积处理,得到具有第二通道数的图像语义特征,其中,所述第二通道数小于所述第一通道数。
[0013]根据本公开实施例的第二方面,提供一种图像分割方法,可包括:获取输入图像;将所述输入图像输入至图像分割模型,得到所述输入图像的图像分割结果,其中,所述图像分割模型是基于样本图像的语义编码特征和第二图像语义特征获得的图像分割结果训练得到的,所述语义编码特征和所述第二图像语义特征是依据所述样本图像的第一图像语义特征获得,所述第二图像语义特征对应的第二分辨率高于所述第一图像语义特征对应的第一分辨率。
[0014]作为一种实施方式,将所述输入图像输入至图像分割模型,得到所述输入图像的图像分割结果,可包括:对所述输入图像进行卷积处理和下采样处理,得到所述输入图像的所述第一图像语义特征;对所述第一图像语义特征进行池化处理、全连接处理和特征映射处理中的至少一个操作,得到预设维度的所述语义编码特征;对所述第一图像语义特征进行卷积处理和上采样处理,得到所述输入图像的所述第二图像语义特征;依据所述语义编码特征,对所述第二图像语义特征进行卷积处理,得到所述输入图像的图像分割结果。
[0015]作为一种实施方式,依据所述语义编码特征,对所述第二图像语义特征进行卷积处理,可包括:基于所述语义编码特征,设置与所述输入图像对应的处理参数;利用设置后的处理参数对所述第二图像语义特征进行卷积处理。
[0016]作为一种实施方式,基于所述语义编码特征,设置与所述输入图像对应的处理参数,可包括:基于所述第二图像语义特征的预设通道数以及用于所述卷积处理的卷积核的预设数量和预设大小,确定所述语义编码特征的预设维度;将所述预设维度的语义编码特征中的每个维度语义编码特征分别设置为用于所述卷积处理的卷积核中的卷积权重。
[0017]作为一种实施方式,利用设置后的处理参数对所述第二图像语义特征进行卷积处理,可包括:对所述第二图像语义特征进行第一卷积处理,得到具有第一特征通道数的图像语义特征,其中,所述第一特征通道数小于所述第二图像语义特征的通道数;对具有第一特征通道数的图像语义特征进行第二卷积处理,得到具有所述第一通道数的图像语义特征;对具有所述第一通道数的图像语义特征进行第三卷积处理,得到具有第二通道数的图像语义特征,其中,所述第二通道数小于所述第一通道数。
[0018]根据本公开实施例的第三方面,提供一种图像分割模型装置,可包括:编码器,被配置为获取输入图像的第一图像语义特征,所述第一图像语义特征与第一分辨率对应;第
一解码器,被配置为依据所述第一图像语义特征,获取所述输入图像的第二图像语义特征,所述第二图像语义特征与第二分辨率对应,所述第二分辨率高于所述第一分辨率;注意力模块,被配置为依据所述第一图像语义特征,获取所述输入图像的语义编码特征;第二解码器,被配置为依据所述语义编码特征和所述第二图像语义特征,得到所述输入图像的图像分割结果。
[0019]作为一种实施方式,所述编码器可被配置为:对所述输入图像进行卷积处理和下采样处理,得到所述输入图像的所述第一图像语义特征。
[0020]作为一种实施方式,所述注意力模块可被配置为:对所述第一图像语义特征进行池化处理、全连接处理和特征映射处理中的至少一个操作,得到预设维度的所述语义编码特征。
[0021]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像分割模型的训练方法,其特征在于,包括:获取样本图像的第一图像语义特征,所述第一图像语义特征与第一分辨率对应;依据所述第一图像语义特征,获取所述样本图像的语义编码特征;依据所述第一图像语义特征,获取所述样本图像的第二图像语义特征,所述第二图像语义特征与第二分辨率对应,所述第二分辨率高于所述第一分辨率;依据所述语义编码特征和所述第二图像语义特征,得到所述样本图像的图像分割结果;基于所述图像分割结果和预设图像分割结果的差异,确定训练损失,在所述训练损失满足预设条件时,获得所述图像分割模型。2.根据权利要求1所述的训练方法,其特征在于,依据所述语义编码特征和所述第二图像语义特征,得到所述样本图像的图像分割结果,包括:依据所述语义编码特征,对所述第二图像语义特征进行卷积处理,得到所述样本图像的图像分割结果。3.根据权利要求2所述的训练方法,其特征在于,依据所述语义编码特征,对所述第二图像语义特征进行卷积处理,包括:基于所述语义编码特征,设置与所述样本图像对应的处理参数;利用设置后的处理参数对所述第二图像语义特征进行卷积处理。4.根据权利要求3所述的训练方法,其特征在于,基于所述语义编码特征,设置与所述样本图像对应的处理参数,包括:基于所述第二图像语义特征的预设通道数以及用于所述卷积处理的卷积核的预设数量和预设大小,确定所述语义编码特征的预设维度;将所述预设维度的语义编码特征中的每个维度语义编码特征分别设置为用于所述卷积处理的卷积核中的卷积权重。5.一种图像分割方法,其特征在于,包括:获取输入图像;将所述输入图像输入至图像分割模型,得到所述输入图像的图像分割结果,其中,所述图像分割模型是基于样本图像的语义编码特征和第二图像语义特征获得的图像分割结果训练得到的,所述语义编码特征和所述第二图像语义特征是依据所述样本图像的第一图像语义特征获得,所述第二图像语义特征对应的第二分辨率高于所述第一图像语...

【专利技术属性】
技术研发人员:王伟农戴宇荣
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1