一种两阶段的零样本图像语义分割方法技术

技术编号：28466307 阅读：11 留言：0更新日期：2021-05-15 21:32

本发明专利技术公开了一种两阶段的零样本图像语义分割方法，分为类别无关前背景图像分割模块与零样本目标分类模块两部分。类别无关前背景图像分割采用基于Mask

全部详细技术资料下载

【技术实现步骤摘要】
一种两阶段的零样本图像语义分割方法

[0001]本专利技术涉及深度学习图像分割领域，尤其是涉及一种两阶段的零样本图像语义分割(Zero Shot Semantic Segmentation,ZSSS)方法。

技术介绍

[0002]随着计算机视觉和图像技术的发展，深度学习以其高性能的优势广泛应用在了图像分类，图像检测，图像分割等各个领域，并迅速达到了各个领域的领先水平。图像语义分割作为基本的计算机视觉问题(图像分类，物体识别检测，语义分割)，广泛应用于自动驾驶，医学成像和工业检测等领域。而当前的全监督语义分割方法严重依赖于密集型像素级别的语义标签。而获取像素级别的语义标签需要昂贵的人力与时间成本，特别在医学图像等专业领域标注门槛高带来的标注成本更是不可预估。为降低标注成本，弱标签(如图像级别标签、目标框级别标签)、个别标签(如小样本学习)算法引起了广泛的关注与研究。而对于更加具有应用意义同时更具挑战性的零样本分割问题目前还没有得到广泛的关注与研究。
[0003]当前零样本目标分割方法均基于一阶段的Deeplab系列预测像素级别的类别语义信息。而此类方法存在两个主要的问题：1)未利用目标的整体信息，故物品的不同的部分会预测成不同的类别。2)像素级别的预测造成预测掩码存在较多噪点，即背景上可能会预测出较多不规则的噪点区域。

技术实现思路

[0004]为解决现有技术的不足，实现提升零样本目标分割方法的性能的目的，本专利技术采用如下的技术方案：
[0005]一种两阶段的零样本图像语义分割方法，包...

【技术保护点】

【技术特征摘要】
1.一种两阶段的零样本图像语义分割方法，其特征在于包括如下步骤：S1，基于Mask
‑
RCNN的两阶段类别无关的前背景图像分割，基于Mask
‑
RCNN的两阶段图像分割框架，将第二阶段的分类分支改为仅区分前背景两类，图像经过RPN后，送入第二阶段进行前背景的分类、检测框的微调以及前景的分割，图像经过Mask
‑
RCNN后得到类别无关的物体的前景检测框以及前景掩码；S2，基于CADA
‑
VAE进行零样本目标分类，首先分别进行视觉特征域与语义特征域的自动编解码，将视觉特征与语义特征转换到共同的隐变量特征空间，随后通过加入跨域编解码监督，减小视觉特征域与语义特征域的域距离，然后基于未知类语义特征转换的隐变量特征训练分类器，给定编码器E，解码器D，则交叉对齐的损失为：其中，x表示输入的视觉特征或者语义特征，i、j表示不同的域。2.如权利要求1所述的一种两阶段的零样本图像语义分割方法，其特征在于所述步骤S1中的Mask
‑
RCNN的图像分割分支加入边缘自监督和内外边缘判别器模块。3.如权利要求2所述的一种两阶段的零样本图像语义分割方法，其特征在于所述边缘自监督模块具体表现为平等性变换，即对输入图像进行仿射变换送入前背景分类网络得到图像分割结果，与对原输入图像的图像分割结果进行相同仿射变换得到的结果相同，前背景分类网络F
θ
，仿射变换矩阵A，的权重矩阵w，则边缘自监督损失定义如下：其中，x表示输入的待分割图片，w
′
表示的权重矩阵。4.如权利要求2所述的一种两阶段的零样本图像语义分割方法，其特征在于所述内外边缘判别器模块分为内边缘判别器和外边缘判别器...

【专利技术属性】
技术研发人员：刘亚洁，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人