当前位置: 首页 > 专利查询>浙江大学专利>正文

基于级联决策和交互标注自提升的弱监督语义分割方法技术

技术编号:33388839 阅读:24 留言:0更新日期:2022-05-11 23:04
本发明专利技术公开了一种基于级联决策和交互标注自提升的弱监督语义分割方法。具体包括如下步骤:获取目标域数据集和网络域数据集;利用目标域数据集在现有弱监督语义分割网络训练框架上训练得到目标域分割网络;目标域分割网络对网络域数据集进行推断,得到每张网络图像分割结果的像素点集合,并进行数据清洗,获得单类标签网络数据集和多类标签网络数据集;利用获得的数据集在弱监督语义分割网络训练框架上训练得到网络域分割网络;目标域分割网络、网络域分割网络和已有显著性目标检测网络对目标域数据集进行推断,得到目标域像素级掩膜、网络域像素级掩膜和显著性图来级联决策得到最终像素级掩膜;利用最终像素级掩膜监督训练得到最终分割网络。练得到最终分割网络。练得到最终分割网络。

【技术实现步骤摘要】
基于级联决策和交互标注自提升的弱监督语义分割方法


[0001]本专利技术涉及计算机视觉领域,特别地涉及一种基于级联决策和交互标注自提升的弱监督语义分割方法。

技术介绍

[0002]语义分割是当今计算机视觉领域的关键问题之一,其作为一项高层次的任务,为实现场景的完整理解铺平了道路。语义分割技术大量应用于无人车驾驶、医疗影像分析和地理信息系统等领域,对推进社会发展具有重要作用。近年来,基于监督学习的语义分割方法取得了显著效果,但是构造训练所需的像素级标签需要耗费大量成本。为获得高性能语义分割的同时降低样本构造成本,研究人员探索了类标签监督下基于网络图像的弱监督语义分割方法。
[0003]相关方法中将已有的带准确类标签的图像作为目标域数据,将利用关键词在搜索引擎检索得到的网络图像作为网络域数据。网络图像海量易获取,其可以通过关键词在搜索引擎检索得到,并将搜索关键词转化为其类标签。但这容易引入两类噪音图像:类标签与图像内容完全不一致的标签错误图像,以及类标签仅与部分内容一致的标签不准确图像。若无法减少网络图像噪音干扰,提升网络域知识的可靠性,将本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于级联决策和交互标注自提升的弱监督语义分割方法,其特征在于,包括以下步骤:S1、获取目标域数据集和网络域数据集;S2、利用目标域数据集在弱监督语义分割网络训练框架上训练得到目标域分割网络;S3、利用目标域分割网络对网络域数据集进行推断,得到每张网络图像分割结果的像素点集合,并进行数据清洗,获得单类标签网络数据集和多类标签网络数据集;S4、利用单类标签网络数据集和多类标签网络数据集在弱监督语义分割网络训练框架上训练得到网络域分割网络;S5、利用目标域分割网络、网络域分割网络和显著性目标检测网络各自对目标域数据集进行推断,分别得到目标域像素级掩膜、网络域像素级掩膜和显著性图,并将目标域像素级掩膜、网络域像素级掩膜和显著性图通过级联决策得到最终像素级掩膜;S6、利用最终像素级掩膜监督训练语义分割网络从而得到最终分割网络,并利用最终分割网络对目标图像进行分割。2.根据权利要求1所述的一种基于级联决策和交互标注自提升的弱监督语义分割方法,其特征在于,所述S1中,目标域数据集I
t
包含若干训练图像和与之对应的人工标注的类别标签,网络域数据集I
w
包含若干在搜索引擎上搜索到的图像和与之对应的由搜索关键词转化形成的类别标签。3.根据权利要求1所述的一种基于级联决策和交互标注自提升的弱监督语义分割方法,其特征在于,所述S2中,弱监督语义分割网络训练框架中的网络结构包括SSENet和AffinityNet两部分,其中先由SSENet以训练图像为输入,输出类别激活图,然后由AffinityNet以类别激活图为输入,输出像素级掩膜;利用目标域数据集I
t
在弱监督语义分割网络训练框架上训练完毕后,得到目标域分割网络F
t
。4.根据权利要求1所述的一种基于级联决策和交互标注自提升的弱监督语义分割方法,其特征在于,所述S3包括以下子步骤:S31、利用目标域分割网络F
t
对网络域数据集I
w
进行推断,得到每张图像分割结果的像素点集合Φ;S32、每张网络域图像X
i
定义和其中Φ
i
是第i张图像分割结果的像素点集合,|Φ
i
|表示Φ
i
中的像素点总数,p
k
是Φ
i
中像素点k的语义标签;χ(A)代表对条件表达式A的判定结果,当条件表达式A成立时χ(A)=1,否则χ(A)=0;bg表示背景像素;λ
i
表示单类别l
i
占图像X
i
比例,μ
i
表示其它前景类别占图像X
i
比例;S33、对网络域数据集I
w
进行初步清洗,遍历其中的每一张网络图像X
i
,若网络图像X
i
满足δ1≤λ
i
≤δ2则保留,其中δ1和δ2为阈值控制单类别l
i
占图像X
i
比例,否则直接会被判定为噪音图像从网络域数据集I
w
中剔除;S34、针对步骤S33中保留的网络图像进行单类清洗,遍历其中保留的每一张网络图像X
i
,若网络图像X
i
满足μ
i
=0,则将其加入单类标签网络数据集,否则不加入单类标签网络数据集;S35、针对步骤S33中保留的网络图像进行多类清洗,遍历其中保留的每一张网络图像
X
i
,若网络图像X
i
满足μ
...

【专利技术属性】
技术研发人员:缪佩翰励雪巍李玺
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1