【技术实现步骤摘要】
一种基于前背景匹配的边界框弱监督图像分割方法
[0001]本专利技术涉及图像分割
,具体涉及一种基于前背景匹配的边界框弱监督图像分割方法。
技术介绍
[0002]图像分割(Image Segmentation,IS)是一项预测图像中单个像素类别的任务,长期以来一直是图像理解和计算机视觉领域的关键问题之一。该技术根据像素的不同属性,将数字图像分为多个区域,进而提取有意义的信息以便于分析。与图像分类和目标检测任务不同,它通常是低级别或像素级别的视觉任务,图像的空间信息对于分割不同语义区域非常重要。大多数最先进的图像分割方法都是在全监督方式下进行的,依赖于大规模密集注释来训练深度网络。然而,为图像标注像素级标签是非常昂贵且耗时的,并且随着图像领域中各类应用任务越来越复杂以及各类任务所需要的数据量越来越大,人工标注工作所需的人力物力成本越来越高。同时,更多真实场景数据集不断涌现,数据集中的图像更加复杂和多样,这不仅导致了相关信息的完全标注越来越困难,而且标注的过程极易出错,难以保证标签的准确性。因此,保证图像分割效果的同时,如何减少对数据标签的依赖并降低数据标注的成本成为了深度神经网络发展过程中亟待解决的问题。
[0003]目标检测在卷积神经网络的推动下获得了显著发展,在ImageNet和Microsoft COCO这样的数据集中已经存在了大量可用的边界框注释。相对于像素级标注,边界框标注仅需要标注出图像中目标位置、类别和大致形状,省时省力。尽管边界框标注不如像素级标注精确,但仍然可以提升卷积神经网络在语义分割
【技术保护点】
【技术特征摘要】
1.一种基于前背景匹配的边界框弱监督图像分割方法,其特征在于,包括以下步骤:S1、将RGB通道输入图像转换至LAB通道送到全监督分割网络中得到前景分割结果;S2、将现有的边界框标注及步骤S1中得到的前景分割结果送入至本发明提出的掩码投影损失中计算优化分割网络,掩码投影损失将前景分割结果和边界框标注掩码都分别向X轴和Y轴做投影,这样将一整个矩形区域的强约束弱化为在两个方向上的投影约束,所述掩码投影损失表示如下:L
proj
=L(Proj
x
(p),Proj
x
(b))+L(Proj
y
(p),Proj
y
(b))=L(max
y
(p),max
y
(b))+L(max
x
(p),max
x
(b))其中,式中L(
·
,
·
)使用的是IoULoss,表示前景分割结果在Y轴上进行max操作,表示前景分割结果在X轴上进行max操作,Proj
x
(b)=max
y
(b)=l
x
表示边界框标注掩码在Y轴上进行max操作,Proj
y
(b)=max
x
(b)=l
y
表示边界框标注掩码在X轴上进行max操作;p∈(0,1)
H
×
W
为前景分割结果,是所有像素点为前景的概率集合,其范围为[0,1],0表示背景,1表示前景,H和W分别表示图像的高和宽;b∈(0,1)
H
×
W
表示由边界框生成的粗糙掩码即边界框标注掩码,边界框内部的掩码值为1,其余位置为0;S3、根据在领域中相似性高的像素点对其标签具有高一致性的特点,本发明提出领域像素一致性损失来增加经步骤S2约束后得到的前景分割结果的连通性,该领域像素一致性损失通过比较边界框内部每个像素点与其领域像素之间包括颜色、纹理在内的特征是否相似,来约束像素点对的前景分割结果要一致,所述领域像素一致性损失表示如下:其中,N表示像素点对个数,e∈E
inbox
表示边界框内部的连接边;表示连接边e的两个端点像素点(i,j)和(l,k)的相似情况,表示不相似,表示相似;y
e
=1表示连接边的两个端点像素点具有相同的标签结果;P(y
e
=1)表示y
e
=1的前景预测...
【专利技术属性】
技术研发人员:龙建武,刘东,杨诚鑫,任岩,曾子秦,
申请(专利权)人:重庆理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。