一种基于框标注的弱监督图像分割方法技术

技术编号:32032046 阅读:45 留言:0更新日期:2022-01-27 13:08
本发明专利技术提出一种基于框标注的弱监督图像分割方法,所述图像分割方法可分为三个步骤:步骤1、初始化输入;步骤2、深度学习模型;步骤3、规范化输出。所述步骤1中的初始化输入是完成图像转换为深度学习数据;所述步骤2中的深度学习模型是依据深度学习原理,具体为通过堆叠卷积计算,池化计算以及各类激活函数实现一个复杂的深度学习模型结构,最终搭建一个端到端的图像分割模型;所述步骤3中的规范化输出分为两阶段:训练阶段和应用阶段,训练阶段和应用阶段不同点在于在规范化输出中对深度学习模型的计算结果进行不同处理方式,以达到训练模型的效果和现实应用的功能。练模型的效果和现实应用的功能。练模型的效果和现实应用的功能。

【技术实现步骤摘要】
一种基于框标注的弱监督图像分割方法


[0001]本专利技术涉及一种基于框标注的弱监督图像分割方法,属于计算机视觉领域。

技术介绍

[0002]图像分割是图像理解的关键组成部分,促进了计算机视觉领域的深层次应用,比如自动驾驶、姿态估计、图像合成等。在这些实际应用中,图像分割的功能往往是优于目标检测的,因为一个目标掩码将比一个目标框更加准确。即使某些实际应用需要目标框,我们也能对目标掩码取外接矩形框得到目标框,而对于整个模型而言,格外的计算成本几乎可以忽略不计。但在诸多现实情况中,图像分割并没有得到像目标检测一样广泛应用。在实际使用中我们发现阻碍图像分割的主要障碍不是实时处理的速度和精度,而是较为严格的像素级标注。像素级标注是对图像中每个像素都标注一个确定的类别,因此这种标注方式需要大量的人力、时间和资金支持。为了减轻高昂的标注成本给图像分割的实用性带来的限制,我们使用一种低质量标注——目标框标注,实现弱监督训练图像分割模型并达到实用性的性能要求。

技术实现思路

[0003]专利技术目的:提出一种基于框标注的弱监督图像分割方法,实现本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于框标注的弱监督图像分割方法,其特征在于,包括如下步骤:步骤1、初始化输入:完成图像转换为深度学习数据;步骤2、建立深度学习模型:搭建一个端到端的图像分割模型;步骤3、规范化输出:输出对深度学习模型的计算结果。2.根据权利要求1所述的一种基于框标注的弱监督图像分割方法,其特征在于,所述步骤1中的初始化输入具体为:步骤11、数据输入:首先将图像转存入计算机中;步骤12、数据增强:将图像做一些格外的处理,包含图像大小的随机改变、图像的随机翻转、图像色彩的随便变换、图像随机裁剪,通过使用这些数据增强,在原有图像的基础上尽可能地丰富图像样式,以拟合在现实场景中各种实际变化;步骤13、数据转换:使用图像读取代码实现图像数据转换到深度学习数据。3.根据权利要求1所述的一种基于框标注的弱监督图像分割方法,其特征在于,所述步骤2中的建立深度学习模型具体步骤如下:步骤21、定义模型结构:定义模型中各模块的结构和次序关系;步骤22、实现模型结构:基于Pytorch代码库,根据定义按次序依次实现相应的模型结构;步骤23、编译模型:代码编译过程,判断当前实现过程中是否存在问题;步骤24、配置模型:设置模型参数和超参数。4.根据权利要求3所述的一种基于框标注的弱监督图像分割方法,其特征在于,所述深度学习模型结构包含如下三层:卷积层:对多通道输入进行多个卷积操作,每个卷积产生一个通道的输出,因此可以得到多个通道的输出,卷积定义为:其中z[x,y]是计算结果,g[x,y]是输入数据,f[x,y]是卷积核,*表示卷积操作;激活层:对输入的每个数值通过激活函数进行修改,得到相同大小的输出,该函数使用Relu函数:f(x)=max(0,x);池化层:对输入数据按比例进行采样,其采样方法表示为:f(X)=max([X])。5.根据权利要求1所述的一种基于框标注的弱监督图像分割方法,其特征在于,所述步骤3中的规范化输出包括2个阶段,训练阶段和应用阶段。6.根据权利要求5所述的一种基于框标注的弱监督图像分割方法,其特征在于,所述训练阶段的图像分割处理方具体步骤为:步骤31、将目标框的标注转换为图像表示,其中目标框内的区域设置为1,框外区域设置为0;步骤32、采用三种方法来指导模型学习目标框提供的目标信息,三种指导方法分别是向量指导、点指...

【专利技术属性】
技术研发人员:姜振涛程健
申请(专利权)人:中科南京人工智能创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1