【技术实现步骤摘要】
对图像进行语义分割的方法及装置
[0001]本专利技术涉及图像处理中的语义分割,特别地,本专利技术涉及对图像进行语义分割的方法和系统。
技术介绍
[0002]在图像处理中,对图像的语义分割在很多领域都有着重要的应用,比如自动驾驶,人机交互以及虚拟现实等。语义分割的主要任务是对输入图像的每一个像素点进行分类。随着深度学习技术的发展,现在的语义分割任务主要由深度学习技术完成。而深度学习中,使用全监督或弱监督方式进行图像的语义分割获得广泛关注。全监督方式训练分割网络要求的标注成本较高。而弱监督方式训练分割网络能够克服这一问题。例如,在使用弱监督训练分割网络对图像进行的语义分割中,图像级标注需要的标注成本最低:只需要给定输入图像以及给定图像前景中存在类别的标签。实现图像级标注语义分割要使用图像的类激活图,因而类激活图对最终图像分割结果的精度有较大影响。现有方法生成的类激活图精确度不够高造成图像的语义分割结果不够准确。
技术实现思路
[0003]根据本专利技术的一个方面,公开了一种对图像的初始的类激活图进行修正的方法, ...
【技术保护点】
【技术特征摘要】
1.一种对图像的初始的类激活图进行修正的方法,其特征在于,包括:获取图像的超像素信息;利用所述超像素信息将所述图像分成多个区域,并获取所述多个区域中每个区域的相关信息,其中所述相关信息包括:与该区域相邻的区域以及该区域的所有像素;获取所述图像的初始类激活图,所述类激活图是所述图像中的所有像素分类到所述图像中所含对象的类别中各个类别的概率值,特定类别的概率值为特定类别的激活值;以及基于所述图像的所述多个区域中每个区域的相关信息对所述图像的所述初始类激活图进行修正。2.根据权利要求1所述的方法,其特征在于,基于所述图像的所述多个区域中每个区域的相关信息对所述图像的所述初始类激活图进行修正,包括:所述类别包括多个第一特定类别,对多个类别的每一第一特定类别执行如下步骤:将所述多个区域的每个区域的第一特定类别处理状态初始化为未处理;对所有未处理区域循环执行如下步骤:获得第一特定类别处理状态为未处理的所有区域中的像素对应的所述第一特定类别上的激活值为最大激活值的第一像素,所述第一像素的所述第一特定类别上的激活值为第一激活值;判断所述第一激活值是否大于第一预设阈值;响应于所述第一激活值不大于第一预设阈值,结束对所有未处理区域循环执行的处理;响应于所述第一激活值大于第一预设阈值,根据所述图像的所述多个区域的每个区域的相关信息,获得所述第一像素对应的第一区域;判断所述第一区域中包含的所有像素所述第一特定类别上的激活值是否满足预设条件;响应于所述第一区域中包含的所有像素所述第一特定类别上的激活值满足预设条件,使所述第一区域中包含的所有像素的所述第一特定类别上的激活值为所述第一激活值,定义所述第一区域为域内激活区域;以及更新所述第一区域的处理状态为已处理。3.根据权利要求2所述的方法,其特征在于,其中所述预设条件包括以下之一:所述第一区域内所有像素的在第一特定类别的类激活值均大于用户设定的类激活值;所述第一区域内一定比例像素的在第一特定类别的类激活值大于用户设定的类激活值;以及所述第一区域内所有像素的在第一特定类别的类激活值平均值大于用户设定的类激活值。4.根据权利要求1所述的方法,其特征在于,基于所述图像的所述多个区域中每个区域的相关信息对所述图像的所述初始类激活图进行修正,进一步包括:响应于所述第一区域中包含的所有像素所述第一特定类别上的激活值不满足所述预设条件,使所述第一区域中大于预设阈值的像素的所述第一特定类别上的激活值为第二激活值,并更新所述第一区域的第一特定类别处理状态为已处理。
5.根据权利要求4所述的方法,其特征在于,其中所述第二激活值为以下之一:所述第一区域内除所述第一特定类别激活值满足所述预设条件的像素之外的其他像素的所述第一特定类别上的激活值的平均值;所述第一区域内除所述第一特定类别激活值满足所述预设条件的像素之外的其他像素的所述第一特定类别上的激活值的中间值;所述第一区域内除所述第一特定类别激活值满足所述预设条件的像素之外的其他任意像素的所述第一特定类别上的激活值;以及用户预设的激活值。6.根据权利要求1所述的方法,其特征在于,基于所述图像的所述多个区域中每个区域的相关信息对所述图像的所述初始类激活图进行修正,进一步包括:对所述多个类别的每一第一特定类别执行如下步骤:根据该图像的第一特定类别的域内激活区域中的每个区域中的像素的激活值以及所述多个区域的每个区域的相关信息中包括的与该区域相邻的区域,执行所述图像的域间激活值传播。7.根据权利要求6所述的方法,其特征在于,其中执行所述图像的域间激活值传播,包括:将所述域内激活区域中的每个区域的第一特定类别处理状态初始化为未处理;对所有未处...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。