【技术实现步骤摘要】
基于参数重要性增量学习的语义分割方法
本专利技术属于图像识别和计算机视觉
,主要涉及一种增量学习的语义分割方法,可用于自动驾驶、机器人
、前景分割等领域。
技术介绍
语义分割是指根据颜色、灰度和纹理等特征,将图像划分成若干个互不相交且具有某种特定语义含义的像素区域,并识别出每个区域的类别,同一区域的像素被赋予相同的颜色,最终获得一幅具有像素语义标注的图像。在深度学习应用到计算机视觉领域之前,研究人员一般使用纹理基元森林(TextonForest)或是随机森林(RandomForest)等传统方法来构建用于语义分割的分类器。随机森林由多个决策树独立预测出样本的类别,通过对所有预测类别进行投票,票数最高的类别被选举为最终的预测结果。纹理基元森林则结合了图像纹理特征构建分类器,有效地提高了分类的精度。但是传统方法相对复杂,计算量大,其所利用的手工特征需要领域专门知识,耗时耗力,无法实现实时的要求,而且有时太过精细化以致于只能在某个特定的场景下使用,对于拥有复杂、多变细节的图像,很难达到高精度。目前,基于深度学习的语义分割方法正受到广泛关注,其主要思想是利用提前标注训练样本的真实标签,将图像作为网络的输入,得到网络的语义分割结果,再依据标签对结果进行计算,通过反向传播更新模型参数。基于深度学习的语义分割方法是数据驱动的方法,在没有数据的情况下不能进行学习。而很多时候我们并不能拿到所有的数据,并且对所有数据上的每个点进行标注。所以在新数据和其标注产生时,需要对语义分割网络进行增量式训练,使得语义分割 ...
【技术保护点】
1.一种基于参数重要性增量学习的语义分割方法,其特征在于,包括如下步骤:/n(1)构建基础数据集及测试数据集:/n对获取的类别数为E且每个类别包含S幅图像中每个类别半数以上的图像进行标注,并将每个类别半数以上的图像及其标签作为基础数据集,将其余部分的图像作为测试数据集,其中10≤E≤500,100≤S;/n(2)搭建语义分割神经网络模型W:/n搭建包括顺次连接的图像语义特征提取网络、语义特征扩展网络和像素分类网络的语义分割神经网络,其中语义特征提取网络包括多个卷积层和多个池化层,语义特征扩展网络包括多个反卷积层,像素分类网络包括多个卷积层;/n(3)对语义分割神经网络模型进行迭代训练:/n(3a)初始化服从标准正态分布的(-1,1)之间的随机值θ为语义分割神经网络的权重参数,θ的重要性权重为W
【技术特征摘要】
1.一种基于参数重要性增量学习的语义分割方法,其特征在于,包括如下步骤:
(1)构建基础数据集及测试数据集:
对获取的类别数为E且每个类别包含S幅图像中每个类别半数以上的图像进行标注,并将每个类别半数以上的图像及其标签作为基础数据集,将其余部分的图像作为测试数据集,其中10≤E≤500,100≤S;
(2)搭建语义分割神经网络模型W:
搭建包括顺次连接的图像语义特征提取网络、语义特征扩展网络和像素分类网络的语义分割神经网络,其中语义特征提取网络包括多个卷积层和多个池化层,语义特征扩展网络包括多个反卷积层,像素分类网络包括多个卷积层;
(3)对语义分割神经网络模型进行迭代训练:
(3a)初始化服从标准正态分布的(-1,1)之间的随机值θ为语义分割神经网络的权重参数,θ的重要性权重为Wθ,学习速率为α,迭代次数为k,最大迭代次数为K,K≥106,并令k=0,Wθ=0,α=0.001;
(3b)将从基础数据集不放回随机选取的R幅图像作为语义分割神经网络模型的输入进行前向传播,图像语义特征提取网络提取每幅图像的语义特征图,语义特征扩展网络对每幅语义特征图进行扩展,得到与原图像大小相等的R幅像素语义特征图,像素分类网络对每幅像素语义特征图进行分类,得到R幅图像每个像素的分类结果,当基础数据集中图像数量不足R幅时,将之前选取的图像放回基础数据集之后再进行不放回随机选取,其中256≥R≥32;
(3c)采用交叉熵损失函数,通过R幅图像的标签和语义分割神经网络输出的R幅图像上每个像素的分类结果,计算语义分割神经网络的分割损失L,并计算分割损失L对语义分割神经网络的权重参数θ的导数dθ,再将dθ作为参数θ的梯度,使用梯度dθ对参数θ的重要性权重Wθ和参数θ进行更新;
(3d)判断k≥0.5×K是否成立,若是,令α=0.0002,并执行步骤(3e),否则,令k=k+1,并执行步骤(3b);
(3e)判断k≥K是否成立,若是,得到训练后的语义分割神经网络模型W',否则,令k=k+1,并执行步骤(3b);
(4)构建增量式数据集和增量式测试数据集:
对获取的类别数为N且每个类别包含Z幅图像中每个类别半数以上的图像进行标注,并将每个类别半数以上的图像及其标签作为增量式数据集,将其余部分的图像添加到步骤(1a)所构建的测试数据集中,得到增量式测试数据集,其中2≤N≤100,100≤Z;
(5)对训练后的语义分割神经网络模型W'进行迭代训练:
(5a)对训练后的语义分割神经网络模型W'进行复制,将其中一个作为参考语义分割神经网络模型T',另一个作为基本语义分割神经网络模型T;
(5b)将N个卷积核添加到基本神经网络模型T的像素分类网络的最后一个卷积层中,构成增量语义分割神经网络模型G,并通过T中像素分类网络的最后一个卷积层中背景类别对应卷积核的参数θb,初始化G中像素分类网络的最后一个卷积层中新添加的N个卷积核的参数
其中,表示基本神经网络模型T的像素分类网络的最后一个卷积层中背景类别对应卷积核的参数的均值,σb表示基本神经网络模型T的像素分类网络的最后一个卷积层中背景类别对应卷积核的参数的方差;
(5...
【专利技术属性】
技术研发人员:谢雪梅,于凯,李旭阳,
申请(专利权)人:西安电子科技大学,昆山鲲鹏无人机科技有限公司,
类型:发明
国别省市:陕西;61
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。