【技术实现步骤摘要】
一种基尼指数引导的基于自训练的语义分割方法
[0001]本专利技术涉及一种基于自训练的领域自适应语义标注方法,在伪标签的选取上与传统方法不同,以基尼指数为依据确定伪标签,属于模式识别与计算机视觉领域,可应用于自动驾驶、机器人视觉导航技术中。
技术介绍
[0002]基于自训练的领域自适应语义分割方法使用的数据有两类:有标签的源域数据和无标签的目标域数据,源域采用标签作为监督信息,目标域采用伪标签作为监督信息,基于监督信息对网络进行训练,进而学习一个对目标域图像有较好的语义标注效果的模型。精确的无监督领域自适应语义分割对于模型学习阶段和使用阶段存在明显数据差异的应用至关重要,如自动驾驶、机器人导航等。
[0003]基于自训练的无监督领域自适应的主要思想是创建伪标签,并把伪标签作为训练阶段目标域图像的真实标签。基于自训练的无监督领域自适应方法需要解决的最大的问题是如何获取正确的伪标签,错误的伪标签可能最终导致“确认偏差”,即错误的伪标签作为监督信息使用时成为噪声使得训练得到的模型表达性能更差。
[0004]为了有效 ...
【技术保护点】
【技术特征摘要】
1.一种基尼指数引导的基于自训练的语义分割方法,其特征在于:利用合成数据集作为源域,真实数据集为目标域;训练时,在域间自适应网络输入源域和目标域图像进行训练,训练完成后,将目标域图像进行划分输入到域内自适应网络进行训练,得到最优分割结果;具体方法步骤如下:步骤(1),将源域数据集和目标域数据集随机各取一张RGB图像作为一个batch输入语义分割网络G
te
;步骤(2),对源域图像,基于网络最后两层的输出预测图和groundtruth计算交叉熵损失,并将源域最后两层的损失进行加权求和;步骤(3),对目标域图像,最后两层的输出预测图分别计算基尼指数及不确定性损失,并将目标域最后两层的损失加权求和;步骤(4),将步骤(2)计算的加权损失和步骤(3)计算的加权损失进行求和,利用误差反向传播优化模型,迭代到模型的损失小于一定阈值后,这一batch数据训练结束;步骤(5),回步骤1继续选取新的batch数据,重复步骤1到步骤5直到完成2000个batch的训练并保存所训练的模型;步骤(6),重复步骤(1)至步骤(5)直到共训练120000个batch数据,即一共保存60个模型;步骤(7),将保存的60个模型在目标域验证集进行测试,利用准确率最好的模型计算目标域训练集图像的输出预测,计算输出预测对应的基尼指数并基于基尼指数对目标域训练集图像赋予伪标签;步骤(8),将源域数据集和目标域数据集随机各取一张RGB图像作为一个batch作为输入,训练语义分割网络G
...
【专利技术属性】
技术研发人员:王立春,胡玉杰,王少帆,孔德慧,李敬华,尹宝才,
申请(专利权)人:北京工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。