【技术实现步骤摘要】
一种无监督领域自适应语义分割方法及系统
[0001]本专利技术涉及数据处理
,尤其涉及一种无监督领域自适应语义分割方法及系统。
技术介绍
[0002]神经网络在许多计算机视觉任务中取得了显著的成功,包括图像分类、目标检测和语义分割等。然而,网络模型获得高性能的前提是大量高质量的标注数据。对于语义分割任务而言,这种需求更为迫切,因为它所的标注数据是像素级别的。例如,人工标注像Cityscapes这种包含数千张图片的数据集中的一张图片,所花费的时间在1.5到2小时左右。为了避免高昂的标注成本,使用自动注释的合成图像训练模型成为一种替代的方法。然而,源域的合成图片数据集和目标域的真实图片数据集之间存在着不可忽视的分布差异,这种分布差异使得源域上训练得到的网络模型在真实应用场景上表现的很差。
[0003]为了解决上述问题,无监督领域自适应技术被用来对齐源域数据集与目标域数据集的数据分布。目前应用在语义分割领域的无监督领域自适应方法主要为自训练方法中的子类Teacher
‑
Student模型方法。Tea ...
【技术保护点】
【技术特征摘要】
1.一种无监督领域自适应语义分割方法,其特征在于,包括以下步骤:获取标注完全的源域数据和无标签的目标域数据;构建Teacher网络模型和Student网络模型;基于所述Teacher网络模型和所述Student网络模型对所述源域数据和所述目标域数据进行训练,得到语义损失、源域交叉熵损失和目标域交叉熵损失;基于所述语义损失、所述源域交叉熵损失和所述目标域交叉熵损失得到最终目标函数;基于所述最终目标函数迭代更新所述Student网络模型的模型参数,得到第一模型参数;使用所述第一模型参数采取指数移动平均值策略更新所述Teacher网络模型的模型参数,最终获取的Student模型为语义分割模型;将主流数据集输入所述语义分割模型进行实验验证,得到语义分割结果。2.如权利要求1所述的无监督领域自适应语义分割方法,其特征在于,所述Teacher网络模型和所述Student网络模型具有相同的结构,均包括特征提取器和线性分类器;所述特征提取器包括基于卷积网络的特征提取器和基于Transformer的特征提取器中的任意一种。3.如权利要求2所述的无监督领域自适应语义分割方法,其特征在于,所述基于卷积网络的特征提取器为ResNet101;所述基于Transformer的特征提取器包括SegFormer。4.如权利要求3所述的无监督领域自适应语义分割方法,其特征在于,所述特征提取器要经过数据集的预训练。5.如权利要求4所述的无监督领域自适应语义分割方法,其特征在于,所述数据集包括ImageNet数据集。6.如权利要求5所述的无监督领域自适应语义分割方法,其特征在于,所述基于所述Teacher网络模型和所述Student网络模型对所述源域数据和所述目标域数据进行训练,得到语义损失、源域交叉熵损失和目标域交叉熵损失,包括:基于所述Teacher网络模型和所述Student网络模型采用端到端的训练方法,同时加载所述源域数据和所述目标域数据进行训练,得到语义损失、源域交叉熵损失和目标域交叉熵损失。7.如权利要求6所述的...
【专利技术属性】
技术研发人员:徐行,谢君,周宜暄,沈复民,申恒涛,
申请(专利权)人:成都考拉悠然科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。