【技术实现步骤摘要】
本专利技术属于计算机视觉,具体涉及一种基于改进deeplabv3的城市街景语义分割方法。
技术介绍
1、语义分割是一种计算机视觉技术,旨在将图像中的每个像素分类到不同的对象类别中。它在城市景观中有广泛的应用,例如自动驾驶、交通管制和环境监测等。然而,城市景观的复杂性和多样性提高了模型对不同类别元素的分类准确度和分割精度。
2、deeplabv3是一个在语义分割中具有较好性能的网络模型,城市景观的复杂性和多样性元素的形状、大小和外观差异显著,现有的基于deeplabv3的语义分割方法难以同时准确分割不同大小和形状的物体。此外,城市环境中会常有物体遮挡和重叠现象,使得物体的边界变得复杂和模糊,降低了分割精度。
3、有鉴于此,本专利技术人提供一种基于改进deeplabv3的城市街景语义分割方法,以解决上述技术问题。
技术实现思路
1、本专利技术的目的在于克服上述现有技术的缺点,提出一种基于改进deeplabv3的城市街景语义分割方法,该方法包括改进deeplabv3语义分
...【技术保护点】
1.一种基于改进DeepLabV3的城市街景语义分割方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于改进DeepLabV3的城市街景语义分割方法,其特征在于,步骤1中,所述城市街景图像数据集选用Cityscapes数据集和/或GTA5数据集,并按照1.9~2.1:0.9~1.1:0.9~1.1的比例随机将城市街景图像数据集划分为训练数据、验证数据和测试数据。
3.根据权利要求1所述的基于改进DeepLabV3的城市街景语义分割方法,其特征在于,步骤1中,所述数据增强是采用平均融合对训练数据进行随机裁剪和随机水平翻转图像,所述平均融
...【技术特征摘要】
1.一种基于改进deeplabv3的城市街景语义分割方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于改进deeplabv3的城市街景语义分割方法,其特征在于,步骤1中,所述城市街景图像数据集选用cityscapes数据集和/或gta5数据集,并按照1.9~2.1:0.9~1.1:0.9~1.1的比例随机将城市街景图像数据集划分为训练数据、验证数据和测试数据。
3.根据权利要求1所述的基于改进deeplabv3的城市街景语义分割方法,其特征在于,步骤1中,所述数据增强是采用平均融合对训练数据进行随机裁剪和随机水平翻转图像,所述平均融合的计算公式如下所示:
4.根据权利要求1所述的基于改进deeplabv3的城市街景语义分割方法,其特征在于,步骤2中,建立改进deeplabv3语义分割网络模型包括以下步骤:
5.根据权利要求4所述的基于改进deeplabv3的城市街景语义分割方法,其特征在于,步骤2.1中,所述改进的resnet50特征提取网络包括第一层卷积层和最大池化层,去除了平均池化层和全连接层,且所述第一层卷积层和最大池化层的步长从2调整为1。
6.根据权利要求4所述的基于改进deeplabv3的城市街景语义分割方法,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。