【技术实现步骤摘要】
一种基于图像清晰度的车辆图像语义分割方法
本专利技术属于计算机视觉
,具体涉及基于深度学习的语义分割技术,针对车辆图像这一特定类别,结合图像清晰度获得更高精确度的语义分割结果。
技术介绍
图像语义分割技术作为计算机视觉领域经典和基础研究课题,不仅应用广泛,在场景解析、自动驾驶、人机交互、图像搜索引擎等领域具有重要意义,而且对于后续处理图像内容将产生直接影响,所以一直以来,图像语义分割技术都是计算机视觉领域最为活跃的一部分,许多研究人员先后对此做出巨大贡献。图像语义分割是从像素水平,识别、理解并区分图像中的内容,对图像中的每一个像素点予以相应的类别,因此也可以将之视为密集预测问题,这是一项富有挑战性和意义的课题。传统的语义分割主要有两大类,基于非监督的分割方法和基于概率图模型的分割方法。基于非监督的分割方法通常依靠提取图片的低级特征,检测一致的区域或区域的边界,从而获得分割的结果,但分割的结果没有语义的标注,因此不能算作严格意义上的语义分割。基于概率图的分割方法则是利用参数统计方法,基于几个简单的特征对图 ...
【技术保护点】
1.一种基于图像清晰度的车辆图像语义分割方法,其特征在于包括如下步骤:/n步骤1:数据集处理/n从VeRi数据集中选取2000张作为训练图像集,选取1000张图像作为测试图像集,并对训练图像数据集进行数据增强操作,使训练图像的数量增加到10000张;/n步骤2:初始化语义分割主干网络;/n导入DeeepLab V3+网络对应层的参数,对语义分割主干网络进行初始化,加速训练过程中网络收敛所需时间;/n步骤3:训练添加有清晰度判别模块的语义分割主干网络;/n步骤4:对测试图像集进行语义分割。/n
【技术特征摘要】
1.一种基于图像清晰度的车辆图像语义分割方法,其特征在于包括如下步骤:
步骤1:数据集处理
从VeRi数据集中选取2000张作为训练图像集,选取1000张图像作为测试图像集,并对训练图像数据集进行数据增强操作,使训练图像的数量增加到10000张;
步骤2:初始化语义分割主干网络;
导入DeeepLabV3+网络对应层的参数,对语义分割主干网络进行初始化,加速训练过程中网络收敛所需时间;
步骤3:训练添加有清晰度判别模块的语义分割主干网络;
步骤4:对测试图像集进行语义分割。
2.根据权利要求1所述的一种基于图像清晰度的车辆图像语义分割方法,其特征在于步骤3具体实现如下:
将输入图像和对应的groundtruth导入到语义分割主干网络中,首先经过清晰度判别模块,对每一张输入图像依次进行如下操作:
D(f)=∑y∑x|G(x,y)|(1)
其中,(x,y)对应输入图像的每一个像素点,而G(x,y)的计算方式为:
其中,Gx(x,y)是像素点(x,y)处于Sobel水平方向边缘检测算子gx的卷积,Gy(x,y)是像素点(x,y)处于Sobel垂直方向边缘检测算子gy的卷积,算子gx和gy分别为:
将清晰度判别模块计算所得的D(f)作为清晰度损失函数导入到总损失函数中:
LD=-logD(f)(5)
将输入车...
【专利技术属性】
技术研发人员:颜成钢,沈少强,孙垚棋,张继勇,张勇东,
申请(专利权)人:杭州电子科技大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。