基于轻量级卷积神经网络模型的实时图像语义分割方法技术

技术编号:24500523 阅读:97 留言:0更新日期:2020-06-13 04:54
本发明专利技术公开一种基于轻量级卷积神经网络的实时图像语义分割的方法,主要解决现有技术通过牺牲分割精度换取推理速度提升的问题,其步骤为:1)从公开网站中分别下载训练集、验证集、测试集及预训练后的ESPNetV2通用网络模型;2)搭建共享连接自适应单元作为解码器,用ESPNetV2网络作为编码器,并用该解码器和编码器构建轻量级卷积神经网络模型;3)利用训练集以及验证集,对轻量级神经网络进行训练,获得训练好的图像语义分割模型;4)将测试集输入到训练好的图像语义分割模型中,得到图像语义分割结果。本发明专利技术提高了分割的速度和准确度,可用于解决自动驾驶中前方道路上人、车,建筑物以及交通标志的分割。

Real time image semantic segmentation based on lightweight convolutional neural network model

【技术实现步骤摘要】
基于轻量级卷积神经网络模型的实时图像语义分割方法
本专利技术属于图像处理
,更进一步涉及一种实时图像语义分割方法,可用于解决自动驾驶中前方道路上人、车,建筑物以及交通标志的分割。
技术介绍
语义分割,是计算机视觉的基础任务之一,在语义分割中需要将图像输入分割为不同的语义可解释类别。语义的可解释性,即分类类别在真实世界中是有意义的。例如,需要区分图像中属于汽车的所有像素,并把这些像素标记为蓝色。与图像分类或目标检测相比,语义分割对图像有更加细致的理解。这种理解在诸如自动驾驶、机器人感知以及图像搜索引擎等许多领域具有至关重要的作用。通常采用编码器-解码器结构搭建语义分割网络模型,编码器通常是一个预训练后的分类网络模型,负责提取图像中粗糙的语义特征和对图像进行降采样。解码器,通常根据实际应用场景进行搭建对应的卷积神经网络模型,负责对降采样后特征图上采样恢复到原始图像分辨率。目前,基于深度卷积神经网络模型的语义分割方法虽然具有非常不错的性能,但这些性能的提升往往是通过牺牲了运行速度而获得的,这样导致很难将其应用到现实的应用场景中,本文档来自技高网...

【技术保护点】
1.一种基于轻量级卷积神经网络的实时图像语义分割的方法,其特征在于,包括以下步骤:/n(1)从开源数据集网站中下载Cityscapes训练集、验证集、测试集;/n(2)从GitHub开源网站下载预训练后的ESPNetV2通用网络模型;/n(3)设计以左右结构搭建的共享连接自适应单元:/n(3a)设置由一个卷积层构成的单元右半结构;/n(3b)构建特征图加法模块,即以两个分辨率大小相同的特征图作为输入,分别将两个输入中具有相同通道索引的特征图提取出来进行逐点相加操作后,再将相加后的新特征图按照原始通道索引并行连接;/n(3c)构建特征图减法模块,即以两个分辨率大小相同的特征图作为输入,分别将两个...

【技术特征摘要】
1.一种基于轻量级卷积神经网络的实时图像语义分割的方法,其特征在于,包括以下步骤:
(1)从开源数据集网站中下载Cityscapes训练集、验证集、测试集;
(2)从GitHub开源网站下载预训练后的ESPNetV2通用网络模型;
(3)设计以左右结构搭建的共享连接自适应单元:
(3a)设置由一个卷积层构成的单元右半结构;
(3b)构建特征图加法模块,即以两个分辨率大小相同的特征图作为输入,分别将两个输入中具有相同通道索引的特征图提取出来进行逐点相加操作后,再将相加后的新特征图按照原始通道索引并行连接;
(3c)构建特征图减法模块,即以两个分辨率大小相同的特征图作为输入,分别将两个输入中具有相同通道索引的特征图提取出来进行逐点相减操作后,再将相减后的新特征图按照原始通道索引并行连接;
(3d)构建共享连接模块,即以四个分辨率大小相同的特征图作为输入,分别将两个输入中具有相同通道索引的特征图提取出来并行连接,再将并行连接后的新特征图按照原始通道索引并行连接;
(3e)构建单元右半结构,即将特征图加法模块和特征图减法模块先并行连接,再依次连接共享连接模块、分组卷积层和上采样层;
(3f)将单元左半结构和右半结构进行连接,构成共享连接自适应单元;
(4)搭建轻量级卷积神经网络模型:
(4a)使用预训练后的ESPNetV2通用网络模型作为编码器模块;
(4b)依次连接2个共享连接自适应单元作为编码器模块;
(4c)将编码器和解码器按照U型结构进行连接,形成轻量级卷积神经网络模型;
(5)利用Cityscapes训练集以及验证集,采用随机梯度下降优化算法和基于轮数的多项式学习策略对轻量级神经网络进行训练,获得训练好的实时图像语义分割模型;
(6)将Cityscapes测试集输入到训练好的实时图像语义分割模型中,得到图像语义分割结果。


2.根据权利要求1所述的方法,其特征在于,(3a)中的卷积层,其该卷积层的卷积核大小为3*3,步长为1,输出通道数为网络待分割物体类别数。


3.根据权利要求1所述的方法,其特征在于,(3e)中的分组卷积层,其卷积核大小为3*3、步长为1、分组数量为网络待分割物体类...

【专利技术属性】
技术研发人员:王云江贺斌石莎肖卓彦熊星宇
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1