【技术实现步骤摘要】
一种基于STDC网络的图像实时语义分割方法及装置
[0001]本公开属于图像处理领域,具体涉及一种基于
STDC
网络的图像实时语义分割方法及装置
。
技术介绍
[0002]近年来,深度卷积神经网络逐渐应用于语义分割任务,并取得了较高的分割准确度
。
然而,多数依赖深度卷积神经网络的算法具有较高的计算复杂度,无法满足实时分割任务的需求
。
[0003]现有的用于语义分割的深度卷积网络包括
SegNet、DeepLab、RefineNet
和
PSPNet
等,这些基于
DCNN
的方法在公共的基准数据集上能够显示出优秀的分割结果,然而这些语义分割方法大多基于复杂的主干网络,含有数千个通道,并且网络深度多达数百层
。
尽管这些方法可以实现较高的准确性,但准确性的提高意味着更复杂的计算操作以及更高的内存消耗,从而降低了分割速度
。
例如,
PSPNet
在语义分割任务中具有较高的分割准确度,但其包含大量参数,推理速度低于
1FPS
,显然,这对于需要实时操作的应用来说是不可行的,如自动驾驶
、
机器人等
。
因此,在现实场景中,如何在高分辨率图像下保持高推理速度以及高准确性是当前语义分割算法面临的关键问题
。
技术实现思路
[0004]针对现有技术中的不足,本公开的目的在于提供一种基于
STD ...
【技术保护点】
【技术特征摘要】
1.
一种基于
STDC
网络的图像实时语义分割方法,其特征在于,所述方法包括以下步骤:
S100
:采集输入图像;
S200
:对输入图像进行数据增强;
S300
:构建基于轻量级网络
STDC
的实时语义分割模型并训练;其中,所述模型采用编码器和解码器结构,编码器以轻量级网络
STDC
为主干网络,编码器后设置有混合池化注意力模块,用于捕获不同感受野的上下文信息;解码器中设置有基于通道注意力的特征融合模块,用于对不同层次的特征进行选择;
S400
:将数据增强后的输入图像输入训练好的模型中,以实现对输入图像进行实时语义分割
。2.
根据权利要求1所述的方法,其特征在于,优选的,步骤
S200
中,所述对输入图像进行数据增强包括以下方法:对输入图像进行颜色抖动
、
随机水平翻转
、
随机裁剪以及随机缩放
。3.
根据权利要求1所述的方法,其特征在于,步骤
S300
中,所述模型通过以下方法进行训练:
S301
:获取训练数据集,对数据集进行数据增强,将数据增强后的数据集划分为训练集
、
验证集和测试集;
S302
:设置训练参数,利用训练集对模型进行训练,当达到预设训练次数,模型训练完成;
S303
:利用验证集对训练后的模型进行验证,在验证过程中,以每秒帧数
FPS
和平均交并比
mIoU
作为评价指标对模型进行评价,当
mIoU
为
71.2/74.6
,且
FPS
为
250.4/126.7
时,模...
【专利技术属性】
技术研发人员:马素刚,赵子一,侯志强,余旺盛,蒲磊,杨小宝,
申请(专利权)人:西安邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。