【技术实现步骤摘要】
一种基于改进Deeplabv3+的红外图像语义分割算法
[0001]本专利技术涉及视觉技术,属于图像处理领域,具体涉及一种基于改进Deeplabv3+的红外图像语义分割算法。
技术介绍
[0002]图像语义分割是将给定图像中每个像素进行分类,进而达到目标分割以及分类的目的。其在自动驾驶、姿态估计、图像搜索、医学诊断等领域,具有重要的应用价值,比如在自动驾驶领域,图像语义分割能够为汽车配备必要的感知能力,让汽车可以“观察”路况和周遭环境,从而使自动驾驶汽车能够安全地在道路上行驶。
[0003]目前语义分割算法多针对于可见光图像,相较于可见光图像,红外图像可以保存更多的信息,具有较强的穿透力,不受恶劣环境(雨、雪、雾天气等)和光照影响,而面向红外图像的语义分割研究较少;
[0004]红外图像语义分割和可见光图像语义分割具有相似性,目的都是将给定图像中每个像素进行分类,进而达到目标分割以及分类的效果,但在对红外图像进行语义分割仍存在一些问题,比如红外图像存在边缘模糊,纹理信息丢失严重等缺点,目前的语义分割算法在处理 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进Deeplabv3+的红外图像语义分割算法,其特征在于,具体包括以下步骤:S1:用红外相机采集图像并构建数据集;S2:构建语义分割网络结构:以DeepLabv3+为基准网络,经过主干网络的高级特征作为空洞卷积层输入,空洞卷积层输出后进行第一次上采样;经过第一次上采样的高级特征与经过一个残差模块处理的低级特征共同作为对偶分辨率模块的输入,对偶分辨率模块对低级特征与高级特征进行聚合并输出,并经过第二次上采样、再与低级特征进行拼接操作,最后经过双线性插值操作后进行结果输出;S4:训练红外图像语义分割网络;S5:用验证集进行验证、调参,并选出最优模型;S6:用测试集对选出的最优模型进行测试,评估模型性能。2.根据权利要求1所述的一种基于改进Deeplabv3+的红外图像语义分割算法,其特征在于,步骤S2中,经过一个残差模块处理的低级特征作为低分辨率分支的输入,经过第一次上采样的高级特征作为高分辨率分支的输入;对偶分辨率模块具有作用在低分辨率分支以捕获高层全局上下文信息的GPU友好注意力模块、以及作用在高分辨率分支对高层全局上下文信息进行传播扩散的跨分辨率注意力模块;其中GFA同时采用一个多轴门控模块并行捕获输入特征局部和全局信息。3.根据权利要求2所述的一种基于改进Deeplabv3+的红外图像语义分割算法,其特征在于,所述GPU友好注意力模块为一组矩阵操作,计算公式为:其中,X∈R
N
×
d
表示输入特征,N是图像中像素数量,d是特征维数;K
g
,V
g
为可学习矩阵,M
g
=M
×
H,M是参数维度,H是头的数量,GDN()表示双组重归一化,将原始双重归一化的第二次归一化拆分为H组。4.根据权利要求3所述的一种基于改进Deeplabv3+的红外图像语义分割算...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。