基于门控对齐网络的城市场景实时语义分割方法技术

技术编号:43398720 阅读:30 留言:0更新日期:2024-11-19 18:16
本发明专利技术公开了一种基于门控对齐网络的城市场景实时语义分割方法,包括:获取城市场景数据集并进行数据预处理,按比例将数据集划分成训练集、验证集和测试集;搭建门控对齐网络,所述门控对齐网络包括编码器模块和解码器模块;利用训练集、验证集对门控对齐网络进行训练,获得最优网络模型;将测试集输入到最优网络模型,得到城市场景图像语义分割结果。本发明专利技术利用最优门控对齐网络模型实现了对城市场景常见人和物的实时语义分割,有效提取上下文信息、融合低层细节和高层语义、减少冗余计算、实现实时语义分割中精度和推理速度的平衡。

【技术实现步骤摘要】

本专利技术属于图像语义分割,具体涉及一种基于门控对齐网络的城市场景实时语义分割方法


技术介绍

1、语义分割作为计算机视觉领域的前沿研究,旨在为图像的每个像素分配具体的语义标签,为实现更智能的图像理解和分析打下基础。深度卷积神经网络在语义分割任务中的成功应用标志着这一领域的飞速发展,尤其是全卷积网络的提出推动了深度学习在图像语义分割中的广泛应用。

2、尽管以往的研究在提高模型精度方面取得显著进展,但也面临着计算资源消耗大、存储需求高等挑战,特别是对于终端设备的实时语义分割应用,这些问题更为显著。编码器-解码器结构在语义分割网络设计中占据主导地位,但在追求高效性和轻量级方面的需求下,现有实时网络更加注重简化网络结构以提升推理速度。然而,这种简化过程通常伴随着模型精度的下降。城市场景背景复杂,人和物目标尺寸较小,难以兼顾高效性和轻量级需求,因此,构建高性能的适用于城市场景的实时语义分割网络成为当前研究的重要方向。

3、专利公开号为cn115995002b的专利技术中公开了一种网络构建方法及城市场景实时语义分割方法,利用骨干网络、条形池化本文档来自技高网...

【技术保护点】

1.一种基于门控对齐网络的城市场景实时语义分割方法,其特征在于,所述城市场景实时语义分割方法包括以下步骤:

2.根据权利要求1所述的基于门控对齐网络的城市场景实时语义分割方法,其特征在于,步骤S1进一步包括:

3.根据权利要求1所述的基于门控对齐网络的城市场景实时语义分割方法,其特征在于,所述骨干网络包括依次连接的5个卷积块,将提取第二个卷积块输出的原图1/4大小的低级特征图X2和第五个卷积块输出的原图1/32大小的高级特征图X5输入金字塔池化对齐模块;

4.根据权利要求1所述的基于门控对齐网络的城市场景实时语义分割方法,其特征在于,所述门控对齐模块包...

【技术特征摘要】

1.一种基于门控对齐网络的城市场景实时语义分割方法,其特征在于,所述城市场景实时语义分割方法包括以下步骤:

2.根据权利要求1所述的基于门控对齐网络的城市场景实时语义分割方法,其特征在于,步骤s1进一步包括:

3.根据权利要求1所述的基于门控对齐网络的城市场景实时语义分割方法,其特征在于,所述骨干网络包括依次连接的5个卷积块,将提取第二个卷积块输出的原图1/4大小的低级特征图x2和第五个卷积块输出的原图1/32大小的高级特征图x5输入金字塔池化对齐模块;

...

【专利技术属性】
技术研发人员:刘茜李振生
申请(专利权)人:南京信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1