【技术实现步骤摘要】
本专利技术涉及道路场景语义分割,尤其涉及一种基于多尺度多特征融合自注意力网络的道路场景语义分割方法和系统。
技术介绍
1、计算机视觉领域,道路场景语义分割一直是一个备受关注的研究方向,随着自动驾驶、智能交通等技术的发展,道路场景语义分割的需求也越来越迫切。同时,人工标注难,标注成本高等问题难以突破,可使用高质量数据集较少,因此基于小样本语义分割也逐渐成为热点研究内容。以往的语义分割通常使用卷积神经网络(cnn)来实现,然而这些网络需要大量的标注数据注入训练,同时随着网络层数加深,会导致卷积和池化操作存在一定程度的信息损失,尤其对小目标物体识别困难。样本不平衡也会对神经网络带来较大的问题,卷积神经网络往往对数量较多的类别表现更好性能,对数量较少的类别表现较差。这些情况极大影响了语义分割技术在实际道路环境中的使用。所以,如何基于少量标注数据训练准确且具备鲁棒性的语义分割模型,是当前图像语义分割待解决的关键之一。
2、传统语义分割任务主要利用图像的原始像素特征进行分类,这些像素特征包括亮度、纹理、颜色等。随着卷积神经网络(cnn)
...【技术保护点】
1.一种基于多尺度多特征融合自注意力网络的道路场景语义分割方法,其特征在于,包括:
2.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法,其特征在于,所述多尺度空间金字塔池化模块中,每层编码层的采样结果同步输入到空间金字塔池化层中,不同尺寸不同维度的特征经空间金字塔池化操作整合到全连接层并输出到唯一维度。
3.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法,其特征在于,所述多尺度空间金字塔池化模块中:
4.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法
...【技术特征摘要】
1.一种基于多尺度多特征融合自注意力网络的道路场景语义分割方法,其特征在于,包括:
2.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法,其特征在于,所述多尺度空间金字塔池化模块中,每层编码层的采样结果同步输入到空间金字塔池化层中,不同尺寸不同维度的特征经空间金字塔池化操作整合到全连接层并输出到唯一维度。
3.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法,其特征在于,所述多尺度空间金字塔池化模块中:
4.根据权利要求1所述的基于多尺度多特征融合自注意力网络的道路场景语义分割方法,其特征在于,所述自注意力模块采用vision transformer自注意力机制。
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。