【技术实现步骤摘要】
一种基于注意力机制的盲道语义分割方法
[0001]本专利技术涉及图像分割领域,具体为一种基于注意力机制的盲道语义分割方法。
技术介绍
[0002]盲道分割是基于计算机视觉的导盲系统中的重要环节。语义分割是一种像素级别的稠密的分类任务,在图像中为每个像素预测出类别标签,显示出盲道以及盲道周边物体的类别、位置、形状、大小等信息,是一种更精细更深层次的计算机视觉任务。在视觉导盲系统中,盲道语义分割技术通过对摄像头捕获到的图像进行像素级推理预测,从而对盲道区域范围内的环境信息,进行语义感知和场景解析,引导决策模块发出正确的行进指令。
[0003]传统的盲道图像分割算法主要基于盲道特有的颜色和纹理属性,依赖先验知识设计特征提取器,结合分类器构建分割模型完成盲道分割任务。这些早期的方法需要人工设计特征提取器,以致于模型的通用性较差,泛化能力低。特别地,模型的性能而且容易受到光照、树荫等外界环境影响,导致分割准确率较低。
[0004]近年来深度学习技术在计算机视觉领域取得了显著的成就,特别是卷积神经网络(CNN)在图像处理 ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力机制的盲道语义分割方法,其特征在于,包括以下具体步骤:S1、获取数据,获得盲道语义分割数据集C;其中,盲道语义分割数据集包括训练集和验证集;S2、建立基于注意力机制的盲道语义分割网络;S3、利用训练集中的图像数据训练盲道语义分割网络,得到盲道语义分割网络模型;S4、将需要分割的图像,输入盲道语义分割网络模型中,输出语义分割效果图。2.根据权利要求1所述的一种基于注意力机制的盲道语义分割方法,其特征在于,S1中获取数据的方法为:S11、拍摄不同时间段以及不同光照条件下街道中盲道场景获得的图像信息,得到图像数据集A;S12、对图像数据集A中的每张图像一一进行预处理,得到具有N张初始图像的图像数据集B,其中,N≥500;S13、采用图像标注软件对N张初始图像一一进行精细的语义标签标注以及利用数据增强方法对N张初始图像进行处理,得到具有M张图像的盲道语义分割数据集C,其中,M≥2000;S14、将盲道语义分割数据集C中的M张图像分为两类,分别得到训练集和验证集。3.根据权利要求2所述的一种基于注意力机制的盲道语义分割方法,其特征在于,数据增强方法对N张初始图像进行处理的方式是抽取40%的图像进行随机左右翻转、裁剪、缩放、增加明亮度和增加对比度操作。4.根据权利要求2所述的一种基于注意力机制的盲道语义分割方法,其特征在于,M张图像按照X:Y的比例分别划分为训练集和验证集,其中,6≤X≤8;2≤Y≤4,X+Y=10。5.根据权利要求2所述的一种基于注意力机制的盲道语义分割方法,其特征在于,盲道语义分割数据集C中数...
【专利技术属性】
技术研发人员:李林娟,谢刚,田娟,聂晓音,张浩雪,张兆祥,
申请(专利权)人:太原科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。