【技术实现步骤摘要】
基于残差学习的实时图像语义分割算法
本专利技术涉及图像分割
,具体是一种基于残差学习的实时图像语义分割方法。
技术介绍
图像语义分割是图像处理和计算机视觉领域中的一项关键技术,是计算机认知图像内容的一个重要环节,其研究成果可应用于机器人导航,无人驾驶,虚拟现实,图像检索等众多领域,具有重要的实用价值和学术研究意义。语义分割是识别输入的每个像素,因此构建包括所有像素的特征图是很有必要的,神经网络通常以金字塔的形状构造,以增加输出的位移不变性和减少计算量。常用的语义分割常用算法ENet采用encoder-decoder结构,Encoder训练得到一个低分辨率的目标,然后在encoder后面使用一个decoder来重建高分辨率目标。这种形式考虑到了目标在不同尺度下的特征大小,并且节省了大量计算量,可以达到实时分割的效果,但由于金字塔神经网络中的重复下采样导致了图像分辨率显著降低,导致了空间信息的大量丢失,因此,最后的图像分割效果往往不好,在图像分割的边缘以及图像细节方面,网络的表现都较差为了解决这个问题,UN ...
【技术保护点】
1.一种基于残差学习的实时图像语义分割算法,将图片送入卷积神经网络得到具有类别信息的分割图片,其特征在于,包括以下步骤:/n步骤一:将原始图片进行标记得到标记好的图片,和原始图片构成训练集;/n步骤二:根据残差特征提取方法和单网络预测结构,构建新型语义分割网络;/n步骤三:加载训练集,用分段式训练方式训练新型语义分割网络,得到训练好的模型;/n步骤四:将待分割的图片送入新型语义分割网络,加载训练好的模型,得到分割结果。/n
【技术特征摘要】
1.一种基于残差学习的实时图像语义分割算法,将图片送入卷积神经网络得到具有类别信息的分割图片,其特征在于,包括以下步骤:
步骤一:将原始图片进行标记得到标记好的图片,和原始图片构成训练集;
步骤二:根据残差特征提取方法和单网络预测结构,构建新型语义分割网络;
步骤三:加载训练集,用分段式训练方式训练新型语义分割网络,得到训练好的模型;
步骤四:将待分割的图片送入新型语义分割网络,加载训练好的模型,得到分割结果。
2.根据权利要求1中所述的基于残差学习的实时图像语义分割算法,其特征在于:步骤一中,选取训练集里的一张图片,对图片按照图片里目标的不同进行区域划分,并按照目标的类别对整块区域按照像素点进行该类别的标号,将整张图的目标标记完则标完了一张图片,对所有原始图片都进行标记后得到原始图片和所有标记完的图片,作为神经网络的训练集。
3.根据权利要求1中所述的基于残差学习的实时语义分割算法,其特征在于:所述构建新型语义分割网络的方法为:
步骤3.1:采取Enet的特征编码模块作为基础特征提取网络,将训练集里的原始图片送入网络,进行卷积提取主体特征,提取每次降采样后的主体特征,分别为二分之一大小的主体特征F1/2、四分之一大小的主体的特征F1/4和八分之一大小的主体的特征F1/8;
...
【专利技术属性】
技术研发人员:韩静,楼啸天,陈霄宇,柏连发,张毅,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。