【技术实现步骤摘要】
一种基于轻量化卷积神经网络的实时图像语义分割方法
本专利技术属于计算机视觉领域,具体涉及一种基于轻量化卷积神经网络的实时图像语义分割方法。
技术介绍
图像语义分割的目的是为图像中的每一个像素点赋予一个语义类别的标记,属于像素级的稠密分类任务。整体来看,语义分割是为实现全面场景理解铺平道路的基础任务之一,越来越多的应用也从图像数据中获取知识,包括自动驾驶、人机交互、室内导航、图像编辑、增强现实和虚拟现实等。图像语义分割方法可以分为两类:一类是传统方法,如基于阈值的分割、基于边缘的分割、基于区域的分割、基于图论的分割、基于能量泛函的分割等;另一类是基于深度学习的方法。近年来,随着深度神经网络的发展,深度学习在计算机视觉领域表现出越来越大的优势。深度卷积网络对于图像数据尤其有效,可以用于高效地提取图像中的像素特征,克服了传统方法严重依赖人工选取特征的局限,得到较好的分割效果。JonathanLong等人在《FullyConvolutionalNetworksforSemanticSegmentation》一文中提出 ...
【技术保护点】
1.一种基于轻量化卷积神经网络的实时图像语义分割方法,其特征在于,包括以下步骤:/nS1、构建轻量化卷积神经网络;/nS2、训练构建的轻量化卷积神经网络;/nS3、使用训练完成的轻量化神经网络对给定场景中图像进行语义分割。/n
【技术特征摘要】
1.一种基于轻量化卷积神经网络的实时图像语义分割方法,其特征在于,包括以下步骤:
S1、构建轻量化卷积神经网络;
S2、训练构建的轻量化卷积神经网络;
S3、使用训练完成的轻量化神经网络对给定场景中图像进行语义分割。
2.根据权利要求1所述的一种基于轻量化卷积神经网络的实时图像语义分割方法,其特征在于,步骤S1包括以下步骤:
S1.1、构建多尺度处理单元,用于获取像素的多尺度特征;
S1.2、使用构建的多尺度处理单元替换残差网络基本块(BasicblockofResNet)第一个标准3×3卷积,得到金字塔表征模块;
S1.3、按网络结构和参数设置构建轻量化卷积神经网络;第一层为标准3×3卷积,作为初始层将像素特征维度扩展至16;然后连续使用8个金字塔表征模块用于有效编码像素的多尺度特征,捕获长距离像素依赖关系,增强像素特征的区分能力,提升多尺度目标的分割性能;
S1.4、使用双线性差值函数作为上采样算子,恢复分割结果的分辨率使其和输入图像的分辨率相同。
3.根据权利要求2所述的一种基于轻量化卷积神经网络的实时图像语义分割方法,其特征在于,多尺度处理单元包括4个并行卷积层分支,分别为标准1×1卷积,空洞率(dilationrate)为{r1,r2,r3}的3个空洞卷积(dilatedconvolution);所述空洞卷积同时为深度卷积(depth-wiseconvolution);多尺度处理单元在通道维度连接4个并行卷积层分支输出,通过一个标准1×1卷积映射后得到输出;多尺度处理单元共2个卷积层。
4.根据权利要求3所述的一种基于轻量化卷积神经网络的实时图像语义分割方法,其特征在于,金字塔表征模块通过使用多尺度处理单元替换残差网络(ResNet18)基本块(BasicBlock)的第一个标准3×3卷积得到;所述金字塔表征模块共3个卷积层;所述轻量化卷积神经网络使用参数化修正线性单元(parametricrectifierlinearityunit,PReLU)作为激活函数。
5.根据权利要求...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。