一种基于监督学习的深度自动编码器的道路分割方法技术

技术编号:18941688 阅读:32 留言:0更新日期:2018-09-15 11:18
一种基于监督学习的深度自动编码器的道路分割方法,针对传统分割方法存在的分割精度不高、实时性不好,基于全卷积网络的语义分割方法存在的网络结构复杂、参数调优繁琐、训练周期长等问题,在传统的自动编码器模型中加入监督层,通过监督学习机制来抽取有利于道路图像分割的特征,实现道路图像语义分割。本发明专利技术的监督学习机制促使网络结构着重学习区域的轮廓、边界等信息而忽略与分割无关的图像细节,取得了更好的道路分割效果。并且本发明专利技术所提出的方法模型简单、训练时间和运行时间都远低于Segnet网络,这对实时性要求很高的道路识别而言是极其关键的。

A road segmentation method based on supervised learning and deep automatic encoders

A road segmentation method based on supervised learning for depth auto-encoder is proposed. The traditional segmentation method has some problems, such as low segmentation accuracy, poor real-time performance, complex network structure, complicated parameter tuning and long training period, etc. In order to overcome the shortcomings of traditional segmentation method, the traditional automatic encoder model is proposed. Supervisory layer is added to extract the features which are beneficial to road image segmentation by supervised learning mechanism, and the semantic segmentation of road image is realized. The supervised learning mechanism of the invention urges the network structure to focus on learning the contour and boundary information of the region while ignoring the image details unrelated to segmentation, thus achieving better road segmentation effect. Moreover, the proposed method has simple model, much lower training time and running time than the Segnet network, which is crucial for road recognition with high real-time requirements.

【技术实现步骤摘要】
一种基于监督学习的深度自动编码器的道路分割方法
本专利技术属于计算机视觉
,涉及智能车辆和无人驾驶车辆,具体为一种基于监督学习的深度自动编码器的道路分割方法。
技术介绍
无人驾驶车辆道路环境感知问题一直以来是研究的热点,基于机器视觉的道路环境感知方法是其研究重点之一,这类方法主要利用车载摄像机拍摄车辆行驶前方道路图像,利用图像处理和模式识别方法实现道路图像分割,图像语义分割就是机器自动从图像中分割出对象区域,并识别其中的内容,确定无人驾驶车辆的可行驶区域。传统的图像分割方法大多是基于图像本身的特征提取,需要先在图像上生成不同的区域,再在区域上提取特征,对区域进行分类合并才能得到最终语义分割的结果,过程比较复杂,并且效果也有待提升。随着深度学习持续升温,实践中已证明深度卷积神经网络对图像特征的提取具有很大的优势,但基于卷积神经网络的图像语义分割实时性不好、分割精度也有待提升。2015年,Long等人提出了基于全卷积网络(FullyConvolutionalNetworks,FCN)的语义分割方法,为语义分割方法提供了一个新思路,此后大量基于FCN的图像语义分割算法层出不穷,语义分割性能得到提升。但是该网络结构非常复杂,参数调优过程漫长,网络训练周期在高性能GPU上仍需高达几周时间。
技术实现思路
本专利技术要解决的问题是:针对传统分割方法存在的分割精度不高、实时性不好,基于全卷积网络的语义分割方法存在的网络结构复杂、参数调优繁琐、训练周期长等问题,提出一种简洁有效的道路分割方法。本专利技术的技术方案为:一种基于监督学习的深度自动编码器的道路分割方法,用于确定智能车辆或无人驾驶车辆的可行驶道路区域,首先在自动编码器模型中加入监督层,将已知的道路环境图像作为训练样本,利用训练样本的分割图作为监督信息,得到有监督的单层自动编码器,通过训练样本训练后得到有监督的单层自动编码器模型;接着,建立一个有监督的深度自动编码器模型来抽取道路环境分割的深层特征,所述深度自动编码器模型由所述单层自动编码器模型多层堆叠而得,利用训练样本和其道路环境分割图,训练得到所述深度自动编码器模型;最后加载测试样本得到其语义分割图,通过图像处理确定道路环境图像的可行驶道路区域。所述有监督的深度自动编码器模型的建立为:将深度自动编码器模型的训练分为三组,每组的训练都基于一个单层自动编码器,每一组训练模型是独立的,但整个训练过程中三组是相互关联的,三组单层自动编码器分别为:1.1)第一组单层自动编码器以原始道路环境图像X作为输入X1,道路分割标签图Xlabel作为监督,输出的重构数据用表示,进行监督学习,以减小重构数据与标签数据Xlabel的误差;1.2)第二组单层自动编码器提取第一组通过监督学习输出的重构数据作为输入X2,再一次与道路标签数据Xlabel一起进行监督学习,进一步减小重构数据与标签数据Xlabel的误差;1.3)第三组单层自动编码器以第一组模型中学习的特征编码H1作为输入X3,以第二组模型中的学习的特征编码H2作为监督,进行监督学习,得到重构数据提取上述三组单层自动编码器中的特征权值,根据先编码再解码的网络结构,构建一个具有两层编码和两层解码深度自动编码器模型:以第一组单层自动编码器的输入,即原始道路数据X为整个深度自动编码器模型的输入层,以第一组单层自动编码器的编码权值第三组单层自动编码器的编码权值第三组单层自动编码器的解码权值第二组单层自动编码器的解码权值为后续各层的连接权值,最终得到该深度模型的输出层Z,该输出为最终的道路语义分割图。所述有监督的单层自动编码器具体为:2.1)将传统的自动编码器的目标函数改为最小化监督标签Xlabel与重构样本Z之间的平均重构误差,具体为其中,m为训练样本个数;Zi表示第i个重构样本;表示第i个输入样本;2.2)利用已有的道路分割图作为标签Xlabel,通过最小化标签Xlabel与重构样本Z之间的平均误差,使得自动编码器学习有利于道路环境分割的相关特征;2.3)将训练样本加入该单层模型中进行训练,求出输出层与监督层每个节点的平均误差,并通过反向传播更新解码层和编码层的权值,最小化有监督的单层自动编码器模型的目标函数,最终得到有监督的单层自动编码器模型。自动编码器本身是是一种浅层网络结构,输入-编码-输出,共3层,深层的自动编码器是通过多个浅层自动编码器以堆叠的方式构成的,但在监督学习的方式下,原来的堆叠的方式已经不再成立,本专利技术中提出了一种新的针对监督学习自动编码器的堆叠方式,本专利技术构建了一种新的堆叠方式,使监督学习的自动编码器可以成为一种深度模型。本专利技术提出了一种全新的语义分割方法,在传统的自动编码器模型中加入监督层,通过监督学习机制来抽取有利于道路图像分割的特征,实现道路图像语义分割。在Camvid数据集上证明本专利技术提出方法的有效性和简洁性,并与相比传统的k-means聚类分割方法、基于卷积神经网络的方法、基于FCN的Segnet网络比较,本专利技术方法的监督学习机制促使网络结构着重学习区域的轮廓、边界等信息而忽略与分割无关的图像细节,取得了更好的道路分割效果。并且本专利技术所提出的方法模型简单、训练时间和运行时间都远低于Segnet网络,这对实时性要求很高的道路识别而言是极其关键的。附图说明图1为本专利技术的实施流程。图2本专利技术提出的有监督的深度自动编码器模型的训练过程。图3为本专利技术在CamVid数据集中的测试结果.具体实施方式本专利技术提出了一种基于监督学习的深度自动编码器的道路分割方法,首先在传统的自动编码器模型中加入监督层,利用已知的道路环境图像的分割图作为监督信息,设计了一个有监督的单层自动编码器。接着,由于深层网络具有更加抽象、更加多元化的特征表达能力,因此本专利技术建立一个有监督的深度自动编码器模型来抽取道路环境分割的深层特征,研究了有监督的自动编码器的多层堆叠方式,利用已有的训练样本和其道路环境分割图,训练了一个有监督的深度自动编码器模型。最后加载测试样本得到其语义分割图,通过图像处理基本方法确定道路环境图像的可行驶道路区域。如图1所示,本专利技术包括以下步骤:1)设计有监督的单层自动编码器模型,具体实施步骤为:①在传统的自动编码器(AutoEncoder,简称AE)模型中加入监督层,将已知的道路环境图像的分割图作为监督信息,构建有监督的单层自动编码器模型,将传统的自动编码器的目标函数由原有的最小化输入数据X与重构数据Z之间的平均重构误差改为最小化监督标签Xlabel与重构样本Z之间的平均重构误差,目标函数变为:其中,m为训练样本个数;Zi表示第i个重构样本;表示第i个输入样本;W表示解码层和编码层的权值,b表示权值偏置,通常为一个常数;②利用已有的道路分割图作为标签Xlabel,通过最小化标签Xlabel与重构样本Z之间的平均误差来使得AE模型学习有利于道路环境分割的相关特征。③将训练样本加入该单层模型中进行训练,求出输出层与监督层每个节点的平均误差并通过反向传播更新解码层和编码层的权值,权值的更新采用梯度下降法,最终得到有监督的单层自动编码器模型。2)建立有监督的深度自动编码器模型,将该模型的训练分为三组,如图2所示。每组的训练都基于一个单层的监督学习AE模型,每一个训练模型是独立的,本文档来自技高网...

【技术保护点】
1.一种基于监督学习的深度自动编码器的道路分割方法,其特征是用于确定智能车辆或无人驾驶车辆的可行驶道路区域,首先在自动编码器模型中加入监督层,将已知的道路环境图像作为训练样本,利用训练样本的分割图作为监督信息,得到有监督的单层自动编码器,通过训练样本训练后得到有监督的单层自动编码器模型;接着,建立一个有监督的深度自动编码器模型来抽取道路环境分割的深层特征,所述深度自动编码器模型由所述单层自动编码器模型多层堆叠而得,利用训练样本和其道路环境分割图,训练得到所述深度自动编码器模型;最后加载测试样本得到其语义分割图,通过图像处理确定道路环境图像的可行驶道路区域;所述有监督的深度自动编码器模型的建立为:将深度自动编码器模型的训练分为三组,每组的训练都基于一个单层自动编码器,每一组训练模型是独立的,但整个训练过程中三组是相互关联的,三组单层自动编码器分别为:1.1)第一组单层自动编码器以原始道路环境图像X作为输入X1,道路分割标签图Xlabel作为监督,输出的重构数据用

【技术特征摘要】
1.一种基于监督学习的深度自动编码器的道路分割方法,其特征是用于确定智能车辆或无人驾驶车辆的可行驶道路区域,首先在自动编码器模型中加入监督层,将已知的道路环境图像作为训练样本,利用训练样本的分割图作为监督信息,得到有监督的单层自动编码器,通过训练样本训练后得到有监督的单层自动编码器模型;接着,建立一个有监督的深度自动编码器模型来抽取道路环境分割的深层特征,所述深度自动编码器模型由所述单层自动编码器模型多层堆叠而得,利用训练样本和其道路环境分割图,训练得到所述深度自动编码器模型;最后加载测试样本得到其语义分割图,通过图像处理确定道路环境图像的可行驶道路区域;所述有监督的深度自动编码器模型的建立为:将深度自动编码器模型的训练分为三组,每组的训练都基于一个单层自动编码器,每一组训练模型是独立的,但整个训练过程中三组是相互关联的,三组单层自动编码器分别为:1.1)第一组单层自动编码器以原始道路环境图像X作为输入X1,道路分割标签图Xlabel作为监督,输出的重构数据用表示,进行监督学习,以减小重构数据与标签数据Xlabel的误差;1.2)第二组单层自动编码器提取第一组通过监督学习输出的重构数据作为输入X2,再一次与道路标签数据Xlabel一起进行监督学习,进一步减小重构数据与标签数据Xlabel的误差;1.3)第三组单层自动编码器以第一组模型...

【专利技术属性】
技术研发人员:芮挺宋小娜王新晴何雷周遊杨成松方虎生王东张赛周飞张釜凯
申请(专利权)人:中国人民解放军陆军工程大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1