【技术实现步骤摘要】
基于异构深度学习的无人驾驶车辆/机器人行为规划方法
本专利技术涉及无人驾驶车辆/机器人自主规划领域,特别是一种基于异构深度学习的无人驾驶车辆/机器人行为规划方法。
技术介绍
学习一个从当前环境到无人驾驶车辆/机器人控制的映射是当前众多无人驾驶车辆/机器人应用的核心问题。该映射一般是利用车载传感器来感知无人驾驶车辆/机器人周围环境,并根据所获得的环境信息,来控制无人驾驶车辆/机器人的角速度和线速度,从而完成无人驾驶车辆/机器人的行为规划。当前无人驾驶车辆/机器人行为规划系统大多是通过预编程的方法实现,由领域内的专家对环境建模并定义控制逻辑,通过预编程已经成功的实现了在特定环境下对机器人的控制。但是由于环境的多样性,使得通过预编程使无人驾驶车辆/机器人在不同环境下都能完成行为规划变得非常复杂和困难,而且当无人驾驶车辆/机器人遇到更加复杂或者陌生的环境时,其控制将变得不稳定,即使对所有环境都能建模,但是其控制逻辑却并不一定稳定。机器学习技术已经被成功的应用在当今世界最先进的无人驾驶车辆/机器人上。例如在2005年DARPAGrandChallenge获得冠军的无人车Stanley,其在无人车历史上具有里程碑式的意义,因为机器学习技术在户外障碍物检测和地形测绘的普遍应用,使得Stanley在比赛中表现的非常鲁棒和精确。不过由于比赛环境是静态的,Stanley在交通流中并不能实现行为规划。基于视觉控制和强化学习的方法也取得了显著的成就,部分是依赖基于深度学习(DeepLearning,DL)的模型,机器 ...
【技术保护点】
1.一种基于异构深度学习的无人驾驶车辆/机器人行为规划方法,其特征在于,步骤如下:/n(1)根据无人驾驶车辆/机器人获取的先验环境地图、全局任务路线以及无人驾驶车辆/机器人当前的位姿状态产生无人驾驶车辆/机器人的有限行为状态机;状态机的N个状态与N个异构深度学习网络模型一一对应,模型具有相同的结构和不同的参数取值;/n(2)基于输入图像,采用卷积神经网络自编码模型AEM进行图像降维、图像建模与图像预测;将道路图像空间转换为正态分布空间,每一副图像都对应编码空间中一个近似的标准正态分布,从相应分布的高概率密度处采样作为该图像的编码;/n(3)利用基于全连接神经网络的评估模型EM评估道路跟踪、控制模型的训练效果,以及在实际应用中对道路跟踪模型和控制模型的跟踪控制信号进行评估;/n(4)使用擅长序列数据建模的循环神经网络RNN建立道路跟踪模型RTM来描述无人驾驶车辆/机器人在自主驾驶过程中所采集到图像序列间的关系;/n(5)控制模型CM通过当前道路图像的编码得到对无人驾驶车辆/机器人的控制信号;/n(6)利用传感器信息对驾驶员实际控制信号和神经网络产生的控制信号性能进行评估,对M个异构神经网 ...
【技术特征摘要】
1.一种基于异构深度学习的无人驾驶车辆/机器人行为规划方法,其特征在于,步骤如下:
(1)根据无人驾驶车辆/机器人获取的先验环境地图、全局任务路线以及无人驾驶车辆/机器人当前的位姿状态产生无人驾驶车辆/机器人的有限行为状态机;状态机的N个状态与N个异构深度学习网络模型一一对应,模型具有相同的结构和不同的参数取值;
(2)基于输入图像,采用卷积神经网络自编码模型AEM进行图像降维、图像建模与图像预测;将道路图像空间转换为正态分布空间,每一副图像都对应编码空间中一个近似的标准正态分布,从相应分布的高概率密度处采样作为该图像的编码;
(3)利用基于全连接神经网络的评估模型EM评估道路跟踪、控制模型的训练效果,以及在实际应用中对道路跟踪模型和控制模型的跟踪控制信号进行评估;
(4)使用擅长序列数据建模的循环神经网络RNN建立道路跟踪模型RTM来描述无人驾驶车辆/机器人在自主驾驶过程中所采集到图像序列间的关系;
(5)控制模型CM通过当前道路图像的编码得到对无人驾驶车辆/机器人的控制信号;
(6)利用传感器信息对驾驶员实际控制信号和神经网络产生的控制信号性能进行评估,对M个异构神经网络进行训练,与当前使用的神经网络模型竞争上岗,实现终身学习;
(7)重复执行步骤(1)至(6),直至产生外部干预或规划任务结束。
2.根据权利要求1所述的基于异构深度学习的无人驾驶车辆/机器人行为规划方法,其特征在于:所述步骤(1)中基于有限行为状态机的异构深度学习网络详细描述如下:
(a)在图像输入下,无人驾驶车辆/机器人行为由有限行为状态机的状态所对应的异构深度学习网络产生;
(b)无人驾驶车辆/机器人的有限行为状态机包括{道路跟踪,路口左转,路口右转,路口直行,换道,前车超越,前车跟随,越野漫游,暂停等待,紧急避险}。
3.根据权利要求1所述的基于异构深度学习的无人驾驶车辆/机器人行为规划方法,其特征在于:所述步骤(2)中采用卷积神经网络自编码模型的步骤为:
(a)利用卷积神经网络自编码模型将道路图像空间转换为正态分布空间,每一副图像都对应编码空间中一个近似的标准正态分布,从相应分布的高概率密度处采样作为该图像的编码;自编码模型如下式所示:
(μT,σT)=AEM(IT)
其中,IT表示t时刻的道路图像,μT、σT分别表示在编码空间中与IT对应的分布的均值与标准差,AEM()表示自编码模型;
(b)在训练AEM模型时,对均值进行稀疏化约束,使用如下的损失函数:
其中,表示σT二范数的平方,表示σT的维度,表示均值的二范数平方,β是[0,1]间的实数,为正则化参数;此损失函数描述了AEM定义的编码空间与标准正态分布空间的KL散度(Kullback-LeiblerDivergence)与均值二范数平方的和。
4.根据权利要求1所述的基于异构深度学习的无人驾驶车辆/机器人行为规划方法,其特征在于,所述步骤(3)中全连接神经网络的评估模型构建步骤如下:
(a)使用评估模型EM评估道路跟踪以及控制模型的训练效果,以及在实际应用中对道路跟踪模型和控制模型的跟踪控制信号进行评估,其评估值为[0,1]内的实数,越接近1表示模型训练越好或者所做出的决策越可靠,反之应对模型进行改进并加强训练或者做出即时的预警以防危险的发生;
(b)对编码空间中的向量进行降维,并结合控制信号构成评估模型,评估模型如下:
pT=EM(Desampling(zT),(ωT,vT))
其中,zT表示t时刻道路图像IT在编码空间的编码,且zT=μT,表示zT从IT对应的高斯分布的最高概率密度处采样,Desampling()表示降采样网络,EM()表示将Desampling...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。