一种基于拓扑图的智能导航的方法和系统技术方案

技术编号:22386358 阅读:10 留言:0更新日期:2019-10-29 06:16
本发明专利技术公开了一种基于拓扑图的智能导航的方法和系统,涉及计算机技术领域。该方法的一具体实施方式包括:基于构建的拓扑图,根据当前位置信息确定可行驶区域视图;获取场景数据,所述场景数据至少包括场景图像、场景深度图和场景解析图;基于所述可行驶区域视图、场景数据和导航模型,确定行为决策。该方法基于多指标的导航模型,并且基于构建的拓扑图确定可行驶区域视图,相对于无地图方式,该发明专利技术在GPS约束下可提高实时导航的准确性,但不完全依赖GPS可提高导航的鲁邦性。

A method and system of intelligent navigation based on topological graph

【技术实现步骤摘要】
一种基于拓扑图的智能导航的方法和系统
本专利技术涉及计算机
,尤其涉及一种基于拓扑图的智能导航的方法和系统。
技术介绍
现有自动驾驶技术大多依赖高清地图进行智能导航,然而获取高清地图的过程耗时耗力,并且需要不断对其维护和更新。现有技术中,针对街景场景的无地图智能导航,DeepMind研究人员提出了一种基于深度强化学习的方法(2018ArxivLearningtoNavigateinCitiesWithoutaMap)。深度强化学习通过搭建深度神经网络模型对活动实体(agent)进行行为预测(action),并借助传统强化学习算法根据时序状态(state)变化中所获奖赏(rewards)来自主训练模型参数。该方法的深度神经网络由卷积网络conv和循环神经网络lstm搭建而成,状态为84*84分辨率的图像xt和目标位置gt,行为at包括5种离散情况(旋转-67.5度、-22.5度、22.5度、67.5度和前进),奖赏rt由一个距离目标位置的函数定义,然后在交互式环境下通过GoogleStreetView街景图不断采样训练。上述无地图智能导航方法中,其行为仅包括5种决策(旋转-67.5度、-22.5度、22.5度、67.5度和前进),行动决策过于单一,难于应对真实驾驶。其次,该方法完全依赖图像进行智能导航,由于图像受光线影响,难以在夜景等弱光下进行自主导航。此外,该方法的奖赏由一个距离目标位置的函数定义,一般而言,好的导航引擎应该受多方面制约,包括行驶时间、行驶距离和违规情况等,因此,该方法难于训练出多指标下的真实导航模型。最后,该方法不需要任何地图,这将极大扩充状态空间的采样数目,优化过程不易收敛,训练起来耗时耗力。
技术实现思路
有鉴于此,本专利技术实施例提供一种基于拓扑图的智能导航的方法和系统,能够基于多指标的导航模型,并且基于构建的拓扑图确定可行驶区域视图,相对于无地图方式,该专利技术在GPS约束下可提高实时导航的准确性,但不完全依赖GPS可提高导航的鲁邦性。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种的基于拓扑图的智能导航方法。本专利技术实施例的基于拓扑图的智能导航的方法包括:基于构建的拓扑图,根据当前位置信息确定可行驶区域视图;获取场景数据,所述场景数据至少包括场景图像、场景深度图和场景解析图;基于所述可行驶区域视图、场景数据和导航模型,确定行为决策。可选地,基于构建的拓扑图,根据当前位置信息确定可行驶区域视图的步骤包括:根据预设的宽度扩展规则,在拓扑图中以行车轨迹点为中心进行宽度扩展,以得到可行驶区域;在所述拓扑图中根据当前位置信息确定范围图像;对所述范围图像内的可行驶区域进行标注,以得到可行驶区域视图。可选地,获取场景数据的步骤包括:通过车载摄像头实时采集场景图像;解析所述场景图像的场景深度,以得到场景深度图;对所述场景图像进行语义解析,以得到场景解析图。可选地,所述场景数据还包括激光点云数据;所述获取场景数据的步骤还包括:通过车载激光雷达实时采集激光雷达点;对所述激光雷达点进行归一化处理,以得到激光点云数据。可选地,所述导航模型基于深度强化学习训练得到;以及基于所述可行驶区域视图、场景数据和导航模型,确定行为决策的步骤包括:通过图像分类卷积网络对上述样本数据进行特征提取;将提取的特征、目标位置和前时刻奖赏导入第一层循环神经网络中;将所述第一层循环神经网络的输出与前时刻行为,导入第二层循环神经网络中;基于所述第二层循环神经网络的输出,通过全连接网络对行为决策进行预测。可选地,所述行为决策至少包括:行驶速度、偏转角速度、行驶方向和偏转方向;通过全连接网络对行为决策进行预测的步骤包括:分别对行为决策的行驶速度、偏转角速度、行驶方向和偏转方向进行预测,得到对应的预测概率;将预测概率最大的行为组合,确定为预测出的行为决策。为实现上述目的,根据本专利技术实施例的另一个方面,提供了一种基于拓扑图的智能导航的系统。本专利技术实施例的基于拓扑图的智能导航的系统包括:可行驶区域视图确定模块,用于基于构建的拓扑图,根据当前位置信息确定可行驶区域视图;场景数据获取模块,用于获取场景数据,所述场景数据至少包括场景图像、场景深度图和场景解析图;决策确定模块,用于基于所述可行驶区域视图、场景数据和导航模型,确定行为决策。可选地,所述可行驶区域视图确定模块,还用于根据预设的宽度扩展规则,在拓扑图中以行车轨迹点为中心进行宽度扩展,以得到可行驶区域;在所述拓扑图中根据当前位置信息确定范围图像;对所述范围图像内的可行驶区域进行标注,以得到可行驶区域视图。可选地,所述场景数据获取模块,还用于通过车载摄像头实时采集场景图像;解析所述场景图像的场景深度,以得到场景深度图;对所述场景图像进行语义解析,以得到场景解析图。可选地,所述场景数据获取模块,还用于通过车载激光雷达实时采集激光雷达点;对所述激光雷达点进行归一化处理,以得到激光点云数据;所述场景数据还包括激光点云数据。可选地,所述决策确定模块,还用于通过图像分类卷积网络对上述样本数据进行特征提取;将提取的特征、目标位置和前时刻奖赏导入第一层循环神经网络中;将所述第一层循环神经网络的输出与前时刻行为,导入第二层循环神经网络中;基于所述第二层循环神经网络的输出,通过全连接网络对行为决策进行预测;所述导航模型基于深度强化学习训练得到。可选地,所述决策确定模块,还用于分别对行为决策的行驶速度、偏转角速度、行驶方向和偏转方向进行预测,得到对应的预测概率;将预测概率最大的行为组合,确定为预测出的行为决策;所述行为决策至少包括:行驶速度、偏转角速度、行驶方向和偏转方向。为实现上述目的,根据本专利技术实施例的再一个方面,提供了一种电子设备。本专利技术实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述任一项的基于拓扑图的智能导航的方法。为实现上述目的,根据本专利技术实施例的再一个方面,提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现上述任一项的基于拓扑图的智能导航的方法。上述专利技术中的一个实施例具有如下优点或有益效果:在车辆行驶之前,根据拓扑图完成路线规划并可获取可行驶路线。在车辆行驶过程中,基于该拓扑图和确定的可行驶路线,可根据GPS信号(拓扑图由一种由一系列GPS地位点搭建)对车辆粗略定位并获取可行驶区域,然后由深度神经网络进行局部精细导航。相比无地图方式,本专利技术实施例在GPS约束下可提高实时导航的准确性,并且由于导航模型的多指标,本专利技术实施例不完全依赖GPS,可提高导航的鲁邦性。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的基于拓扑图的智能导航的方法的主要流程的示意图;图2是根据本专利技术实施例的基于拓扑图的智能导航的方法的可行驶区域的示意图;图3是根据本专利技术实施例的基于拓扑图的智能导航的方法的采集的场景图像的示意图;图4是根据本专利技术实施例的基于拓扑图的智能导航的方法的场景深度图的示意图;图5是根据本专利技术实施例的基于拓扑图的智能导航的方法的场景解析图的本文档来自技高网
...

【技术保护点】
1.一种基于拓扑图的智能导航的方法,其特征在于,包括:基于构建的拓扑图,根据当前位置信息确定可行驶区域视图;获取场景数据,所述场景数据至少包括场景图像、场景深度图和场景解析图;基于所述可行驶区域视图、场景数据和导航模型,确定行为决策。

【技术特征摘要】
1.一种基于拓扑图的智能导航的方法,其特征在于,包括:基于构建的拓扑图,根据当前位置信息确定可行驶区域视图;获取场景数据,所述场景数据至少包括场景图像、场景深度图和场景解析图;基于所述可行驶区域视图、场景数据和导航模型,确定行为决策。2.根据权利要求1所述的方法,其特征在于,基于构建的拓扑图,根据当前位置信息确定可行驶区域视图的步骤包括:根据预设的宽度扩展规则,在拓扑图中以行车轨迹点为中心进行宽度扩展,以得到可行驶区域;在所述拓扑图中根据当前位置信息确定范围图像;对所述范围图像内的可行驶区域进行标注,以得到可行驶区域视图。3.根据权利要求1所述的方法,其特征在于,获取场景数据的步骤包括:通过车载摄像头实时采集场景图像;解析所述场景图像的场景深度,以得到场景深度图;对所述场景图像进行语义解析,以得到场景解析图。4.根据权利要求3所述的方法,其特征在于,所述场景数据还包括激光点云数据;所述获取场景数据的步骤还包括:通过车载激光雷达实时采集激光雷达点;对所述激光雷达点进行归一化处理,以得到激光点云数据。5.根据权利要求1所述的方法,其特征在于,所述导航模型基于深度强化学习训练得到;以及基于所述可行驶区域视图、场景数据和导航模型,确定行为决策的步骤包括:通过图像分类卷积网络对上述样本数据进行特征提取;将提取的特征、目标位置和前时刻奖赏导入第一层循环神经网络中;将所述第一层循环神经网络的输出与前时刻行为,导入第二层循环神经网络中;基于所述第二层循环神经网络的输出,通过全连接网络对行为决策进行预测。6.根据权利要求5所述的方法,其特征在于,所述行为决策至少包括:行驶速度、偏转角速度、行驶方向和偏转方向;通过全连接网络对行为决策进行预测的步骤包括:分别对行为决策的行驶速度、偏转角速度、行驶方向和偏转方向进行预测,得到对应的预测概率;将预测概率最大的行为组合,确定为预测出的行为决策。7.一种基于拓扑图的智能导航的系统,其特征在于,包括:可行驶区域视图确定模块,用于基于构建的拓扑图,根据当前位置信息确定可行驶区域视图;场景数据获取模...

【专利技术属性】
技术研发人员:李艳丽孙晓峰赫桂望蔡金华
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1