【技术实现步骤摘要】
导航模型训练方法、装置、电子设备及存储介质
本申请涉及一种计算机
,尤其涉及一种人工智能
技术介绍
传统的导航路径规划不受视角大小的限制,会规划出视角外的路径。例如,机器人在环境中巡航,需要躲避障碍物。机器人的视角是提供安全导航避障的重要信息。根据参考视角内的障碍物分布可以获取机器人当前可行走的安全区域范围,机器人应该始终保持在安全区域内进行运动而不应该进入障碍物区域和视角未包含的区域。因此当激光雷达或视觉传感器等感知设备的视角较小时,规划出的导航路径可能无法保障安全性。
技术实现思路
本申请实施例提出一种导航模型训练方法、装置、电子设备及存储介质,以至少解决现有技术中的以上技术问题。第一方面,本申请实施例提供了一种导航模型训练方法,包括:获取导航模型规划的运动轨迹,运动轨迹是根据预设时间窗口的累加视角信息规划的;判断运动轨迹是否在预设时间窗口的累加视角范围内;若运动轨迹不在预设时间窗口的累加视角范围内,则针对运动轨迹生成惩罚信息;利用惩罚信息对导航
【技术保护点】
1.一种导航模型训练方法,其特征在于,包括:/n获取导航模型规划的运动轨迹,所述运动轨迹是根据预设时间窗口的累加视角信息规划的;/n判断所述运动轨迹是否在所述预设时间窗口的累加视角范围内;/n若所述运动轨迹不在所述预设时间窗口的累加视角范围内,则针对所述运动轨迹生成惩罚信息;/n利用所述惩罚信息对所述导航模型进行优化。/n
【技术特征摘要】
1.一种导航模型训练方法,其特征在于,包括:
获取导航模型规划的运动轨迹,所述运动轨迹是根据预设时间窗口的累加视角信息规划的;
判断所述运动轨迹是否在所述预设时间窗口的累加视角范围内;
若所述运动轨迹不在所述预设时间窗口的累加视角范围内,则针对所述运动轨迹生成惩罚信息;
利用所述惩罚信息对所述导航模型进行优化。
2.根据权利要求1所述的方法,其特征在于,利用所述惩罚信息对所述导航模型进行优化之前,还包括:
在所述累加视角范围内检测障碍目标,判断所述障碍目标是否位于至少一条所述运动轨迹上;
若所述障碍目标位于至少一条所述运动轨迹上,则针对所述障碍目标所位于的运动轨迹生成惩罚信息。
3.根据权利要求1或2所述的方法,其特征在于,所述累加视角是将所述预设时间窗口内的感知视角进行叠加得到的;所述累加视角信息是在所述累加视角范围内获取的感知信息。
4.根据权利要求1或2所述的方法,其特征在于,针对所述运动轨迹生成惩罚信息,包括:
根据所述运动轨迹偏离所述累加视角范围的程度生成惩罚值;
将所述惩罚值作为针对所述运动轨迹的惩罚信息。
5.根据权利要求4所述的方法,其特征在于,利用所述惩罚信息对所述导航模型进行优化,包括:
根据所述惩罚信息更新所述导航模型的参数;
获取更新后的导航模型规划的运动轨迹;
重复执行针对所述运动轨迹生成惩罚信息和利用所述惩罚信息对所述导航模型进行优化的步骤;
在所述惩罚值小于预设阈值的情况下,确定完成所述导航模型的优化过程。
6.一种导航模型训练装置,其特征在于,包括:
获取单元,用于获取导航模型规划的运动轨迹,所述运动轨迹是根据预设时间窗口的累加视角信息规划的;
判断单元,用于判断所述运动轨迹是否在所述预设时间窗口的累加视角...
【专利技术属性】
技术研发人员:周昕,杭蒙,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。