【技术实现步骤摘要】
地图中点位特征的学习方法、装置、设备及存储介质
[0001]本申请实施例涉及人工智能领域,特别涉及一种地图中点位特征的学习方法、装置、设备及存储介质。
技术介绍
[0002]智能体(如智能机器人、游戏机器人)通常使用有限的视场传感器,即视场传感器获取到的数据只能表示智能体附近位置的部分场景,而无法考虑来自环境其余部分的更广泛的信息。为学习环境信息的高层语义表示,可以通过强化学习算法对智能体进行训练,然而强化学习算法具有计算成本高昂、样本效率低下等缺点,因此,可以对智能体进行预训练,以在预训练的过程中,提升智能体对三维空间复杂场景的理解。
[0003]相关技术中,通常会采用迁移学习的方式,将预训练得到的模型应用到下游任务中。例如,通过图像级别的预训练,得到图像级别编码器;通过环境级别的预训练,得到环境级别编码器;并将图像级别编码器和环境级别编码器应用到下游任务中,以实现下游任务对图像特征的有效提取,以及对环境场景的理解。
[0004]然而,对模型进行预训练,需要采集预训练数据、进行大量预训练的工作,因此具有很大的预训练开销;同时,由于预训练得到的模型参数量较大,应用到下游任务中时也会增加下游任务的计算量。
技术实现思路
[0005]本申请实施例提供了一种地图中点位特征的学习方法、装置、设备及存储介质。所述技术方案如下。
[0006]一方面,本申请实施例提供了一种地图中点位特征的学习方法,所述方法包括:获取地图的导航网格数据以及可见图数据,所述导航网格数据用于表征所述地图中的可通行 ...
【技术保护点】
【技术特征摘要】
1.一种地图中点位特征的学习方法,其特征在于,所述方法包括:获取地图的导航网格数据以及可见图数据,所述导航网格数据用于表征所述地图中的可通行区域,所述可见图数据用于表征所述地图中地图点位之间的可见性;基于所述导航网格数据和所述可见图数据,对所述地图中的目标地图点位进行采样,得到采样轨迹,所述采样轨迹包括可达轨迹和可见轨迹,所述可达轨迹和所述可见轨迹由所述目标地图点位构成;基于所述采样轨迹中所述目标地图点位之间的上下文关系,以及所述目标地图点位之间的视野相似性,对所述目标地图点位进行点位特征学习,得到所述目标地图点位的目标点位特征。2.根据权利要求1所述的方法,其特征在于,所述基于所述采样轨迹中所述目标地图点位之间的上下文关系,以及所述目标地图点位之间的视野相似性,对所述目标地图点位进行点位特征学习,得到所述目标地图点位的目标点位特征,包括:基于所述采样轨迹中所述目标地图点位的点位特征,通过上下文模型进行上下文关系预测,得到上下文预测结果;基于所述上下文预测结果和所述采样轨迹中所述目标地图点位之间的上下文关系,确定第一损失,所述第一损失用于表征所述上下文预测结果和实际上下文点位之间的差异;基于所述目标地图点位之间的视野相似性,确定相似视野点位对和差异视野点位对;基于所述相似视野点位对中所述目标地图点位的点位特征,以及所述差异视野点位对中所述目标地图点位的点位特征,确定第二损失,所述第二损失用于表征所述相似视野点位对与所述差异视野点位对的视野相似度的差异;基于所述第一损失和所述第二损失对所述目标地图点位进行点位特征学习,得到所述目标地图点位的所述目标点位特征。3.根据权利要求2所述的方法,其特征在于,所述基于所述采样轨迹中所述目标地图点位的点位特征,通过上下文模型进行上下文关系预测,得到上下文预测结果,包括:确定所述采样轨迹中的中心点位和上下文点位;基于所述中心点位的点位特征,通过第一上下文模型,得到所述第一上下文模型输出的上下文点位概率分布,所述上下文点位概率分布用于表征所述地图中各个目标地图点位为所述上下文点位的概率;所述基于所述上下文预测结果和所述采样轨迹中所述目标地图点位之间的上下文关系,确定第一损失,包括:基于所述上下文点位概率分布中所述上下文点位对应的上下文概率,确定所述第一损失。4.根据权利要求2所述的方法,其特征在于,所述基于所述采样轨迹中所述目标地图点位的点位特征,通过上下文模型进行上下文关系预测,得到上下文预测结果,还包括:确定所述采样轨迹中的中心点位和上下文点位;基于所述上下文点位的点位特征,通过第二上下文模型,得到所述第二上下文模型输出的中心点位概率分布,所述中心点位概率分布用于表征所述地图中各个目标地图点位为所述中心点位的概率;所述基于所述上下文预测结果和所述采样轨迹中所述目标地图点位之间的上下文关
系,确定第一损失,包括:基于所述中心点位概率分布中所述中心点位对应的中心概率,确定所述第一损失。5.根据权利要求2所述的方法,其特征在于,所述基于所述目标地图点位之间的视野相似性,确定相似视野点位对和差异视野点位对,包括:构建全局点位对,所述全局点位对由第一目标地图点位和第二目标地图点位构成;基于所述可见图数据,确定所述第一目标地图点位对应的第一可见点位,以及所述第二目标地图点位对应的第二可见点位;基于所述第一可见点位以及所述第二可见点位,确定所述第一目标地图点位与所述第二目标地图点位的所述视野相似度;在所述视野相似度大于第一阈值的情况下,将所述全局点位对确定为全局相似视野点位对;在所述视野相似度小于第二阈值的情况下,将所述全局点位对确定为全局差异视野点位对,所述第二阈值小于所述第一阈值。6.根据权利要求5所述的方法,其特征在于,所述基于所述目标地图点位之间的视野相似性,确定相似视野点位对和差异视野点位对,还包括:构建局部点位对,所述局部点位对由第三目标地图点位和第四目标地图点位构成,且所述第三目标地图点位和所述第四目标地图点位之间的距离小于第一距离阈值;基于所述可见图数据,确定所述第三目标地图点位对应的第三可见点位,以及所述第四目标地图点位对应的第四可见点位;基于所述第三可见点位以及所述第四可见点位,确定所述第三目标地图点位与所述第四目标地图点位的所述视野相似度;在所述视野相似度大于第三阈值的情况下,将所述局部点位对确定为局部相似视野点位对;在所述视野相似度小于第四阈值的情况下,将所述局部点位对确定为局部差异视野点位对,所述第四阈值小于所述第三阈值。7.根据权利要...
【专利技术属性】
技术研发人员:刘立钊,朱峰明,李紫阳,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。