System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及轨迹预测,尤其涉及一种防碰撞轨迹预测模型训练方法和装置。
技术介绍
1、在拥挤空间行走时,人类具有社会意识,会本能地来预测他人的未来动作。这种本能不仅能与他人保持舒适距离,还能提前识别潜在危险或不适。因此,学习具有社会意识的运动表征是人类轨迹预测和机器人在拥挤空间中导航的最新研究的核心。但是,当训练集缺乏从危险场景收集到的样本时,建立能够识别潜在危险或不适的轨迹预测模型是具有挑战性的。现有基于神经网络的运动模型虽然能够进行轨迹预测,但是偶尔仍会输出不可接受的轨迹预测方案,例如输出碰撞轨迹,这对现实世界应用推广会产生重大安全隐患。
2、因此,如何能够建立基于社交感知的运动表征来实现轨迹预测,输出能够有效防碰撞的轨迹预测结果,提高轨迹预测的安全可靠性,是需要解决的技术问题。
技术实现思路
1、本申请意在提供一种防碰撞轨迹预测模型训练方法、装置、电子设备和存储介质,所要解决的技术问题通过以下技术方案来实现。
2、本实施例第一方面,提出了一种防碰撞轨迹预测模型训练方法,包括:
3、获得多个智能体在当前时刻的历史轨迹样本数据集和未来轨迹样本数据集,所述未来轨迹样本数据集包括未来轨迹负样本和未来轨迹正样本;
4、基于编码器-解码器结构,构建防碰撞轨迹预测模型,所述防碰撞轨迹预测模型包括社交感知运动特征提取单元和对比学习单元;
5、输入所述历史轨迹样本、所述未来轨迹正样本和所述未来轨迹负样本至所述防碰撞轨迹预测模型,获得防碰撞
6、依据目标损失函数迭代更新所述防碰撞轨迹预测模型的模型参数,直至达到预设的迭代终止条件,以便获得经训练的所述防碰撞轨迹预测模型;所述目标损失函数由轨迹预测任务损失函数和防碰撞损失函数确定。
7、进一步地,获得多个智能体在当前时刻的历史轨迹样本数据集包括从开始时刻至当前时刻获得历史轨迹样本数据集 {s1,⋯,st},其中m为智能体数量,以及表示第 i个智能体在当前时刻 t的二维坐标;
8、和/或,获得多个智能体在当前时刻的未来轨迹样本数据集包括从当前时刻的下一时刻至结束时刻获得未来轨迹样本数据集 {st+1,⋯,st};其中 t为结束时刻。
9、进一步地,依据当前智能体i的多个邻接智能体 j的未来轨迹和多个社交舒适区域局部位移,获得多个未来轨迹负样本
10、;
11、其中,为采样界限,为当前智能体 i和邻接智能体j之间最小物理距离;为在社交舒适区域的局部位移,为采样夹角,;为在每个采样位置添加的随机扰动,为小常量, i为标准方差;
12、和/或,依据当前智能体 i的未来轨迹,获得1个未来轨迹正样本。
13、进一步地,所述防碰撞轨迹预测模型的所述社交感知运动特征提取单元包括第一多层感知机和第二多层感知机;所述第一多层感知机被配置为获取历史轨迹序列嵌入特征向量;所述第二多层感知机被配置为获取未来轨迹序列嵌入特征向量。
14、进一步地,获取历史轨迹序列嵌入特征向量,包括:
15、将所述历史轨迹样本数据输入至所述防碰撞轨迹预测模型的所述编码器,获得当前时刻下当前智能体的历史轨迹序列特征
16、,
17、其中, fs为编码器 f的序列生成模块, fi为编码器f的交互模块;为前一时刻当前智能体的历史轨迹序列特征;为当前智能体 i从开始时刻至当前时刻t获得历史轨迹样本;
18、将多个智能体的历史轨迹序列特征输入至所述第一多层感知机,获得当前时刻历史轨迹序列嵌入特征向量,其中,为所述第一多层感知机的投影头。
19、进一步地,将多个智能体的未来轨迹输入至所述第二多层感知机,获取未来轨迹序列嵌入特征向量,其中,为采样的未来轨迹,包括未来轨迹正样本和未来轨迹负样本;为所述第二多层感知机的事件编码器;且。
20、进一步地,所述对比学习单元被配置为依据将历史轨迹序列嵌入特征向量和未来轨迹序列嵌入特征向量,进行对比学习。
21、进一步地,依据所述对比学习单元,确定所述防碰撞损失函数
22、,
23、其中,为超参数。
24、进一步地,由轨迹预测任务损失函数和防碰撞损失函数确定所述目标损失函数
25、,
26、其中,轨迹预测任务损失函数,为所述防碰撞轨迹预测模型的解码器;为防碰撞损失函数权重值。
27、本实施例第二方面,提出了一种防碰撞轨迹预测模型训练装置,包括:
28、样本数据集获取模块,被配置为获取多个智能体在当前时刻的历史轨迹样本数据集和未来轨迹样本数据集,所述未来轨迹样本数据集包括未来轨迹负样本和未来轨迹正样本;
29、模型构建模块,被配置为基于编码器-解码器结构,构建防碰撞轨迹预测模型,所述防碰撞轨迹预测模型包括社交感知运动特征提取单元和对比学习单元;
30、轨迹预测结果获取模块,被配置为输入所述历史轨迹样本、所述未来轨迹正样本和所述未来轨迹负样本至所述防碰撞轨迹预测模型,获取防碰撞轨迹预测结果;
31、模型训练模块,被配置为依据目标损失函数迭代更新所述防碰撞轨迹预测模型的模型参数,直至达到预设的迭代终止条件,以便获得经训练的所述防碰撞轨迹预测模型;所述目标损失函数由轨迹预测任务损失函数和防碰撞损失函数确定。
32、本实施例第三方面,提出了一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,所述处理器在执行所述计算机程序时,实现如第一方面所述的防碰撞轨迹预测模型训练方法的步骤。
33、本实施例第四方面,提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的防碰撞轨迹预测模型训练方法的步骤。
34、本申请实施例包括以下优点:
35、本申请实施例提供的防碰撞轨迹预测模型训练方法,通过获得多个智能体在当前时刻的历史轨迹样本数据集和未来轨迹样本数据集,未来轨迹样本数据集包括未来轨迹负样本和未来轨迹正样本;基于编码器-解码器结构,构建防碰撞轨迹预测模型,防碰撞轨迹预测模型包括社交感知运动特征提取单元和对比学习单元;输入历史轨迹样本、未来轨迹正样本和未来轨迹负样本至防碰撞轨迹预测模型,获得防碰撞轨迹预测结果;依据目标损失函数迭代更新防碰撞轨迹预测模型的模型参数,以便获得经训练的防碰撞轨迹预测模型。本申请基于社交感知的运动表征来实现轨迹预测,输出能够有效防碰撞的轨迹预测结果,提高轨迹预测的安全可靠性。
本文档来自技高网...【技术保护点】
1.一种防碰撞轨迹预测模型训练方法,其特征在于,包括:
2.根据权利要求1所述的防碰撞轨迹预测模型训练方法,其特征在于,获得多个智能体在当前时刻的历史轨迹样本数据集包括从开始时刻至当前时刻获得历史轨迹样本数据集{s1,⋯,st},其中为智能体数量, 以及表示第i个智能体在当前时刻t的二维坐标;
3.根据权利要求2所述的防碰撞轨迹预测模型训练方法,其特征在于,依据当前智能体的多个邻接智能体j的未来轨迹和多个社交舒适区域局部位移,获得多个未来轨迹负样本
4.根据权利要求1所述的防碰撞轨迹预测模型训练方法,其特征在于,所述防碰撞轨迹预测模型的所述社交感知运动特征提取单元包括第一多层感知机和第二多层感知机;所述第一多层感知机被配置为获取历史轨迹序列嵌入特征向量;所述第二多层感知机被配置为获取未来轨迹序列嵌入特征向量。
5.根据权利要求4所述的防碰撞轨迹预测模型训练方法,其特征在于,获取历史轨迹序列嵌入特征向量,包括:
6.根据权利要求5所述的防碰撞轨迹预测模型训练方法,其特征在于,将多个智能体的未来轨迹输入至所述第二多层感知机,
7.根据权利要求6所述的防碰撞轨迹预测模型训练方法,其特征在于,所述对比学习单元被配置为依据将历史轨迹序列嵌入特征向量和未来轨迹序列嵌入特征向量,执行对比学习任务。
8.根据权利要求7所述的防碰撞轨迹预测模型训练方法,其特征在于,确定所述对比学习任务的所述防碰撞损失函数
9.根据权利要求8所述的防碰撞轨迹预测模型训练方法,其特征在于,依据轨迹预测任务损失函数和防碰撞损失函数,确定所述目标损失函数
10.一种防碰撞轨迹预测模型训练装置,其特征在于,包括:
...【技术特征摘要】
1.一种防碰撞轨迹预测模型训练方法,其特征在于,包括:
2.根据权利要求1所述的防碰撞轨迹预测模型训练方法,其特征在于,获得多个智能体在当前时刻的历史轨迹样本数据集包括从开始时刻至当前时刻获得历史轨迹样本数据集{s1,⋯,st},其中为智能体数量, 以及表示第i个智能体在当前时刻t的二维坐标;
3.根据权利要求2所述的防碰撞轨迹预测模型训练方法,其特征在于,依据当前智能体的多个邻接智能体j的未来轨迹和多个社交舒适区域局部位移,获得多个未来轨迹负样本
4.根据权利要求1所述的防碰撞轨迹预测模型训练方法,其特征在于,所述防碰撞轨迹预测模型的所述社交感知运动特征提取单元包括第一多层感知机和第二多层感知机;所述第一多层感知机被配置为获取历史轨迹序列嵌入特征向量;所述第二多层感知机被配置为获取未来轨迹序列嵌入特征向量。
5.根据权利要求4所述的防碰撞轨迹预测模型训练...
【专利技术属性】
技术研发人员:栾明君,宁阳,张磊,李生珍,洪岩,袁泉,陈艳,沈尚博,张军尧,
申请(专利权)人:中国电子科技集团公司第十五研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。