System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于不确定性感知的持续学习轨迹预测系统技术方案_技高网

一种基于不确定性感知的持续学习轨迹预测系统技术方案

技术编号:40545824 阅读:5 留言:0更新日期:2024-03-05 19:03
本发明专利技术公开了一种基于不确定性感知的持续学习轨迹预测系统,包括基模型,用于进行轨迹预测任务;不确定性感知记忆模块,采用将基模型转变为贝叶斯网络,计算轨迹样本的不确定度,计算完每个轨迹样本的不确定度后进行排序,将不确定度最高和最低的轨迹样本存储在记忆内存中作为条件样本;条件生成记忆回放模块,将当前任务的轨迹样本和条件样本编码处理后通过多头注意力模块得到注意力输出,再通过条件变分编码器进行条件变分推理生成用于重放的轨迹记忆样本。本发明专利技术避免了排练方法大量工作内存需求以及伪排练生成数据不真实且不具有鉴别性的问题,有效减少了持续学习灾难性遗忘问题,提高了自动驾驶轨迹预测系统的鲁棒性和可靠性。

【技术实现步骤摘要】

本专利技术涉及车辆自动驾驶,具体地讲,是涉及一种基于不确定性感知的持续学习轨迹预测系统


技术介绍

1、对于一个安全有效的自动驾驶系统来说,一个重要的技术就是预测周围车辆的未来行为,从而帮助自动驾驶车辆做出适当的决策。由于现实中道路环境的复杂性和多样性,对于一个可靠的轨迹预测系统需要在不断变化的道路交通场景中安全有效的运行,是一项极具挑战性的任务。

2、随着硬件和自动驾驶基础设施的快速发展,车辆轨迹数据量在不断的快速增长,因此许多现有的工作致力于采用数据驱动的方法。然而,目前的轨迹预测模型都是采用离线学习的策略,在一个包含全部场景的数据集上进行离线训练来实现良好的预测性能。这种方式需要大量的存储空间,并且如果有新的道路场景数据,模型只能重新在所有数据集上从头开始训练,需要大量的训练时间。而另一种更有效的方式则是采用持续学习策略,通过持续学习算法,模型在一个连续的数据流上进行训练,只需要在新的数据上更新原来的模型,而不需要重新训练和存储旧的数据集,节省了存储空间以及训练时间,模型具有持续学习能力能够不断学习新的数据适应新的道路场景。

3、目前对于持续学习轨迹预测任务存在如下问题:(1)相关工作很少,对于是否能将持续学习应用到轨迹预测任务以及轨迹预测模型在持续学习设置中的效果都没有进行详细的研究。(2)具有挑战,目前大多数持续学习方法主要应用于图像分类任务,但是轨迹数据具有复杂的时空数据结构,涉及高维回归任务,将持续学习应用于轨迹预测存在挑战。(3)现有的方法存在问题,需要显式的存储旧的轨迹数据到内存中进行回放,对于克服持续学习灾难性遗忘的效果也有所不足。


技术实现思路

1、针对上述现有技术中的上述问题,本专利技术提供一种基于不确定性感知的持续学习轨迹预测系统,结合排练和伪排练的优势,有效避免了排练方法大量工作内存需求以及伪排练生成数据不真实且不具有鉴别性的问题,有效减少了持续学习灾难性遗忘问题,提高了自动驾驶轨迹预测系统的鲁棒性和可靠性。

2、为了实现上述目的,本专利技术采用的技术方案如下:

3、一种基于不确定性感知的持续学习轨迹预测系统,包括基模型、不确定性感知记忆模块和条件生成记忆回放模块,其中,

4、所述基模型用于进行轨迹预测任务,通过输入轨迹样本测输出未来轨迹;

5、所述不确定性感知记忆模块,采用蒙特卡洛dropout算法将基模型转变为贝叶斯网络bnn,使用贝叶斯网络计算轨迹样本x的不确定度,计算完每个轨迹样本的不确定度后进行排序,将不确定度最高和最低的轨迹样本存储在记忆内存中作为条件样本xinit;

6、所述条件生成记忆回放模块,将当前任务的轨迹样本和条件样本编码处理后通过多头注意力模块得到注意力输出,再结合条件样本通过条件变分自编码器进行条件变分推理生成用于重放的轨迹记忆样本xr;

7、在持续学习过程的训练阶段,对于每个任务j,基模型通过输入的一组特定于任务的轨迹样本xj和一组重放的轨迹记忆样本输出得到当前任务和重放的观察轨迹场景的预测未来轨迹和并根据地面真实未来轨迹yj和利用损失函数对基模型进行优化;

8、不确定性感知记忆模块和条件生成记忆回放模块通过输入的一组特定于任务的轨迹样本xj和一组重放的轨迹记忆样本输出得到当前任务和重放的轨迹和并根据输入的轨迹样本xj和轨迹记忆样本作为真实值,利用损失函数对不确定性感知记忆模块和条件生成记忆回放模块进行优化;

9、完成训练阶段后进入记忆重放阶段,为下一个任务j+1准备需要重放的轨迹记忆样本,由不确定性感知记忆模块从任务j中获取条件样本,再由条件生成记忆回放模块根据该条件样本和任务j的轨迹数据xj生成用于在任务j+1中作为重放的轨迹记忆样本将轨迹记忆样本输入任务j中训练优化后的基模型,输出得到用于在任务j+1中的地面真实未来轨迹

10、具体地,所述基模型采用一个基于lstm的编码器-解码器架构,输入的轨迹样本通过一个全连接层和一个lstm编码器进行编码后,再通过一个lstm解码器和另一个全连接层输出预测的未来轨迹。

11、具体地,所述不确定性感知记忆模块采用蒙特卡洛dropout算法将基模型转变为贝叶斯网络bnn进行变分推理,通过t次前向传播的方差来衡量轨迹样本的不确定度,公式表示为:

12、

13、其中,u(xi)表示轨迹样本xi的不确定度,表示输出的预测值,e(y)表示输出预测的均值。

14、具体地,所述条件生成记忆回放模块包括由lstm编码器、多头注意力模块和cvae编码器依次连接构成的编码单元,以及由cvae解码器、lstm解码器和一个全连接层依次连接构成的解码单元,其中cvae编码器和cvae解码器通过潜在空间映射关联,由该lstm编码器输入当前任务的轨迹样本和条件样本,由该全连接层输出用于重放的轨迹记忆样本。

15、具体地,所述条件生成记忆回放模块通过lstm编码器输入当前任务的轨迹样本x和条件样本xinit,并输出编码后轨迹样本x和条件样本xinit的一组隐藏特征,公式表示为:

16、

17、其中,emb()表示一个具有relu非线性的嵌入函数,lstm编码得到的隐藏特征表示为是车辆i在t时刻的动力学特征,wenc表示lstm编码器的权重,所有的lstm编码器都共享相同的权重。

18、具体地,所述条件生成记忆回放模块将隐藏特征中的特征输入到多头注意力模块,并将每个车辆的特征输入嵌入到一组查询q、一组键k和一组值v中,表示为:

19、

20、其中,mlp()表示多层感知器,分别表示对应的注意力权重;

21、随后对每个头h进行自注意力计算得到输入车辆特征之间的相互依赖关系,头h的注意力计算公式表示为:

22、

23、多头注意力模块并行执行h次注意力计算,将每个独立注意输出头进行拼接并使用wo线性转换为q的相同纬度,获得的输出结果表示为:

24、

25、具体地,所述条件生成记忆回放模块中的cvae编码器为条件变分编码器,将多头注意力模块的输出结果和条件样本xinit通过条件变分编码器映射到潜在空间分布,表示为后验分布其中z={zi}i=1:n并且zi是第i个代理的高斯随机变量,从中可以采样新的潜在场景点z。

26、具体地,所述条件生成记忆回放模块中的cvae解码器为条件变分解码器,表示为p(x|z,xinit),根据采样的潜在场景点z解码为适当的特征点,然后通过lstm解码器根据条件样本xinit分别解码每个一致的特征点到一个轨迹场景,由此输出重构的轨迹场景,并根据条件变分编码器的训练损失,最终输出用于重放的轨迹记忆样本xr。

27、具体地,所述cvae编码器的参数定义为记为cvae解码器的参数定义为θ,记为pθ(x|z,xinit),则条件变分编码器的训练损失表示为:

28、

29、其中,kl为kullb本文档来自技高网...

【技术保护点】

1.一种基于不确定性感知的持续学习轨迹预测系统,其特征在于,包括基模型、不确定性感知记忆模块和条件生成记忆回放模块,其中,

2.根据权利要求1所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述基模型采用一个基于LSTM的编码器-解码器架构,输入的轨迹样本通过一个全连接层和一个LSTM编码器进行编码后,再通过一个LSTM解码器和另一个全连接层输出预测的未来轨迹。

3.根据权利要求2所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述不确定性感知记忆模块采用蒙特卡洛Dropout算法将基模型转变为贝叶斯网络BNN进行变分推理,通过T次前向传播的方差来衡量轨迹样本的不确定度,公式表示为:

4.根据权利要求3所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述条件生成记忆回放模块包括由LSTM编码器、多头注意力模块和CVAE编码器依次连接构成的编码单元,以及由CVAE解码器、LSTM解码器和一个全连接层依次连接构成的解码单元,其中CVAE编码器和CVAE解码器通过潜在空间映射关联,由该LSTM编码器输入当前任务的轨迹样本和条件样本,由该全连接层输出用于重放的轨迹记忆样本。

5.根据权利要求4所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述条件生成记忆回放模块通过LSTM编码器输入当前任务的轨迹样本X和条件样本Xinit,并输出编码后轨迹样本X和条件样本Xinit的一组隐藏特征,公式表示为:

6.根据权利要求5所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述条件生成记忆回放模块将隐藏特征中的特征输入到多头注意力模块,并将每个车辆的特征输入嵌入到一组查询Q、一组键K和一组值V中,表示为:

7.根据权利要求6所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述条件生成记忆回放模块中的CVAE编码器为条件变分编码器,将多头注意力模块的输出结果和条件样本Xinit通过条件变分编码器映射到潜在空间分布,表示为后验分布其中Z={zi}i=1:N并且zi是第i个代理的高斯随机变量,从中可以采样新的潜在场景点Z。

8.根据权利要求7所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述条件生成记忆回放模块中的CVAE解码器为条件变分解码器,表示为P(X|Z,Xinit),根据采样的潜在场景点Z解码为适当的特征点,然后通过LSTM解码器根据条件样本Xinit分别解码每个一致的特征点到一个轨迹场景,由此输出重构的轨迹场景,并根据条件变分编码器的训练损失,最终输出用于重放的轨迹记忆样本Xr。

9.根据权利要求8所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述CVAE编码器的参数定义为记为CVAE解码器的参数定义为θ,记为Pθ(X|Z,Xinit),则条件变分编码器的训练损失表示为:

10.根据权利要求1-9任一项所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述利用损失函数对基模型进行优化表示为:

...

【技术特征摘要】

1.一种基于不确定性感知的持续学习轨迹预测系统,其特征在于,包括基模型、不确定性感知记忆模块和条件生成记忆回放模块,其中,

2.根据权利要求1所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述基模型采用一个基于lstm的编码器-解码器架构,输入的轨迹样本通过一个全连接层和一个lstm编码器进行编码后,再通过一个lstm解码器和另一个全连接层输出预测的未来轨迹。

3.根据权利要求2所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述不确定性感知记忆模块采用蒙特卡洛dropout算法将基模型转变为贝叶斯网络bnn进行变分推理,通过t次前向传播的方差来衡量轨迹样本的不确定度,公式表示为:

4.根据权利要求3所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述条件生成记忆回放模块包括由lstm编码器、多头注意力模块和cvae编码器依次连接构成的编码单元,以及由cvae解码器、lstm解码器和一个全连接层依次连接构成的解码单元,其中cvae编码器和cvae解码器通过潜在空间映射关联,由该lstm编码器输入当前任务的轨迹样本和条件样本,由该全连接层输出用于重放的轨迹记忆样本。

5.根据权利要求4所述的基于不确定性感知的持续学习轨迹预测系统,其特征在于,所述条件生成记忆回放模块通过lstm编码器输入当前任务的轨迹样本x和条件样本xinit,并输出编码后轨迹样本x和条件样本xinit的一组隐藏特征,公式表示为:

6...

【专利技术属性】
技术研发人员:郑凯苏涵冯秀实刘顺程
申请(专利权)人:电子科技大学长三角研究院衢州
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1