当前位置: 首页 > 专利查询>吉林大学专利>正文

合作博弈交互图模型训练方法、系统及车辆轨迹预测系统技术方案

技术编号:33663665 阅读:9 留言:0更新日期:2022-06-02 20:45
本发明专利技术公开了一种合作博弈交互图模型训练方法、系统及车辆轨迹预测系统,其中,训练方法包括:获取样本数据集并进行预处理;将多个车辆的历史数据和道路拓扑信息一起进行对比学习,得到各个车辆轨迹的抽象表达;将道路拓扑信息和各个车辆轨迹的抽象表达单独编码为子图;基于初始合作博弈交互图模型将所有子图建立关系,得到车辆预测轨迹的抽象表达;将车辆预测轨迹的抽象表达和道路拓扑信息进行解码,得到所有参与车辆的预测轨迹;将预测轨迹与真实数据比较,得到误差;基于误差,对初始合作博弈交互图模型参数进行调整,直至误差低于预设阈值。本发明专利技术结合对比学习和合作博弈方式建模,能够提高模型的泛化性、可解释和预测准确率。确率。确率。

【技术实现步骤摘要】
合作博弈交互图模型训练方法、系统及车辆轨迹预测系统


[0001]本专利技术涉及无人驾驶车辆轨迹预测
,更具体的说是涉及一种合作博弈交互图模型训练方法、系统及车辆轨迹预测系统。

技术介绍

[0002]为了提高自动驾驶车辆的决策和交互能力,自动驾驶车辆必须实时预测周围车辆的运动轨迹,只有充分考虑了周围车辆的轨迹,才能决策规划出安全高效的控制动作。然而在实际交通环境中,往往有以下几点使得预测车辆轨迹变为极为困难:1)驾驶意图不固定,可能存在突然改变的行为。2)多个车辆相互交互,不仅仅得考虑本车的情况,也得考虑本车在什么情况下和周围车辆交互产生了轨迹。3)预测的轨迹必须符合交通规则和道路拓扑信息。
[0003]现有的预测方法根据是否利用深度学习,可以分为:传统方法和深度学习方法。传动方法又可以分为基于物理模型和基于传统机器学习方法。基于物理模型利用了物理原理来建立车辆的运动学或动力学模型,通过参数辨识的方法得到模型参数,从而通过物理模型来预测车辆的轨迹。该类方法只能处理较短时间内的轨迹预测,长期预测则不是很准确;基于传统机器学习的方法有隐马尔可夫,支持向量机等,主要利用车辆轨迹是基于一定的驾驶意图产生的,往往通过数据来估计隐藏的参数,然后在线预测车辆的轨迹。此类方法可以预测长时间的轨迹,但是需要的计算资源变大,有时候无法满足实时性。
[0004]得益于深度学习的发展,很多在图像和自然语言中发展很好的神经网络结构被应用到自动驾驶车辆轨迹预测中。常常被用作交互预测的神经网络结构和机制有:注意力机制,时空图网络,特征池化等。但是,基于数据训练的神经网络也存在的自身问题,比如泛化性,即对训练集外的数据不能很好的应用。同时如何处理多车交互也是复杂环境中车辆轨迹预测的一个难点。
[0005]因此,如何提供一种将神经网络预测模型中的泛化性考虑进来,将各车之的交互通过合作博弈显式建模,以提高模型预测准确率的合作博弈交互图模型训练方法、系统及车辆轨迹预测系统,是本领域技术人员亟需解决的问题。

技术实现思路

[0006]有鉴于此,本专利技术提供了一种合作博弈交互图模型训练方法、系统及车辆轨迹预测系统,将值得关注的所有车辆看作合作博弈的参与者,每个参与者都会在符合交通规则的前提下,尽可能选择安全且提高整个通行效率的轨迹,从而将各车之的交互通过合作博弈方式建模,提高了模型的可解释和预测准确率。
[0007]为了实现上述目的,本专利技术采用如下技术方案:
[0008]一种合作博弈交互图模型训练方法,包括:
[0009]获取样本数据集并进行预处理;
[0010]将多个车辆的历史数据和道路拓扑信息一起进行对比学习,得到各个车辆轨迹的
抽象表达;
[0011]将所述道路拓扑信息单独编码为子图,并将所述各个车辆轨迹的抽象表达分别单独编码为其他子图;
[0012]基于预先构建的初始合作博弈交互图模型将所有的所述子图建立关系,得到车辆预测轨迹的抽象表达;
[0013]将所述车辆预测轨迹的抽象表达和所述道路拓扑信息同时输入到条件解码器中,得到所有参与车辆的预测轨迹;
[0014]将所述预测轨迹与真实数据进行比较,得到综合误差;
[0015]基于所述综合误差,对所述初始合作博弈交互图模型参数进行调整更新,直至所述综合误差低于预设阈值,得到最终的合作博弈交互图模型。
[0016]进一步的,在上述一种合作博弈交互图模型训练方法中,所述数据集样本包括各个车辆的自身数据、轨迹数据和对应的道路拓扑信息。
[0017]进一步的,在上述一种合作博弈交互图模型训练方法中,各个车辆的自身数据至少包括:车辆id、车辆宽度和车辆类型;各个车辆的轨迹数据至少包括:x方向坐标、y方向坐标、车速和车辆航向角;道路拓扑信息至少包括:与各车辆对应的车道边界线信息、中心线信息、行驶方向、最高限速和交通标志。
[0018]进一步的,在上述一种合作博弈交互图模型训练方法中,所述将多个车辆的历史数据和道路拓扑信息一起进行对比学习,得到各个车辆轨迹的抽象表达,包括:
[0019]将每个车辆的轨迹信息和道路拓扑信息作为输入数据;
[0020]通过一个编码器将输入数据进行投影,得到各个车辆轨迹的抽象表达,并以x方向和y方向的坐标增量和速度增量作为衡量各个轨迹的相似度指标,相似度越高,对应的车辆轨迹的抽象表达越相似。
[0021]进一步的,在上述一种合作博弈交互图模型训练方法中,所述合作博弈交互图模型对所有子图建立关系时,采用如下收益函数:
[0022][0023][0024][0025]其中,表示合作博弈的收益;p1表示安全收益;p2表示舒适性收益;m表示车辆总数量;i表示包括本车在内的m个车辆中的第i个车辆;j表示除了本车以外的m

1车辆中第j个车辆;t表示预测第t个时刻;表示第i个车辆在t

1时刻点的速度;表示第i个车辆在t时刻点的速度;表示第i个车辆在t+1时刻点的速度;表示预测轨迹状态,表示判断预测状态是不是碰到边界线,表示判断本车辆和除了本车之外的车辆
是不是发生碰撞,表示评估预测速度之间的变化;a,b表示超参数。
[0026]进一步的,在上述一种合作博弈交互图模型训练方法中,所述综合误差的计算公式为:
[0027][0028][0029]其中,表示模型轨迹预测误差;P表示整体的综合误差,是合作博弈收益和轨迹预测误差的加权;s
i
表示预测轨迹状态的真实值;a,b,c表示超参数。
[0030]本专利技术还提供一种合作博弈交互图模型训练系统,包括:
[0031]数据获取模块,用于获取样本数据集并进行预处理;
[0032]对比学习模块,用于将多个车辆的历史数据和道路拓扑信息一起进行对比学习,得到各个车辆轨迹的抽象表达;
[0033]子图编码模块,用于将所述道路拓扑信息单独编码为子图,并将所述各个车辆轨迹的抽象表达分别单独编码为其他子图;
[0034]轨迹预测模块,用于利用预先构建的初始合作博弈交互图模型将所有的所述子图建立关系,得到车辆预测轨迹的抽象表达;
[0035]解码模块,用于将所述车辆预测轨迹的抽象表达和所述道路拓扑信息同时输入到条件解码器中,得到所有参与车辆的预测轨迹;以及
[0036]参数调整模块,用于将所述预测轨迹与真实数据进行比较,得到综合误差,并基于所述综合误差,对所述初始合作博弈交互图模型参数进行调整更新,直至综合误差低于预设阈值,得到最终的合作博弈交互图模型。
[0037]本专利技术还提供一种车辆轨迹预测系统,包括:
[0038]环境信息提取模块,用于实时提取车辆行驶过程中周围的车辆数据和道路拓扑信息;
[0039]在线预测模块,用于将实时提取的车辆行驶过程中周围的车辆数据和道路拓扑信息输入至采用上述训练方法所训练好的合作博弈交互图模型中,对所有参与车辆的轨迹进行预测;
[0040]数据保存本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合作博弈交互图模型训练方法,其特征在于,包括:获取样本数据集并进行预处理;将多个车辆的历史数据和道路拓扑信息一起进行对比学习,得到各个车辆轨迹的抽象表达;将所述道路拓扑信息单独编码为子图,并将所述各个车辆轨迹的抽象表达分别单独编码为其他子图;基于预先构建的初始合作博弈交互图模型将所有的所述子图建立关系,得到车辆预测轨迹的抽象表达;将所述车辆预测轨迹的抽象表达和所述道路拓扑信息同时输入到条件解码器中,得到所有参与车辆的预测轨迹;将所述预测轨迹与真实数据进行比较,得到综合误差;基于所述综合误差,对所述初始合作博弈交互图模型参数进行调整更新,直至所述综合误差低于预设阈值,得到最终的合作博弈交互图模型。2.根据权利要求1所述的一种合作博弈交互图模型训练方法,其特征在于,所述数据集样本包括各个车辆的自身数据、轨迹数据和对应的道路拓扑信息。3.根据权利要求2所述的一种合作博弈交互图模型训练方法,其特征在于,各个车辆的自身数据至少包括:车辆id、车辆宽度和车辆类型;各个车辆的轨迹数据至少包括:x方向坐标、y方向坐标、车速和车辆航向角;道路拓扑信息至少包括:与各车辆对应的车道边界线信息、中心线信息、行驶方向、最高限速和交通标志。4.根据权利要求1所述的一种合作博弈交互图模型训练方法,其特征在于,所述将多个车辆的历史数据和道路拓扑信息一起进行对比学习,得到各个车辆轨迹的抽象表达,包括:将每个车辆的轨迹信息和道路拓扑信息作为输入数据;通过一个编码器将输入数据进行投影,得到各个车辆轨迹的抽象表达,并以x方向和y方向的坐标增量和速度增量作为衡量各个轨迹的相似度指标,相似度越高,对应的车辆轨迹的抽象表达越相似。5.根据权利要求1所述的一种合作博弈交互图模型训练方法,其特征在于,所述合作博弈交互图模型对所有子图建立关系时,采用如下收益函数:弈交互图模型对所有子图建立关系时,采用如下收益函数:弈交互图模型对所有子图建立关系时,采用如下收益函数:其中,表示合作博弈的收益;p1表示安全收益;p2表示舒适性收益;m表示车辆总数量;i表示包括本车在内的m个车辆中的第i个车辆;j表示除了本车以外的m

1车辆...

【专利技术属性】
技术研发人员:李鑫范佳琦曲婷高炳钊
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1