【技术实现步骤摘要】
使用经训练的解码器模型来进行时间序列预测
[0001]本专利技术涉及一种计算机实现的预测方法,该预测方法使用解码器模型来进行与计算机控制的系统(诸如,(半)自主交通工具)相关的时间序列预测。本专利技术进一步涉及一种训练这种解码器模型的计算机实现的训练方法,并且涉及一种使用对应于解码器模型的编码器模型来分析与计算机控制的系统相关的观测结果的计算机实现的分析方法。本专利技术进一步涉及对应于这些计算机实现方法的系统,并且涉及一种计算机可读介质。
技术介绍
[0002]在(半)自主驾驶系统中,重要的任务是分析和预测交通工具周围的环境,例如以便在识别出危险的交通情形时自动制动。这特别地涉及预测交通工具环境中的其他交通参与者(例如,其他交通工具、行人、骑自行车者等)的轨迹,该预测基于它们的观测到的先前轨迹。然而,在实践中证明,该预测任务执行起来是复杂的。
[0003]涉及随时间彼此交互的多个对象的类似预测任务也在各种其他应用领域中被发现,这些应用领域诸如机器人学(其中对象可以是机器人的组件,例如机器人臂的部分,或机器人在其中操作 ...
【技术保护点】
【技术特征摘要】
1.一种对多个交互对象进行时间序列预测以用于控制和/或监测计算机控制的系统的计算机实现的预测方法(900),其中相应对象是计算机控制的系统或其环境的一部分,所述方法包括:
‑ꢀ
访问(910)表示经训练的解码器模型的模型数据;
‑ꢀ
获得(920)观测数据,所述观测数据表示所述多个交互对象的一个或多个观测状态的时间序列,状态包括所述多个交互对象的一个或多个可测量的量的值;
‑ꢀ
基于所述一个或多个观测状态来确定(930)所述多个对象的一个或多个时不变隐特征的值;
‑ꢀ
通过以下步骤来预测(940)所述多个交互对象的至少一个接下来的状态:
‑ꢀ
应用(942)解码器模型的经训练的图模型以获得针对对象的第一预测贡献,第一预测贡献基于所述对象与多个另外的对象的成对贡献,所述对象与另外的对象的成对贡献是基于所述对象和另外的对象的时不变隐特征的值和一个或多个可测量的量的先前值来确定的;
‑ꢀ
应用(944)解码器模型的经训练的函数以获得针对所述对象的第二预测贡献,第二预测贡献基于所述对象本身的一个或多个可测量的量的先前值;
‑ꢀ
对第一和第二预测贡献进行组合(946)以获得所述对象的一个或多个可测量的量的预测值;
‑ꢀ
基于所预测的至少一个接下来的状态来生成(950)输出数据以用于控制和/或监测计算机控制的系统。2.根据权利要求1所述的预测方法(900),其中根据经训练的编码器模型来确定所述对象的一个或多个时不变隐特征的值,所述确定包括:基于所述对象与多个另外的对象的成对贡献来应用编码器模型的经训练的图模型,所述对象与另外的对象的成对贡献是根据被包括在所述一个或多个观测状态中的所述对象和另外的对象的一个或多个可测量的量的值来确定的。3.根据权利要求2所述的预测方法(600),其中时不变隐特征是具有可能值的有限集合的离散特征,所述确定时不变隐特征包括:将经训练的编码器模型的输出离散化为所述有限集合。4.根据任一项前述权利要求所述的预测方法(900),其中一个或多个可测量的量包括所述对象的位置、速度和加速度中的一个或多个。5.根据权利要求4所述的预测方法(900),其中计算机控制的系统是自主或半自主交通工具,所述多个对象包括所述交通工具的环境中的多个交通参与者。6.一种用于训练解码器模型的计算机实现的训练方法(1000),解码器模型用于对与计算机控制的系统相关的多个交互对象进行时间序列预测,其中相应对象是计算机控制的系统或其环境的一部分,所述方法包括:
‑ꢀ
访问(1010)表示多个观测到的场景的训练数据;
‑ꢀ
通过在多次迭代中进行以下步骤来训练解码器模型:
‑ꢀ
选择(1030)所述多个观测到的场景中的观测到的场景,观测到的场景表示多个交互对象的多个观测状态的时间序列,状态包括所述多个交互对象的一个或多个可测量的量的值;
‑ꢀ
获得(1040)所述多个对象的一个或多个时不变隐特征的值;
‑ꢀ
通过以下步骤、基于观测到的场景的先前状态来预测(1050)观测到的场景的状态:
‑ꢀ
应用(1052)解码器模型的图模型以获得针对对象的第一预测贡献,第一预测贡献基于所述对象与多个另外的对象的成对贡献,所述对象与另外的对象的成对贡献是基于所述对象和另外的对象的时不变隐特征的值和一个或多个可测量的量的先前值来确定的;
‑ꢀ
应用(1054)解码器模型的函数以获得针对所述对象的第二预测贡献,第二预测贡献基于所述对象本身的一个或多个可测量的量的先前值;
‑ꢀ
对第一和第二预测贡献进行组合(1056)以获得所述对象的一个或多个可测量的量的预测值;
‑ꢀ
基于将观测到的场景的状态与其预测进行比较来导出(1060)训练信号,并且基于所述训练信号来适配(1070)所述图模型和/或所述函数的参数。7.根据权利要求6所述的预测方法(1000),进一步包括训练编码器模型,编码器模型用于根据所述多个交互对象的一个或多个观测状态来确定对象的一个或多个时不变隐特征的值,所述确定包括:基于对象与多个另外的对象的成对贡献来应用编码器模型的经训练的图模型,所述对象与另外的对象的成对贡献是根据被包括在所述一个或多个观测状态中的所述对象和另外的对象的一个或多个可测量的量的值来确定的。8.根据权利要求7所述的方法(1000),其中训练解码器模型包括:作为可训练参数来联合地学习观测到的场景的对象的一个或多个时不变隐特征的值;所述方法进一步包括使用一个或多个时不变隐特征的学习值来执行对编码器模型的监督训练。9.根据权利要求8所述的方法(1000),其中所述训练数据包括对象的子集的一个或多个时不变隐特征的值和/或时不变隐特征和/或观测到的场景。10.一种分析多个交互对象的观测结果以用于控制和/或监测计算机控制的系统的计算机实现的分析方法(1100),其中相应对象是计算机控制的系统或其环境的一部分,所述方法包括:
‑ꢀ
访问(1110)表示经训练的编码器模型的模型数据,编码器模型是根据权利要求7所述的方法、与解码器模型相结合地训练的;
‑ꢀ
获得(1120)观测数据,所述观测数据表示所述多个交互对象的一个或多个观测状态的时间序列,状态包括所述多个交互对象的一个或多个可测量的量的值;...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。