【技术实现步骤摘要】
本公开涉及计算机应用,尤其涉及一种轨迹预测及其模型的训练方法、装置、存储介质、设备。
技术介绍
1、扩散策略是一类基于扩散模型的新型决策生成方法,通过模拟物理扩散过程优化动作,在智能体(如机器人)控制领域展现出显著优势。机器人操作任务过程中进行轨迹预测时所使用的轨迹预测模型,主要基于扩散模型(diffusion models)和流匹配模型(flowmatching models)生成满足特定分布的数据,基于这些数据训练得到的。在训练轨迹预测模型的阶段通常需要进行较多次的迭代,存在训练效率低、成本高的缺陷,导致在应用轨迹预测模型执行操作任务时,生成轨迹速度缓慢,难以满足机器人操作任务中快速响应的需求。
技术实现思路
1、为了解决上述技术问题,本公开提供了一种轨迹预测及其模型的训练方法、装置、存储介质、设备,在训练轨迹预测模型时引入自我一致性目标,不仅能够降低计算复杂度和训练成本、提高训练效率,而且基于训练得到的轨迹预测模型进行轨迹预测,能够确保快速地输出具有一致性的预测轨迹,满足机器人操作任
...【技术保护点】
1.一种轨迹预测模型的训练方法,包括:
2.根据权利要求1所述的方法,其中,确定多个样本数据,以及各所述样本数据对应的噪声数据,包括:
3.根据权利要求1所述的方法,其中,所述对所述轨迹数据和所述噪声数据进行扩散处理,得到扩散数据,包括:
4.根据权利要求1所述的方法,还包括:
5.根据权利要求1所述的方法,其中,所述根据所述观测数据中的第二观测子数据、所述扩散数据中的第二扩散子数据和所述初始轨迹预测模型,确定所述轨迹自我一致性目标值,包括:
6.根据权利要求4所述的方法,其中,所述将所述观测数据、所述扩散数
...【技术特征摘要】
1.一种轨迹预测模型的训练方法,包括:
2.根据权利要求1所述的方法,其中,确定多个样本数据,以及各所述样本数据对应的噪声数据,包括:
3.根据权利要求1所述的方法,其中,所述对所述轨迹数据和所述噪声数据进行扩散处理,得到扩散数据,包括:
4.根据权利要求1所述的方法,还包括:
5.根据权利要求1所述的方法,其中,所述根据所述观测数据中的第二观测子数据、所述扩散数据中的第二扩散子数据和所述初始轨迹预测模型,确定所述轨迹自我一致性目标值,包括:
6.根据权利要求4所述的方法,其中,所述将所述观测数据、所述扩散数据输入所述初始轨迹预测模型进行轨迹预测,得到轨迹预测值,包括:
7.根据权利要求6所述的方法,其中,所述基于所述轨迹流匹配目标值、所述轨迹自我一致性...
【专利技术属性】
技术研发人员:请求不公布姓名,于海泳,隋伟,
申请(专利权)人:深圳地瓜机器人有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。