一种用于意图理解的语义增强预训练方法技术

技术编号:46062778 阅读:8 留言:0更新日期:2025-08-11 15:48
本公开提供一种用于意图理解的语义增强预训练方法。包括语义增强预训练框架和意图理解微调框架,针对处理轨迹预测信息的模型,对轨迹预测意图理解模型进行训练:所述语义增强预训练框架,首先需要设计细粒度序列重建任务和粗粒度意图对比任务;所述细粒度序列重建任务采用时间维度的掩码策略,所述粗粒度意图对比任务通过添加基于相似性的损失,所述意图理解微调框架利用多模态未来解码器生成目标主体的多模态预测意图。从而实现提高模型在不同场景下对主体未来意图的预测性能,尤其是在长尾场景下的预测能力的效果。

【技术实现步骤摘要】

本公开涉及计算机领域,更具体地讲,涉及一种用于意图理解的语义增强预训练方法


技术介绍

1、轨迹编码用于代理历史轨迹特征的学习。借鉴于自然语言处理等时间序列建模方法,循环神经网络[24](recurrentneuronal network,rnn)以及其变体长短时记忆网络(long shortterm memory,lstm),门控递归单元(gate recurrent unit,gru)等常被用于提取轨迹序列的时域特征。通常,每个代理的的历史轨迹单独采用循环神经网络或一维卷积神经网络来处理,以提取其轨迹表征。还有一部分学者[30]对场景内的代理轨迹形成整体表示,采用二维卷积神经网络直接提取场景整体的深度特征,学习个体运动时空相关性,再通过对场景整体表征索引得到每个个体对应的表征。

2、轨迹解码关注如何生成代理的最终轨迹。上述循环神经网络等模型的使用着重于提高模型对输入数据的表征能力,轨迹解码相关研究则关注输出的数据表示、多模轨迹输出、损失函数设计等方面。输出表示按照输出轨迹的类型可以分为输出轨迹序列、输出轨迹概率分布两类。输出轨迹序列简单直观本文档来自技高网...

【技术保护点】

1.一种用于意图理解的语义增强预训练方法,其特征在于,包括语义增强预训练框架和意图理解微调框架,针对处理轨迹预测信息的模型,对轨迹预测意图理解模型进行训练;

2.如权利要求1所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述在历史和未来意图序列信息中随机选择特定时间步进行掩码的具体方法为:

3.如权利要求2所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述通过连接可学习初始化矩阵生成完整令牌集的具体方法为:将编码器的输出与可学习的初始化矩阵X'hmask和X'fmask连接起来,该矩阵具有与掩码令牌相同的形状:

4.如权利要求3所述...

【技术特征摘要】

1.一种用于意图理解的语义增强预训练方法,其特征在于,包括语义增强预训练框架和意图理解微调框架,针对处理轨迹预测信息的模型,对轨迹预测意图理解模型进行训练;

2.如权利要求1所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述在历史和未来意图序列信息中随机选择特定时间步进行掩码的具体方法为:

3.如权利要求2所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述通过连接可学习初始化矩阵生成完整令牌集的具体方法为:将编码器的输出与可学习的初始化矩阵x'...

【专利技术属性】
技术研发人员:沃天宇石建鑫陈锦豪
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1