【技术实现步骤摘要】
本公开涉及计算机领域,更具体地讲,涉及一种用于意图理解的语义增强预训练方法。
技术介绍
1、轨迹编码用于代理历史轨迹特征的学习。借鉴于自然语言处理等时间序列建模方法,循环神经网络[24](recurrentneuronal network,rnn)以及其变体长短时记忆网络(long shortterm memory,lstm),门控递归单元(gate recurrent unit,gru)等常被用于提取轨迹序列的时域特征。通常,每个代理的的历史轨迹单独采用循环神经网络或一维卷积神经网络来处理,以提取其轨迹表征。还有一部分学者[30]对场景内的代理轨迹形成整体表示,采用二维卷积神经网络直接提取场景整体的深度特征,学习个体运动时空相关性,再通过对场景整体表征索引得到每个个体对应的表征。
2、轨迹解码关注如何生成代理的最终轨迹。上述循环神经网络等模型的使用着重于提高模型对输入数据的表征能力,轨迹解码相关研究则关注输出的数据表示、多模轨迹输出、损失函数设计等方面。输出表示按照输出轨迹的类型可以分为输出轨迹序列、输出轨迹概率分布两类。
...【技术保护点】
1.一种用于意图理解的语义增强预训练方法,其特征在于,包括语义增强预训练框架和意图理解微调框架,针对处理轨迹预测信息的模型,对轨迹预测意图理解模型进行训练;
2.如权利要求1所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述在历史和未来意图序列信息中随机选择特定时间步进行掩码的具体方法为:
3.如权利要求2所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述通过连接可学习初始化矩阵生成完整令牌集的具体方法为:将编码器的输出与可学习的初始化矩阵X'hmask和X'fmask连接起来,该矩阵具有与掩码令牌相同的形状:
...
【技术特征摘要】
1.一种用于意图理解的语义增强预训练方法,其特征在于,包括语义增强预训练框架和意图理解微调框架,针对处理轨迹预测信息的模型,对轨迹预测意图理解模型进行训练;
2.如权利要求1所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述在历史和未来意图序列信息中随机选择特定时间步进行掩码的具体方法为:
3.如权利要求2所述的一种用于意图理解的语义增强预训练方法,其特征在于,所述通过连接可学习初始化矩阵生成完整令牌集的具体方法为:将编码器的输出与可学习的初始化矩阵x'...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。