基于语言模型提示学习的常识推理方法技术

技术编号:43647510 阅读:24 留言:0更新日期:2024-12-13 12:43
本发明专利技术实施例公开了一种基于语言模型提示学习的常识推理方法。该方法包括:获取训练数据集和预训练语言模型;其中,训练数据集中包括至少一个批次对应的问答对数据;针对当前训练批次,基于当前训练批次的当前问答对数据、预先确定的当前提示向量和预训练语言模型,确定与当前提示向量对应的当前损失值和与当前损失值对应的当前梯度;基于当前梯度和预先确定的预设嵌入向量,确定下一训练批次的问答对数据对应的下一提示向量,以基于下一提示向量重复执行确定损失值操作,直到最新损失值满足预设训练目标,得到最新提示向量;基于最新提示向量、待回答题干和待迁移推理模型,确定与待回答题干对应的回应信息。

【技术实现步骤摘要】

本专利技术实施例涉及自然语言处理与大语言模型提示学习,尤其涉及一种基于语言模型提示学习的常识推理方法


技术介绍

1、随着大规模预训练语言模型展现出了良好的推理能力和可观的知识量,提示学习作为一种新的迁移学习范式开始被广泛运用到各类不同的推理任务中,它通过在任务文本前附上提示语来将预训练语言模型泛化到各类推理任务上。

2、现有技术中,通常采用离散提示学习技术确定预训练语言模型所需的提示语,通过提示语迁移到不同的常识推理语言模型中,以完成不同类型的推理任务。但是,当前的离散提示学习技术存在收敛慢的问题。


技术实现思路

1、本专利技术实施例提供了一种基于语言模型提示学习的常识推理方法,以实现提高确定提示向量以及回应信息的效率的目的。

2、根据本专利技术的一方面,提供了一种基于语言模型提示学习的常识推理方法,包括:

3、获取训练数据集和预训练语言模型;其中,所述训练数据集中包括至少一个批次对应的问答对数据;

4、针对当前训练批次,基于所述当前训练批次的当前问答对数据、本文档来自技高网...

【技术保护点】

1.一种基于语言模型提示学习的常识推理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述当前梯度和预先确定的预设嵌入向量,确定下一训练批次的问答对数据对应的下一提示向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述将与所述优化提示向量对应的预设嵌入向量确定为所述目标嵌入向量,包括:

4.根据权利要求1所述的方法,其特征在于,所述基于所述最新提示向量、待回答题干和待迁移推理模型,确定与所述待回答题干对应的回应信息,包括:

5.根据权利要求1所述的方法,其特征在于,所述当前问答对数据包括当前题干、至少一个...

【技术特征摘要】

1.一种基于语言模型提示学习的常识推理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述当前梯度和预先确定的预设嵌入向量,确定下一训练批次的问答对数据对应的下一提示向量,包括:

3.根据权利要求2所述的方法,其特征在于,所述将与所述优化提示向量对应的预设嵌入向量确定为所述目标嵌入向量,包括:

4.根据权利要求1所述的方法,其特征在于,所述基...

【专利技术属性】
技术研发人员:秦科戴瑞婷董强辛宇轩邵帅杨行超
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1