基于动态协调解码的大模型上下文冲突消解方法及装置制造方法及图纸

技术编号:46063869 阅读:10 留言:0更新日期:2025-08-11 15:50
本发明专利技术公开一种基于动态协调解码的大模型上下文冲突消解方法及装置,涉及自然语言处理技术领域。方法包括:获取问题文本、目标上下文以及回答问题的Transformer模型;基于问题文本token、目标上下文token、生成token以及Transformer模型的多个并行注意力头,确定上下文忠实度,根据上下文忠实度确定冲突预测结果;当冲突预测结果为真时,基于动态调节机制,调整解码中的平衡权重,根据调整后的平衡权重,确定动态对比解码分布,根据动态对比解码分布,输出问题文本对应的答案文本。采用本发明专利技术,可以提高答案生成的正确性与鲁棒性。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,特别是指一种基于动态协调解码的大模型上下文冲突消解方法及装置


技术介绍

1、随着大规模语言模型(large language models, llms)在自然语言处理任务中的广泛应用,其对上下文的理解与利用能力成为模型性能的关键因素。为增强模型的外部知识访问能力,检索增强生成(retrieval-augmented generation, rag)成为近年来的研究热点,通过引入外部知识库的信息支持,提升模型在开放域问答、对话系统等任务中的推理准确性和泛化能力。

2、在实际应用中,尤其是长文本处理、多轮对话以及知识密集型任务中,模型往往会遇到“知识冲突”问题,即生成结果既参考了当前上下文信息,也受到模型内部参数化知识的影响,二者之间可能存在不一致,进而影响输出的正确性和一致性。已有研究通常将知识冲突划分为三类:内存内冲突(memory-memory conflict)、上下文与内存冲突(context-memory conflict)、以及上下文间冲突(context-context conflict)。其中,上下文本文档来自技高网...

【技术保护点】

1.一种基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述S2的基于问题文本token、上下文token、生成token以及Transformer模型的多个并行注意力头,确定上下文忠实度,包括:

3.根据权利要求1所述的基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述S2的根据上下文忠实度确定冲突预测结果,包括:

4.根据权利要求1所述的基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述S3的基于动态调节机制,调整解码中的平衡...

【技术特征摘要】

1.一种基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述s2的基于问题文本token、上下文token、生成token以及transformer模型的多个并行注意力头,确定上下文忠实度,包括:

3.根据权利要求1所述的基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述s2的根据上下文忠实度确定冲突预测结果,包括:

4.根据权利要求1所述的基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述s3的基于动态调节机制,调整解码中的平衡权重,包括:

5.根据权利要求4所述的基于动态协调解码的大模型上下文冲突消解方法,其特征在于,所述s3的根据调整后的平衡权重,确定动态对比解码分布,根据动态对比解码分...

【专利技术属性】
技术研发人员:李晶周艺耕李武陆逸樊俞俊张民
申请(专利权)人:哈尔滨工业大学深圳哈尔滨工业大学深圳科技创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1