基于自适应对比解码的大语言模型约束指令遵循方法及装置制造方法及图纸

技术编号:46574736 阅读:0 留言:0更新日期:2025-10-10 21:18
本发明专利技术提供一种基于自适应对比解码的大语言模型约束指令遵循方法及装置,将提示信息分为指令与约束两部分,由专家模型按照动态变化的窗口生成初始输出序列,引入辅助模型计算在有约束和无约束条件下各词元的预测概率分布差异,并基于预设标准区分约束敏感词元和约束不敏感词元。对于仅包含约束不敏感词元的窗口直接输出至目标输出序列,并按照第一设定比例扩大窗口长度;对于包含约束敏感词元的窗口,首个约束敏感词元之前的词元直接输入目标输出序列,基于对比解码修正该首个约束敏感词元,并按照第二比例缩减窗口长度。本发明专利技术能降低约束条件对模型生成的干扰,避免非敏感token的冗余计算,显著推理效率,同时保证约束遵循质量。

【技术实现步骤摘要】

本专利技术涉及模型输出控制,尤其涉及一种基于自适应对比解码的大语言模型约束指令遵循方法及装置


技术介绍

1、近年来,大语言模型在自然语言处理领域取得了广泛的成功,并展现出强大的指令遵循能力。指令遵循指的是大语言模型能够理解并执行用户以自然语言描述的各种任务,这一能力使llm在众多实际应用场景中展现出巨大潜力。

2、然而,现有的指令遵循方法在面对复杂约束时表现出明显不足。首先,当约束条件与任务指令紧密耦合在一起时,模型的生成过程会显著受到约束的干扰,限制了模型自由探索更广泛、更合适的解空间,容易导致生成结果偏离用户实际需求。此外,现有方法如层间自对比解码、投机对比解码等,在处理复杂约束的推理过程中,常常需要进行大量额外的计算和验证步骤,极大降低了推理效率,难以满足实时性要求较高的实际应用需求。

3、与此同时,为强制满足复杂的约束条件,模型往往需要进行严格的输出约束控制,这种强制约束容易破坏模型的自然推理流程,进而削弱模型对于任务本身以及领域知识的深入理解,导致生成结果质量下降、准确性降低。此外,传统对比解码方法虽然能够在一定程度上提本文档来自技高网...

【技术保护点】

1.一种基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,计算所述词元在有约束和无约束条件下的所述预测概率分布的差异,将所述差异大于设定标准的词元标记为约束敏感词元,将所述差异小于等于所述设定标准的所述词元标记为约束不敏感词元,包括:

3.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,所述JS散度的计算式为:

4.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,基于所述专家...

【技术特征摘要】

1.一种基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,计算所述词元在有约束和无约束条件下的所述预测概率分布的差异,将所述差异大于设定标准的词元标记为约束敏感词元,将所述差异小于等于所述设定标准的所述词元标记为约束不敏感词元,包括:

3.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,所述js散度的计算式为:

4.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,基于所述专家模型和所述辅助模型基于对比解码的形式修正所述首个约束敏感词元,包括:

5.根据权利要求1所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,所述窗口长度按照第一设定比例扩展,包括:

6.根据权利要求1所述的基...

【专利技术属性】
技术研发人员:杜军平张家榕薛哲叶冠华
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1