【技术实现步骤摘要】
本专利技术涉及模型输出控制,尤其涉及一种基于自适应对比解码的大语言模型约束指令遵循方法及装置。
技术介绍
1、近年来,大语言模型在自然语言处理领域取得了广泛的成功,并展现出强大的指令遵循能力。指令遵循指的是大语言模型能够理解并执行用户以自然语言描述的各种任务,这一能力使llm在众多实际应用场景中展现出巨大潜力。
2、然而,现有的指令遵循方法在面对复杂约束时表现出明显不足。首先,当约束条件与任务指令紧密耦合在一起时,模型的生成过程会显著受到约束的干扰,限制了模型自由探索更广泛、更合适的解空间,容易导致生成结果偏离用户实际需求。此外,现有方法如层间自对比解码、投机对比解码等,在处理复杂约束的推理过程中,常常需要进行大量额外的计算和验证步骤,极大降低了推理效率,难以满足实时性要求较高的实际应用需求。
3、与此同时,为强制满足复杂的约束条件,模型往往需要进行严格的输出约束控制,这种强制约束容易破坏模型的自然推理流程,进而削弱模型对于任务本身以及领域知识的深入理解,导致生成结果质量下降、准确性降低。此外,传统对比解码方法虽
...【技术保护点】
1.一种基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,计算所述词元在有约束和无约束条件下的所述预测概率分布的差异,将所述差异大于设定标准的词元标记为约束敏感词元,将所述差异小于等于所述设定标准的所述词元标记为约束不敏感词元,包括:
3.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,所述JS散度的计算式为:
4.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特
...【技术特征摘要】
1.一种基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,计算所述词元在有约束和无约束条件下的所述预测概率分布的差异,将所述差异大于设定标准的词元标记为约束敏感词元,将所述差异小于等于所述设定标准的所述词元标记为约束不敏感词元,包括:
3.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,所述js散度的计算式为:
4.根据权利要求2所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,基于所述专家模型和所述辅助模型基于对比解码的形式修正所述首个约束敏感词元,包括:
5.根据权利要求1所述的基于自适应对比解码的大语言模型约束指令遵循方法,其特征在于,所述窗口长度按照第一设定比例扩展,包括:
6.根据权利要求1所述的基...
【专利技术属性】
技术研发人员:杜军平,张家榕,薛哲,叶冠华,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。