基于大语言模型的多智能体协作推理系统的自适应提问方法技术方案

技术编号:46591716 阅读:0 留言:0更新日期:2025-10-10 21:25
本发明专利技术属于人工智能技术领域,涉及一种基于大语言模型的多智能体协作推理系统的自适应提问方法。该方法建立分层式的多智能体协作架构,所述多智能体协作架构包括主管智能体和若干工作智能体;主管智能体为每个工作智能体分配推理任务;工作智能体在执行推理任务的过程中,通过自适应提问机制主动向主管智能体提出问题,并接收主管智能体反馈的知识或指导。本发明专利技术通过Supervisor‑Worker多智能体架构、自适应提问决策机制以及Actor‑Critic强化学习优化的有机结合,赋予了大语言模型驱动的智能体系统以“会思考、善提问”的新能力,突破了传统固定脚本或单轮对话的局限,使智能体能够在复杂未知的任务环境中自主寻求信息、纠正思路。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及大语言模型、自然语言处理、强化学习以及多智能体协作系统等交叉领域,尤其适用于复杂任务智能客服、智能辅助决策系统和评估评价分析场景。


技术介绍

1、当前,大语言模型(llm)驱动的多智能体协作推理系统在复杂任务求解方面展现出巨大潜力。已有方案采用多个智能体协同工作以提高推理的准确性和可靠性。例如,中国专利cn117744795a提出了一种多智能体协同知识推理框架,利用多个“大语言模型推理者”和“评估者”分阶段多轮推理和校验,从而增强知识推理的因果一致性和结果可靠度,但该专利未涉及智能体自主进行动态提问,缺乏任务中动态信息获取机制。又如,美国专利us20250086647a1公开了一种多智能体生成式ai系统,包含对话代理、检索代理和分诊代理等模块:对话代理接收用户输入并发送至分诊代理处理,分诊代理生成检索查询由检索代理获取相关文档,再由分诊代理指导对话代理生成最终回答,但分诊代理生成的提示问题属于预设的静态策略,智能体无法根据自身状态主动决策是否及何时发问。这些系统通过智能体分工协作,在知识推理和对话问答等应用中取得了一定成效。本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的多智能体协作推理系统的自适应提问方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述主管智能体的功能包括:

3.根据权利要求1所述的方法,其特征在于,所述自适应提问机制包括两个关键步骤:

4.根据权利要求3所述的方法,其特征在于,所述判别策略综合考虑多种信号,实时决定是否需要发问,只有当判别策略认为提问能显著提高后续推理成功率时,工作智能体才进入提问流程;所述多种信号包括工作智能体当前推理步骤的置信度、尝试解决问题的次数、从环境获取信息的代价;所述判别策略通过下式表示:

>5.根据权利要求4...

【技术特征摘要】

1.一种基于大语言模型的多智能体协作推理系统的自适应提问方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述主管智能体的功能包括:

3.根据权利要求1所述的方法,其特征在于,所述自适应提问机制包括两个关键步骤:

4.根据权利要求3所述的方法,其特征在于,所述判别策略综合考虑多种信号,实时决定是否需要发问,只有当判别策略认为提问能显著提高后续推理成功率时,工作智能体才进入提问流程;所述多种信号包括工作智能体当前推理步骤的置信度、尝试解决问题的次数、从环境获取信息的代价;所述判别策略通过下式表示:

5.根据权利要求4所述的方法,其特征在于,采用近端策略优化算法对actor-critic模型进行强化学习训练,以优化所述工作智能体的自适应提问机制;训练过程中,工作智能体在模拟的任务环境中反复尝试解决问题,利用提问机制与主管智能体交互,并根据任务结果获取奖励信号,通过近端策略优化算法不断调整actor参数,使其朝着累积更高预期回报的方向优化。

6.根据权利要求5所述的方法,其特征在于,所述采用近端策略优化算...

【专利技术属性】
技术研发人员:刘晓东
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1