【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及大语言模型、自然语言处理、强化学习以及多智能体协作系统等交叉领域,尤其适用于复杂任务智能客服、智能辅助决策系统和评估评价分析场景。
技术介绍
1、当前,大语言模型(llm)驱动的多智能体协作推理系统在复杂任务求解方面展现出巨大潜力。已有方案采用多个智能体协同工作以提高推理的准确性和可靠性。例如,中国专利cn117744795a提出了一种多智能体协同知识推理框架,利用多个“大语言模型推理者”和“评估者”分阶段多轮推理和校验,从而增强知识推理的因果一致性和结果可靠度,但该专利未涉及智能体自主进行动态提问,缺乏任务中动态信息获取机制。又如,美国专利us20250086647a1公开了一种多智能体生成式ai系统,包含对话代理、检索代理和分诊代理等模块:对话代理接收用户输入并发送至分诊代理处理,分诊代理生成检索查询由检索代理获取相关文档,再由分诊代理指导对话代理生成最终回答,但分诊代理生成的提示问题属于预设的静态策略,智能体无法根据自身状态主动决策是否及何时发问。这些系统通过智能体分工协作,在知识推理和对话问答等应
...【技术保护点】
1.一种基于大语言模型的多智能体协作推理系统的自适应提问方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述主管智能体的功能包括:
3.根据权利要求1所述的方法,其特征在于,所述自适应提问机制包括两个关键步骤:
4.根据权利要求3所述的方法,其特征在于,所述判别策略综合考虑多种信号,实时决定是否需要发问,只有当判别策略认为提问能显著提高后续推理成功率时,工作智能体才进入提问流程;所述多种信号包括工作智能体当前推理步骤的置信度、尝试解决问题的次数、从环境获取信息的代价;所述判别策略通过下式表示:
【技术特征摘要】
1.一种基于大语言模型的多智能体协作推理系统的自适应提问方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的方法,其特征在于,所述主管智能体的功能包括:
3.根据权利要求1所述的方法,其特征在于,所述自适应提问机制包括两个关键步骤:
4.根据权利要求3所述的方法,其特征在于,所述判别策略综合考虑多种信号,实时决定是否需要发问,只有当判别策略认为提问能显著提高后续推理成功率时,工作智能体才进入提问流程;所述多种信号包括工作智能体当前推理步骤的置信度、尝试解决问题的次数、从环境获取信息的代价;所述判别策略通过下式表示:
5.根据权利要求4所述的方法,其特征在于,采用近端策略优化算法对actor-critic模型进行强化学习训练,以优化所述工作智能体的自适应提问机制;训练过程中,工作智能体在模拟的任务环境中反复尝试解决问题,利用提问机制与主管智能体交互,并根据任务结果获取奖励信号,通过近端策略优化算法不断调整actor参数,使其朝着累积更高预期回报的方向优化。
6.根据权利要求5所述的方法,其特征在于,所述采用近端策略优化算...
【专利技术属性】
技术研发人员:刘晓东,
申请(专利权)人:中国科学院计算机网络信息中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。