人机交互方法、装置及系统制造方法及图纸

技术编号:38326774 阅读:15 留言:0更新日期:2023-07-29 09:09
本申请公开了一种人机交互方法、装置及系统,本申请在获取到人机交互历史信息及用户的本轮输入信息之后,调用大语言模型生成与本轮用户的交互需求匹配的可执行指令,指令中包含对响应本轮用户的交互需求所依赖的插件资源的调用。对可执行指令进行解析执行,以按照可执行指令的指示调用插件,得到插件的执行结果,调用大语言模型,基于人机交互历史信息、用户的本轮输入信息及插件的执行结果生成回复信息。本申请基于大语言模型和插件资源实现人机交互,可以充分借助大语言模型超强的语义理解及多轮对话能力。通过大语言模型来生成调用插件资源的可执行指令,无需预先定制各类型的业务调用代码,节省了代码开发成本,降低了工作量。作量。作量。

【技术实现步骤摘要】
人机交互方法、装置及系统


[0001]本申请涉及大语言模型
,更具体的说,是涉及一种人机交互方法、装置及系统。

技术介绍

[0002]人机交互是指人类与计算机系统之间进行信息交流和互动的过程,人机交互的目标是让计算机系统更加符合人类的认知习惯和需求,从而实现更高效、便捷的信息处理。常见的人机交互场景如,任务型对话、知识问答、闲聊等。
[0003]现有的人机交互方案主要采用分类和抽槽模型,通过强化训练,确定用户提问对应的意图和包含的关键槽位信息,之后按照定制的与意图匹配的代码,使用识别到的意图和关键槽位信息调取第三方业务信源接口,获取相关业务数据用于对用户进行回复。示例如,当用户询问天气信息时,通过模型识别用户的意图为询问天气信息,关键槽位信息包括时间、地点,进而调用定制与第三方天气应用适配的代码,基于关键槽位信息查询具体天气信息,并基于第三方天气应用反馈的结果回复用户。现有的人机交互方案受限于模型的能力,其意图识别和关键槽位信息的抽取准确率不够高,在此基础上调用代码查询得到的业务数据也容易出现错误。此外,人机交互过程用户可能存在多种多样的对话意图,因此需要预先定制多种不同意图适配的代码,增加了代码开发成本和工作量。

技术实现思路

[0004]鉴于上述问题,提出了本申请以便提供一种人机交互方法、装置及系统,以解决现有技术的机器回复内容准确性不够高,且需要预先开发多种意图适配的业务调用代码,增加代码开发成本和工作量的问题。具体方案如下:
[0005]第一方面,提供了一种人机交互方法,包括:
[0006]获取人机交互历史信息以及用户的本轮输入信息;
[0007]调用预置的大语言模型,基于所述人机交互历史信息及所述本轮输入信息,生成与本轮用户的交互需求匹配的可执行指令;所述可执行指令中包含对响应本轮用户的交互需求所依赖的插件资源的调用;
[0008]对所述可执行指令进行解析执行,以按照所述可执行指令的指示调用插件,得到插件的执行结果;
[0009]调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息。
[0010]优选地,调用预置的大语言模型,基于所述人机交互历史信息及所述本轮输入信息,生成与本轮用户的交互需求匹配的可执行指令,包括:
[0011]获取预配置的第一prompt格式模板,所述第一prompt格式模板包括历史信息槽及本轮输入信息槽,所述第一prompt格式模板用于指示大语言模型结合历史信息槽内的信息理解本轮用户的交互需求并给出匹配的可执行指令;
[0012]将所述人机交互历史信息填充至所述历史信息槽,以及,将用户的本轮输入信息填充至所述本轮输入信息槽,得到编辑后第一提示指令prompt;
[0013]将所述编辑后第一提示指令prompt输入所述大语言模型,得到大语言模型输出的可执行指令。
[0014]优选地,所述可执行指令为可执行的python代码。
[0015]优选地,对所述可执行指令进行解析执行,以按照所述可执行指令的指示调用插件,得到插件的执行结果的过程,包括:
[0016]调用预配置的插件解析器对所述可执行指令进行解析执行,以按照所述可执行指令的指示调用插件,得到插件的执行结果。
[0017]优选地,调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息,包括:
[0018]获取预配置的第二prompt格式模板,所述第二prompt格式模板包括历史信息槽、本轮输入信息槽及插件信息槽,所述第二prompt格式模板用于指示大语言模型结合历史信息槽及查询信息槽内的信息,对本轮用户的输入信息进行回复;
[0019]将所述人机交互历史信息填充至所述历史信息槽、将用户的本轮输入信息填充至所述本轮输入信息槽,以及,将所述插件的执行结果填充至所述查询信息槽,得到编辑后第二提示指令prompt;
[0020]将所述编辑后第二提示指令prompt输入所述大语言模型,得到大语言模型输出的回复信息。
[0021]优选地,在调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息之前,还包括:
[0022]调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,规划下一步任务;
[0023]若所述下一步任务为回复语生成任务,则执行调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息的步骤。
[0024]优选地,还包括:
[0025]若所述下一步任务为重试任务,则返回执行调用预置的大语言模型,基于所述人机交互历史信息及所述本轮输入信息,生成与本轮用户的交互需求匹配的可执行指令的步骤;
[0026]和/或,
[0027]若所述下一步任务为兜底任务,则令插件的执行结果为空,并执行调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息的步骤。
[0028]优选地,调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,规划下一步任务,包括:
[0029]获取预配置的第三prompt格式模板,所述第三prompt格式模板包括历史信息槽、本轮输入信息槽、插件信息槽,所述第三prompt格式模板用于指示大语言模型结合历史信息槽、本轮输入信息槽及插件信息槽中的信息,规划下一步的任务;
[0030]将所述人机交互历史信息填充至所述历史信息槽、将用户的本轮输入信息填充至所述本轮输入信息槽,以及,将所述插件的执行结果填充至所述插件信息槽,得到编辑后第三提示指令prompt;
[0031]将所述编辑后第三提示指令prompt输入所述大语言模型,得到大语言模型输出的下一步任务。
[0032]优选地,所述插件资源包括以下任意一种或多种:
[0033]信源插件、知识库插件、个性化内容推荐插件、工具集插件。
[0034]优选地,所述人机交互方法应用于任务型对话场景、知识问答场景、聊天对话场景中的任意一个场景。
[0035]第二方面,提供了一种人机交互装置,包括:
[0036]信息获取单元,用于获取人机交互历史信息以及用户的本轮输入信息;
[0037]第一模型调用单元,用于调用预置的大语言模型,基于所述人机交互历史信息及所述本轮输入信息,生成与本轮用户的交互需求匹配的可执行指令;所述可执行指令中包含对响应本轮用户的交互需求所依赖的插件资源的调用;
[0038]指令解析处理单元,用于对所述可执行指令进行解析执行,以按照所述可执行指令的指示调用插件,得到插件的执行结果;
[0039]第二模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人机交互方法,其特征在于,包括:获取人机交互历史信息以及用户的本轮输入信息;调用预置的大语言模型,基于所述人机交互历史信息及所述本轮输入信息,生成与本轮用户的交互需求匹配的可执行指令;所述可执行指令中包含对响应本轮用户的交互需求所依赖的插件资源的调用;对所述可执行指令进行解析执行,以按照所述可执行指令的指示调用插件,得到插件的执行结果;调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息。2.根据权利要求1所述的方法,其特征在于,调用预置的大语言模型,基于所述人机交互历史信息及所述本轮输入信息,生成与本轮用户的交互需求匹配的可执行指令,包括:获取预配置的第一prompt格式模板,所述第一prompt格式模板包括历史信息槽及本轮输入信息槽,所述第一prompt格式模板用于指示大语言模型结合历史信息槽内的信息理解本轮用户的交互需求并给出匹配的可执行指令;将所述人机交互历史信息填充至所述历史信息槽,以及,将用户的本轮输入信息填充至所述本轮输入信息槽,得到编辑后第一提示指令prompt;将所述编辑后第一提示指令prompt输入所述大语言模型,得到大语言模型输出的可执行指令。3.根据权利要求1所述的方法,其特征在于,所述可执行指令为可执行的python代码。4.根据权利要求1所述的方法,其特征在于,对所述可执行指令进行解析执行,以按照所述可执行指令的指示调用插件,得到插件的执行结果的过程,包括:调用预配置的插件解析器对所述可执行指令进行解析执行,以按照所述可执行指令的指示调用插件,得到插件的执行结果。5.根据权利要求1所述的方法,其特征在于,调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息,包括:获取预配置的第二prompt格式模板,所述第二prompt格式模板包括历史信息槽、本轮输入信息槽及插件信息槽,所述第二prompt格式模板用于指示大语言模型结合历史信息槽及查询信息槽内的信息,对本轮用户的输入信息进行回复;将所述人机交互历史信息填充至所述历史信息槽、将用户的本轮输入信息填充至所述本轮输入信息槽,以及,将所述插件的执行结果填充至所述查询信息槽,得到编辑后第二提示指令prompt;将所述编辑后第二提示指令prompt输入所述大语言模型,得到大语言模型输出的回复信息。6.根据权利要求1所述的方法,其特征在于,在调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息之前,还包括:调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,规划下一步任务;
若所述下一步任务为回复语生成任务,则执行调用所述大语言模型,基于所述人机交互历史信息、用户的本轮输入信息及所述插件的执行结果,生成与用户的本轮输入信息对应的回复信息的步骤。7.根据权利要求6所述的方法,其...

【专利技术属性】
技术研发人员:梅林海宁宏伟刘权王士进魏思刘聪胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1