知识问答方法、装置、设备及存储介质制造方法及图纸

技术编号:38436812 阅读:14 留言:0更新日期:2023-08-11 14:21
本申请公开了一种知识问答方法、装置、设备及存储介质,方法包括:将输入的问题文本按照思维链式推理策略进行拆解,得到若干个推理任务,调用推理任务对应的知识插件得到推理任务对应的知识搜索结果,将问题文本和知识搜索结果拼接为提示指令送入大语言模型,得到输出的答复内容。本申请将用户的问题文本按照思维链式推理策略拆解为若干个推理任务,拆解后的各推理任务相比于原始的问题文本更加简单、易于理解,有助于大语言模型给出正确的知识答复。进一步,本申请预先配置了多个知识插件,并融入到知识问答过程,可以使得大语言模型输出更加准确的知识答复,并扩展了知识问答的应用场景。场景。场景。

【技术实现步骤摘要】
知识问答方法、装置、设备及存储介质


[0001]本申请涉及大语言模型
,更具体的说,是涉及一种知识问答方法、装置、设备及存储介质。

技术介绍

[0002]知识问答是指,用户向机器提出指令,由机器针对用户提出的指令给出对应的答复内容的过程。
[0003]近年来,伴随着人工智能技术的发展,越来越多的企业逐步探索将知识问答与深度学习相结合,通过生成式深度学习模型来输出与用户的提问相匹配的知识答案。但是,目前的深度学习模型仅能够处理一些较为简单的用户提问,对于复杂描述问题难以理解,进而导致无法给出准确的知识答案。并且,深度学习模型对训练语料的要求较高,在一些垂直应用领域内或开放域问答场景,用户的知识问答比较专业或偏僻,这些专业知识或偏僻知识可能并未在训练过程被深度学习模型所掌握,从而导致深度学习模型无法给出准确的知识答案,这也限制了知识问答的应用场景。

技术实现思路

[0004]鉴于上述问题,提出了本申请以便提供一种知识问答方法、装置、设备及存储介质,以解决现有方案无法针对复杂描述问题给出准确知识答案,以及在垂直应用领域或开放域问答场景下,现有方案输出的知识答案准确性不高的问题。具体方案如下:
[0005]第一方面,提供了一种知识问答方法,包括:
[0006]获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;
[0007]按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;
[0008]确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;
[0009]将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。
[0010]优选地,所述按照思维链式推理策略,将所述问题文本拆解为若干推理任务,包括:
[0011]获取预配置的问题拆解提示指令模板,所述问题拆解提示指令模板包括问题文本槽,所述问题拆解提示指令模板用于指示大语言模型将所述问题文本槽内的问题文本拆解为若干个推理任务;
[0012]将所述问题文本填充至所述问题文本槽,得到编辑后问题拆解提示指令prompt;
[0013]将所述编辑后问题拆解提示指令prompt输入至所述大语言模型,得到大语言模型输出的对所述问题文本拆解后的若干个推理任务;
[0014]其中,所述大语言模型在训练阶段,采用训练问题文本及对应的按照思维链式推
理策略进行拆解后的若干个推理任务为训练数据进行训练。
[0015]优选地,确定与所述推理任务对应的知识插件,包括:
[0016]获取预配置的插件选择提示指令模板,所述插件选择提示指令模板包括推理任务槽,所述插件选择提示指令模板用于提示大语言模型给出所述推理任务槽内的推理任务所依赖的知识插件,及将输入的问题文本转换为所述知识插件对应的输入格式要求;
[0017]将拆解后的每一推理任务分别填充至所述推理任务槽,得到每一推理任务对应的编辑后插件选择提示指令prompt;
[0018]将所述编辑后插件选择提示指令prompt输入至所述大语言模型,得到大语言模型输出的每一推理任务所依赖的知识插件,及符合所述知识插件输入格式要求的检索输入文本;
[0019]其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务、各推理任务所依赖的知识插件及按照该知识插件的输入格式要求对训练问题文本转换后的搜索输入文本。
[0020]优选地,调用所述知识插件得到推理任务对应的知识搜索结果的过程,包括:
[0021]对于每一推理任务:
[0022]调用推理任务所依赖的知识插件,并将得到的符合所述知识插件输入格式要求的检索输入文本传递给所述知识插件,以便所述知识插件按照所述检索输入文本进行知识搜索,并返回知识搜索结果,作为推理任务对应的知识搜索结果。
[0023]优选地,将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:
[0024]将所述问题文本、所述问题文本之前的历史知识问答对话信息及所述知识搜索结果拼接为提示指令prompt。
[0025]优选地,还包括:
[0026]结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息;
[0027]则将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:
[0028]将所述问题文本、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt;
[0029]或,
[0030]将所述问题文本、所述问题文本之前的历史知识问答对话信息、所述推理描述信息及所述知识搜索结果拼接为提示指令prompt。
[0031]优选地,结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息,包括:
[0032]获取预配置的推理描述提示指令模板,所述推理描述提示指令模板包括推理任务槽,所述推理描述提示指令模板用于提示大语言模型基于所述推理任务槽内的各推理任务给出输入的问题文本对应的推理描述信息;
[0033]将拆解后的各个推理任务填充至所述推理任务槽,得到编辑后推理描述提示指令prompt;
[0034]将所述编辑后推理描述提示指令prompt输入至所述大语言模型,得到大语言模型
输出的所述问题文本对应的推理描述信息;
[0035]其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务,及训练问题文本对应的推理描述信息。
[0036]优选地,在将所述问题文本及所述知识搜索结果拼接为提示指令prompt之前,还包括:
[0037]若一推理任务对应的知识搜索结果包括多条知识资源,则对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源,所述加工操作包括筛选、整合中的至少一项。
[0038]优选地,对所述多条知识资源进行加工,得到该推理任务对应的加工后知识资源的过程,包括:
[0039]获取预配置的知识加工提示指令模板,所述知识加工提示指令模板包括知识资源槽,所述知识加工提示指令模板用于提示大语言模型对所述知识资源槽内的各条知识资源进行加工处理给出加工后知识资源;
[0040]将所述多条知识资源填充至所述知识资源槽,得到编辑后知识加工提示指令prompt;
[0041]将所述编辑后知识加工提示指令prompt输入至所述大语言模型,得到大语言模型输出的加工后知识资源;
[0042]其中,所述大语言模型在训练阶段所使用的训练数据包括:对于同一推理任务的多条知识资源及人工对多条知识资源加工后的知识资源。
[0043]第二方面,提供了一种知识问答装置,包括:
[0044]输入信息获取单元,用于获取用户输入的问题文本,所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识问答方法,其特征在于,包括:获取用户输入的问题文本,所述问题文本用于描述用户提出的问题;按照思维链式推理策略,将所述问题文本拆解为若干个推理任务;确定与所述推理任务对应的知识插件,并调用所述知识插件得到推理任务对应的知识搜索结果,其中,所述知识插件包括若干场景下的本地化知识资源和/或搜索引擎知识资源;将所述问题文本及所述知识搜索结果拼接为提示指令prompt,输入至预配置的大语言模型,得到大语言模型输出的针对所述问题文本的答复内容。2.根据权利要求1所述的方法,其特征在于,所述按照思维链式推理策略,将所述问题文本拆解为若干推理任务,包括:获取预配置的问题拆解提示指令模板,所述问题拆解提示指令模板包括问题文本槽,所述问题拆解提示指令模板用于指示大语言模型将所述问题文本槽内的问题文本拆解为若干个推理任务;将所述问题文本填充至所述问题文本槽,得到编辑后问题拆解提示指令prompt;将所述编辑后问题拆解提示指令prompt输入至所述大语言模型,得到大语言模型输出的对所述问题文本拆解后的若干个推理任务;其中,所述大语言模型在训练阶段,采用训练问题文本及对应的按照思维链式推理策略进行拆解后的若干个推理任务为训练数据进行训练。3.根据权利要求1所述的方法,其特征在于,确定与所述推理任务对应的知识插件,包括:获取预配置的插件选择提示指令模板,所述插件选择提示指令模板包括推理任务槽,所述插件选择提示指令模板用于提示大语言模型给出所述推理任务槽内的推理任务所依赖的知识插件,及将输入的问题文本转换为所述知识插件对应的输入格式要求;将拆解后的每一推理任务分别填充至所述推理任务槽,得到每一推理任务对应的编辑后插件选择提示指令prompt;将所述编辑后插件选择提示指令prompt输入至所述大语言模型,得到大语言模型输出的每一推理任务所依赖的知识插件,及符合所述知识插件输入格式要求的检索输入文本;其中,所述大语言模型在训练阶段所使用的训练数据包括:对训练问题文本拆解后的推理任务、各推理任务所依赖的知识插件及按照该知识插件的输入格式要求对训练问题文本转换后的搜索输入文本。4.根据权利要求3所述的方法,其特征在于,调用所述知识插件得到推理任务对应的知识搜索结果的过程,包括:对于每一推理任务:调用推理任务所依赖的知识插件,并将得到的符合所述知识插件输入格式要求的检索输入文本传递给所述知识插件,以便所述知识插件按照所述检索输入文本进行知识搜索,并返回知识搜索结果,作为推理任务对应的知识搜索结果。5.根据权利要求1所述的方法,其特征在于,将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:将所述问题文本、所述问题文本之前的历史知识问答对话信息及所述知识搜索结果拼
接为提示指令prompt。6.根据权利要求1所述的方法,其特征在于,还包括:结合所述问题文本拆解后的若干个推理任务,生成所述问题文本对应的推理描述信息;则将所述问题文本及所述知识搜索结果拼接为提示指令prompt的过程,包括:将所述问题文...

【专利技术属性】
技术研发人员:魏思许胜强胡加学贺志阳赵景鹤鹿晓亮刘聪王士进刘权胡国平
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1