知识库问答方法技术

技术编号:39897791 阅读:5 留言:0更新日期:2023-12-30 13:11
本申请适用于人工智能技术领域,提供了知识库问答方法

【技术实现步骤摘要】
知识库问答方法、装置、电子设备及存储介质


[0001]本申请属于人工智能
,尤其涉及一种知识库问答方法

装置

电子设备及计算机可读存储介质


技术介绍

[0002]目前在问答领域,如超市的智能客服问答系统,对于用户输入的问题,通过匹配本地问答库并反馈给用户最相似的问题的答案;或者通过语言模型直接生成问题的答案反馈给用户

然而,由于问答库中问答数据的数量可能不足

语言模型可能会偏离用户的问题等,往往无法准确的对用户的问题进行回答,影响用户体验


技术实现思路

[0003]本申请实施例提供了一种知识库问答方法

装置

电子设备及计算机可读存储介质,可以准确的基于查询问题生成查询答案

[0004]第一方面,本申请实施例提供了一种知识库问答方法,包括:获取查询问题,利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案;所述向量编码模型通过向量检索的形式从所述问答知识库中召回所述查询问题的相似问题;根据所述查询问题

所述相似问题

所述相似问题的答案构建查询提示词;利用预训练的大语言模型生成所述查询提示词的查询答案

[0005]可选地,所述利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案之前,还包括:获取历史对话集合及预设的文本向量化模型;基于所述历史对话集合及所述问答知识库构建相似问题集合;利用所述历史对话集合

所述问答知识库

所述相似问题集合对所述文本向量化模型进行微调,得到所述预训练的向量编码模型

[0006]可选地,所述基于所述历史对话集合及所述问答知识库构建相似问题集合,包括:获取开源问题对集合,基于所述开源问题对集合中的问题对及所述问答知识库中的问题构建训练提示词;根据所述训练提示词确定第一相似问题;从所述历史对话集合中召回第二相似问题;所述第二相似问题为所述历史对话集合中与所述问答知识库中的问题相似的问题;对所述第一相似问题及所述第二相似问题进行标注,基于标注后的所述第一相似问题及所述第二相似问题得到所述相似问题集合

[0007]可选地,所述利用所述历史对话集合

所述问答知识库

所述相似问题集合对所述文本向量化模型进行微调,得到所述预训练的向量编码模型,包括:将所述相似问题集合作为有监督训练数据集合,以及将所述历史对话集合

所述
问答知识库作为无监督训练数据集合;利用所述有监督训练数据集合及所述文本向量化模型计算第一损失;利用所述无监督训练数据集合及所述文本向量化模型计算第二损失;基于所述第一损失及所述第二损失对所述文本向量化模型进行微调,得到所述向量编码模型

[0008]可选地,所述利用预训练的大语言模型生成所述查询提示词的查询答案之前,还包括:利用预设的微调指令模板调整所述问答知识库中的问答数据的格式,得到微调数据集合;所述微调指令模板是指用于调整问答数据格式的标准格式模板;基于所述微调数据集合对预设的语言模型进行微调,得到所述预训练的大语言模型

[0009]可选地,所述基于所述微调数据集合对预设的语言模型进行微调,包括:冻结所述语言模型中的部分参数;利用冻结后的所述语言模型及所述微调数据集合计算第三损失;基于所述第三损失调整所述语言模型中未被冻结的参数

[0010]可选地,所述利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案,包括:利用所述向量编码模型对所述查询问题进行向量化处理,得到查询向量;利用所述查询向量匹配向量数据库中的向量数据,根据匹配到的多个向量数据从所述问答知识库中得到所述查询问题的多个相似问题及所述相似问题对应的答案,其中,所述向量数据库中的向量数据通过所述向量编码模型对所述问答知识库中的问题进行向量化处理得到

[0011]可选地,所述根据所述查询问题

所述相似问题

所述相似问题的答案构建查询提示词,包括:根据所述查询问题过滤所述相似问题中的异常问题,得到过滤问题;在所述过滤问题包括至少一个所述相似问题的情况下,根据所述查询问题

所述过滤问题

所述过滤问题的答案构建所述查询提示词

[0012]第二方面,本申请实施例提供了一种知识库问答装置,包括:相似问题获取模块,用于获取查询问题,利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案;所述向量编码模型通过向量检索的形式从所述问答知识库中召回所述查询问题的相似问题;查询提示词构建模块,用于根据所述查询问题

所述相似问题

所述相似问题的答案构建查询提示词;查询答案生成模块,用于利用预训练的大语言模型生成所述查询提示词的查询答案

[0013]第三方面,本申请实施例提供了一种电子设备,包括存储器

处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的知识库问答方法的步骤

[0014]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机存储介质
存储有计算机程序,所述计算机程序被处理器执行时实现上述第一方面所述的知识库问答方法的步骤

[0015]第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使得电子设备执行上述第一方面任一项所述的知识库问答方法

[0016]本申请实施例与现有技术相比存在的有益效果是:本申请实施例中,通过从问答知识库中检索出查询问题的多个相似问题,利用该相似问题构建查询提示词,根据预训练的大语言模型可以准确地生成查询答案

具体地,由于通过上述向量编码模型基于向量检索的形式从问答知识库中召回问题,而向量检索可以快速查询上述问答数据库中的问题数据,因此,可以快速的从问答知识库中检索出上述查询问题的多个相似问题

在得到多个相似问题后,由于查询提示词根据上述查询问题

上述相似问题

上述相似问题的答案构建,因此,在利用预训练的大语言模型生成查询提示词的查询答案时,意味着会根据相似问题及相似问题的答案来引导上述大语言模型生成查询答案,避免问答系统偏离用户的问题,提高了查询答案生成的准确性

附图说明
[0017]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种知识库问答方法,其特征在于,包括:获取查询问题,利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案;所述向量编码模型通过向量检索的形式从所述问答知识库中召回所述查询问题的相似问题;根据所述查询问题

所述相似问题

所述相似问题的答案构建查询提示词;利用预训练的大语言模型生成所述查询提示词的查询答案
。2.
如权利要求1所述的知识库问答方法,其特征在于,所述利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案之前,还包括:获取历史对话集合及预设的文本向量化模型;基于所述历史对话集合及所述问答知识库构建相似问题集合;利用所述历史对话集合

所述问答知识库

所述相似问题集合对所述文本向量化模型进行微调,得到所述预训练的向量编码模型
。3.
如权利要求2所述的知识库问答方法,其特征在于,所述基于所述历史对话集合及所述问答知识库构建相似问题集合,包括:获取开源问题对集合,基于所述开源问题对集合中的问题对及所述问答知识库中的问题构建训练提示词;根据所述训练提示词确定第一相似问题;从所述历史对话集合中召回第二相似问题;所述第二相似问题为所述历史对话集合中与所述问答知识库中的问题相似的问题;对所述第一相似问题及所述第二相似问题进行标注,基于标注后的所述第一相似问题及所述第二相似问题得到所述相似问题集合
。4.
如权利要求2所述的知识库问答方法,其特征在于,所述利用所述历史对话集合

所述问答知识库

所述相似问题集合对所述文本向量化模型进行微调,得到所述预训练的向量编码模型,包括:将所述相似问题集合作为有监督训练数据集合,以及将所述历史对话集合

所述问答知识库作为无监督训练数据集合;利用所述有监督训练数据集合及所述文本向量化模型计算第一损失;利用所述无监督训练数据集合及所述文本向量化模型计算第二损失;基于所述第一损失及所述第二损失对所述文本向量化模型进行微调,得到所述向量编码模型
。5.
...

【专利技术属性】
技术研发人员:张俊峰张炜
申请(专利权)人:深圳市灵智数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1