【技术实现步骤摘要】
知识库问答方法、装置、电子设备及存储介质
[0001]本申请属于人工智能
,尤其涉及一种知识库问答方法
、
装置
、
电子设备及计算机可读存储介质
。
技术介绍
[0002]目前在问答领域,如超市的智能客服问答系统,对于用户输入的问题,通过匹配本地问答库并反馈给用户最相似的问题的答案;或者通过语言模型直接生成问题的答案反馈给用户
。
然而,由于问答库中问答数据的数量可能不足
、
语言模型可能会偏离用户的问题等,往往无法准确的对用户的问题进行回答,影响用户体验
。
技术实现思路
[0003]本申请实施例提供了一种知识库问答方法
、
装置
、
电子设备及计算机可读存储介质,可以准确的基于查询问题生成查询答案
。
[0004]第一方面,本申请实施例提供了一种知识库问答方法,包括:获取查询问题,利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案;所述向量编码模型通过向量检索的形式从所述问答知识库中召回所述查询问题的相似问题;根据所述查询问题
、
所述相似问题
、
所述相似问题的答案构建查询提示词;利用预训练的大语言模型生成所述查询提示词的查询答案
。
[0005]可选地,所述利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案之前,还包括:获取历 ...
【技术保护点】
【技术特征摘要】
1.
一种知识库问答方法,其特征在于,包括:获取查询问题,利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案;所述向量编码模型通过向量检索的形式从所述问答知识库中召回所述查询问题的相似问题;根据所述查询问题
、
所述相似问题
、
所述相似问题的答案构建查询提示词;利用预训练的大语言模型生成所述查询提示词的查询答案
。2.
如权利要求1所述的知识库问答方法,其特征在于,所述利用预训练的向量编码模型从问答知识库中检索出所述查询问题的多个相似问题及所述相似问题对应的答案之前,还包括:获取历史对话集合及预设的文本向量化模型;基于所述历史对话集合及所述问答知识库构建相似问题集合;利用所述历史对话集合
、
所述问答知识库
、
所述相似问题集合对所述文本向量化模型进行微调,得到所述预训练的向量编码模型
。3.
如权利要求2所述的知识库问答方法,其特征在于,所述基于所述历史对话集合及所述问答知识库构建相似问题集合,包括:获取开源问题对集合,基于所述开源问题对集合中的问题对及所述问答知识库中的问题构建训练提示词;根据所述训练提示词确定第一相似问题;从所述历史对话集合中召回第二相似问题;所述第二相似问题为所述历史对话集合中与所述问答知识库中的问题相似的问题;对所述第一相似问题及所述第二相似问题进行标注,基于标注后的所述第一相似问题及所述第二相似问题得到所述相似问题集合
。4.
如权利要求2所述的知识库问答方法,其特征在于,所述利用所述历史对话集合
、
所述问答知识库
、
所述相似问题集合对所述文本向量化模型进行微调,得到所述预训练的向量编码模型,包括:将所述相似问题集合作为有监督训练数据集合,以及将所述历史对话集合
、
所述问答知识库作为无监督训练数据集合;利用所述有监督训练数据集合及所述文本向量化模型计算第一损失;利用所述无监督训练数据集合及所述文本向量化模型计算第二损失;基于所述第一损失及所述第二损失对所述文本向量化模型进行微调,得到所述向量编码模型
。5.
...
【专利技术属性】
技术研发人员:张俊峰,张炜,
申请(专利权)人:深圳市灵智数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。