System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,尤其涉及一种知识库问答方法、装置、设备及介质。
技术介绍
1、知识库问答即给定自然语言问题,通过对问题进行语义理解和解析,进而利用知识库进行查询、推理得出答案。传统知识库问答通常包含数据结构化、预处理、问题理解、倒排搜索以及答案生成等流程,传统知识库问答流程复杂,且推理路径成本过高。
2、向量模型、大语言模型以及知识库可以为问答系统提供端到端的问答实现方式,但通用向量模型在进行专业领域的词汇转换时往往分词错误率较高,且大语言模型自由问答往往存在幻觉、缺乏依据等问题,上述问题都可能导致无法生成标准的专业领域问题答案,使得知识库问答效果较差。
技术实现思路
1、本专利技术提供了一种知识库问答方法、装置、设备及介质,能够准确回答针对于特定领域的用户问题,解决了现有技术中答案缺乏依据的问题。
2、根据本专利技术的一方面,提供了一种知识库问答方法,包括:
3、获取用户针对于目标领域的输入问题,并将所述输入问题输入至预先训练的目标领域向量模型中,获取目标领域向量模型输出的问题向量;
4、根据所述问题向量,在领域知识库中获取多个相关文本片段,并根据所述输入问题以及各相关文本片段,生成问答命令;
5、将所述问答命令输入至预先训练的目标领域大语言模型中,获取目标领域大语言模型输出的答案文本,并将所述答案文本反馈至用户端。
6、根据本专利技术的另一方面,提供了一种知识库问答装置,包括:
7、问题
8、问答命令生成模块,用于根据所述问题向量,在领域知识库中获取多个相关文本片段,并根据所述输入问题以及各相关文本片段,生成问答命令;
9、答案反馈模块,用于将所述问答命令输入至预先训练的目标领域大语言模型中,获取目标领域大语言模型输出的答案文本,并将所述答案文本反馈至用户端。
10、根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
11、至少一个处理器;以及
12、与所述至少一个处理器通信连接的存储器;其中,
13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的知识库问答方法。
14、根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的知识库问答方法。
15、本专利技术实施例的技术方案,通过目标领域向量模型将用户输入问题转换成问题向量,根据问题向量,在领域知识库中获取多个相关文本片段,根据输入问题以及相关文本片段生成问答命令,并将问答命令输入至目标领域大语言模型中,获取目标领域大语言模型输出的答案文本作为问答答案的方式,能够在向量生成阶段保证分词的专业性和准确性,从而在领域知识库中召回相关文本片段,作为最终回答的依据,根据一定量的领域知识对输入问题进行回答,从而保证答案的可靠性,提高用户使用知识库问答的体验。
16、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种知识库问答方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述问题向量,在领域知识库中获取多个相关文本片段,包括:
3.根据权利要求2所述的方法,其特征在于,在获取用户针对于目标领域的输入问题,并将所述输入问题输入至预先训练的目标领域向量模型中,获取目标领域向量模型输出的问题向量之前,还包括:
4.根据权利要求3所述的方法,其特征在于,对领域知识库中的各文档进行文本切分,并将切分后的多个文本片段存储在所述领域知识库中,包括:
5.根据权利要求3所述的方法,其特征在于,根据领域知识库中的文本片段,生成问题样本训练集,包括:
6.根据权利要求3所述的方法,其特征在于,在根据领域知识库中的文本片段,生成问题样本训练集,并利用所述问题样本训练集对初始向量模型进行训练,获取训练后的目标领域向量模型之后,还包括:
7.根据权利要求6所述的方法,其特征在于,根据领域知识库中的文本片段,生成问答对样本集,包括:
8.一种知识库问答装置,其特征在于,包括:
9.一种电子设
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的知识库问答方法。
...【技术特征摘要】
1.一种知识库问答方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述问题向量,在领域知识库中获取多个相关文本片段,包括:
3.根据权利要求2所述的方法,其特征在于,在获取用户针对于目标领域的输入问题,并将所述输入问题输入至预先训练的目标领域向量模型中,获取目标领域向量模型输出的问题向量之前,还包括:
4.根据权利要求3所述的方法,其特征在于,对领域知识库中的各文档进行文本切分,并将切分后的多个文本片段存储在所述领域知识库中,包括:
5.根据权利要求3所述的方法,其特征在于,根据领域知识库中的文本片段,生成问题样本训练集,包...
【专利技术属性】
技术研发人员:陈志刚,王子豪,穆玉芝,张健,韩伟,徐雪帆,周正茂,叶栽森,
申请(专利权)人:达观数据苏州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。