基于知识库的应答方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:42760129 阅读:27 留言:0更新日期:2024-09-18 13:47
本申请提供一种基于知识库的应答方法、装置、电子设备以及存储介质,知识库的应答方法应用于知识库问答系统,知识库问答系统包括多个不同版本的向量转换模型、多个文本块以及多个文本向量,知识库的应答方法包括:获取问题文本;采用多个不同版本的向量转换模型处理问题文本,得到多个问题向量;计算每个问题向量与相应版本的向量转换模型处理后的文本向量的相似度;基于相似度确定对应的文本块,对问题文本进行应答。这样,当模型版本更新后,无需再对模型更新前的文本向量重新进行向量化,只需将问题文本分别采用更新前后的模型进行向量化,即可进行相似度匹配,提高了应答的实时性。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种基于知识库的应答方法、装置、电子设备以及存储介质


技术介绍

1、知识库问答系统,是一个存储和组织信息的系统,通常用于支持特定领域的信息检索和处理。在知识库问答系统中,存储有大量文档。每篇文档都按照一定长度拆分成多个文本块,每个文本块分别通过embeddings模型转换为文本向量后存储。当用户基于系统进行提问时,系统先将用户的问题采用embeddings模型转换为问题向量,然后将问题向量与系统中的各个文本向量进行相似度计算,进而选择相似度最高的有限个文本向量对应的文本块。接着,将用户的问题和选择的文本块发送至通用预训练大语言模型,生成最终的答案,进而将答案反馈给用户。这样,就实现了对用户提问的自动应答。

2、为了提升系统应答的准确性,embeddings模型需要不断地训练优化,进行版本更新。与此同时,系统中还会不断地加入新的文档(多个文本块)。在系统中,已有的文本块使用的是旧版本的模型进行向量化,新增的文本块使用的是新版本的模型进行向量化。此时用户的问题采用的是新版本的模型进行向量化,用户的问题向量与已有的文本块本文档来自技高网...

【技术保护点】

1.一种基于知识库的应答方法,其特征在于,所述方法应用于知识库问答系统,所述知识库问答系统包括多个不同版本的向量转换模型、多个文本块以及多个文本向量,多个文本块采用相应版本的向量转换模型处理得到多个文本向量,每个版本的向量转换模型处理的文本块不完全相同;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,每个文本块包括多个子文本块,每个文本向量包括多个子文本向量;所述基于所述相似度确定对应的文本块,对所述问题文本进行应答,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述问题文本以及从每个文本向量中选择的至少一个子文本向量对应的子文本块,采用同一版...

【技术特征摘要】

1.一种基于知识库的应答方法,其特征在于,所述方法应用于知识库问答系统,所述知识库问答系统包括多个不同版本的向量转换模型、多个文本块以及多个文本向量,多个文本块采用相应版本的向量转换模型处理得到多个文本向量,每个版本的向量转换模型处理的文本块不完全相同;所述方法包括:

2.根据权利要求1所述的方法,其特征在于,每个文本块包括多个子文本块,每个文本向量包括多个子文本向量;所述基于所述相似度确定对应的文本块,对所述问题文本进行应答,包括:

3.根据权利要求2所述的方法,其特征在于,所述将所述问题文本以及从每个文本向量中选择的至少一个子文本向量对应的子文本块,采用同一版本的向量转换模型处理,得到目标问题向量和多个目标子文本向量,包括:

4.根据权利要求3所述的方法,其特征在于,所述从多个不同版本的向量转换模型中,选择目标模型,包括:

5.根据权利要求2所述的方法,其特征在于,所述基于所述相似度从每个文本向量中选择至少一个子文本向量,包括:

6...

【专利技术属性】
技术研发人员:范建涛张熹微张彦功秦飞虎袁瑞峰
申请(专利权)人:奇安信科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1