System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及智能问答的,尤其是涉及一种知识库命中优化方法、设备、介质和产品。
技术介绍
1、在当前的信息时代,知识库作为存储和管理大量结构化信息的系统,已经成为人工智能、大数据分析、智能客服等领域的关键组成部分。知识库通过存储、管理和检索结构化或非结构化的信息,为用户提供准确、高效的信息服务,其中,知识库的高效检索和准确命中是其应用效果的关键。然而,在实际应用中,知识库的命中效果往往受到用户输入提示词的影响。
2、当前,用户输入的提示词通常存在信息量有限、不完整、不准确等问题,这些不完整的提示词会导致知识库在检索时难以准确匹配相关信息,从而影响知识库命中结果的准确性。
3、因而,如何提高知识库命中结果的准确性是本领域技术人员亟待解决的问题。
技术实现思路
1、本申请的目的是提供一种知识库命中优化方法、设备、介质和产品,用于解决以上至少一项技术问题。
2、本申请的上述专利技术目的是通过以下技术方案得以实现的:
3、第一方面,本申请提供一种知识库命中优化方法,采用如下的技术方案:
4、一种知识库命中优化方法,包括:
5、获取用户输入的查询语句,基于所述查询语句进行分词处理,得到查询单词序列;
6、基于所述查询单词序列进行预处理,得到已处理查询单词序列,其中,所述预处理包括:去除停用词和标点符号;
7、基于所述已处理查询单词序列进行词嵌入,得到查询向量,其中,所述查询向量是查询语句的数值化表示,
8、获取知识库,基于所述查询向量与所述知识库进行查询匹配,确定初次命中结果;
9、获取大语言模型,利用所述大语言模型对所述初次命中结果进行上下文拓展,生成与所述初次命中结果对应的上下文信息;
10、基于所述上下文信息与所述初次命中结果进行命中范围优化,得到优化命中结果,并将所述优化命中结果发送至用户终端,以便于为用户提供全面、准确的命中结果。
11、通过采用上述技术方案,基于查询语句进行分词处理,得到查询单词序列,然后,基于查询单词序列进行预处理,得到已处理查询单词序列,执行分词处理和预处理操作,会剔除查询语句中的噪声因素,使得查询匹配更加聚焦于关键信息,以提高查询语义的准确性和查询匹配的效率。进而,基于已处理查询单词序列进行词嵌入,得到查询向量,并基于查询向量与知识库进行查询匹配,确定初次命中结果。词嵌入还能够捕获词组之间的语义关系,使得查询向量能够更准确地表示查询语句的语义信息,从而提高了查询匹配的准确性。初次命中结果可能只是孤立的知识点,缺乏与其他信息的关联和整合,因而,利用大语言模型对初次命中结果进行上下文拓展,生成与初次命中结果对应的上下文信息,并基于上下文信息与初次命中结果进行命中范围优化,得到优化命中结果。通过上下文拓展来为用户提供一个更加丰富和完整的知识体系,提高了知识库命中结果的准确性。
12、本申请在一较佳示例中可以进一步配置为:所述利用所述大语言模型对所述初次命中结果进行上下文拓展,生成与所述初次命中结果对应的上下文信息,包括:
13、将所述初次命中结果输入至所述大语言模型,控制所述大语言模型进行上下文拓展,输出第一上下文信息;
14、基于所述初次命中结果和所述知识库进行相关性条目筛选,确定第二上下文信息;
15、获取外部资源库,并基于所述外部资源库和所述初次命中结果进行额外信息拓展,确定第三上下文信息;
16、基于所述第一上下文信息、所述第二上下文信息和所述第三上下文信息进行插值操作,生成与所述初次命中结果对应的上下文信息。
17、本申请在一较佳示例中可以进一步配置为:所述基于所述已处理查询单词序列进行词嵌入,得到查询向量,包括:
18、当所述已处理查询单词序列中仅包括一个目标查询单词时,利用词嵌入模型对所述目标查询单词进行向量转化,得到查询向量;
19、当所述已处理查询单词序列中包括至少两个目标查询单词时,利用组合分析方法对所述至少两个目标查询单词进行向量转化,得到查询向量,其中,所述组合分析方法包括:平均法、加权求和方法。
20、本申请在一较佳示例中可以进一步配置为:所述基于所述上下文信息与所述初次命中结果进行命中范围优化,得到优化命中结果,包括:
21、基于所述上下文信息与所述初次命中结果进行命中融合,确定融合命中集合;
22、基于所述融合命中集合进行多维排序,得到优化命中结果,其中,所述多维排序用于综合信息相似度和知识权威性来对命中结果进行排序。
23、本申请在一较佳示例中可以进一步配置为:所述基于所述查询向量与所述知识库进行查询匹配,确定初次命中结果之后,还包括:
24、当所述初次命中结果为未回答时,基于所述已处理查询单词序列进行查询扩展,得到扩展查询单词序列;
25、基于所述扩展查询单词序列进行词嵌入,得到扩展查询向量,并基于所述扩展查询向量与所述知识库进行查询匹配,得到扩展命中结果,并将所述扩展命中结果发送至用户终端;
26、基于所述初次命中结果为未回答的待填充查询语句进行填充标记,以便于向知识库中填充所述待填充查询语句对应的已检验信息。
27、本申请在一较佳示例中可以进一步配置为:所述基于所述上下文信息与所述初次命中结果进行命中范围优化,得到优化命中结果,并将所述优化命中结果发送至用户终端之后,还包括:
28、获取用户评价信息,基于所述用户评价信息进行命中精准分析,确定命中精准度;
29、获取知识库优化对应的精准度阈值,当所述命中精准度低于所述精准度阈值时,生成知识库优化指令,其中,所述知识库优化指令提示技术人员对知识库中数据进行优化填充。
30、第二方面,本申请提供一种电子设备,采用如下的技术方案:
31、至少一个处理器;
32、存储器;
33、至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行上述的知识库命中优化方法。
34、第三方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
35、一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行上所述的知识库命中优化方法。
36、第四方面,本申请提供了一种计算机程序产品,采用如下的技术方案:
37、一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述知识库命中优化方法。
38、综上所述,本申请包括以下至少一种有益技术效果:
39、基于查询语句进行分词处理,得到查询单词序列,然后,基于查询单词序列进行预处理,得到已处理查询单词序列,执行分词处理和预处理操作,会剔除查询语句中的噪声因素,使得查询匹配更加聚焦本文档来自技高网...
【技术保护点】
1.一种知识库命中优化方法,其特征在于,包括:
2.根据权利要求1所述的知识库命中优化方法,其特征在于,所述利用所述大语言模型对所述初次命中结果进行上下文拓展,生成与所述初次命中结果对应的上下文信息,包括:
3.根据权利要求1所述的知识库命中优化方法,其特征在于,所述基于所述已处理查询单词序列进行词嵌入,得到查询向量,包括:
4.根据权利要求1所述的知识库命中优化方法,其特征在于,所述基于所述上下文信息与所述初次命中结果进行命中范围优化,得到优化命中结果,包括:
5.根据权利要求1所述的知识库命中优化方法,其特征在于,所述基于所述查询向量与所述知识库进行查询匹配,确定初次命中结果之后,还包括:
6.根据权利要求1所述的知识库命中优化方法,其特征在于,所述基于所述上下文信息与所述初次命中结果进行命中范围优化,得到优化命中结果,并将所述优化命中结果发送至用户终端之后,还包括:
7.一种电子设备,其特征在于,包括:
8.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,当所述计算机程序在计算机中
9.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序被处理器执行权利要求1~6任一项所述的知识库命中优化方法。
...【技术特征摘要】
1.一种知识库命中优化方法,其特征在于,包括:
2.根据权利要求1所述的知识库命中优化方法,其特征在于,所述利用所述大语言模型对所述初次命中结果进行上下文拓展,生成与所述初次命中结果对应的上下文信息,包括:
3.根据权利要求1所述的知识库命中优化方法,其特征在于,所述基于所述已处理查询单词序列进行词嵌入,得到查询向量,包括:
4.根据权利要求1所述的知识库命中优化方法,其特征在于,所述基于所述上下文信息与所述初次命中结果进行命中范围优化,得到优化命中结果,包括:
5.根据权利要求1所述的知识库命中优化方法,其特征在于,所述基于所述查询向量与所述知识...
【专利技术属性】
技术研发人员:刘元生,郑友敏,张丽君,郑旭,李双其,张艺萱,王沁洋,
申请(专利权)人:福建中锐电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。