System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型的知识库应答方法及系统技术方案_技高网

基于大语言模型的知识库应答方法及系统技术方案

技术编号:41205637 阅读:2 留言:0更新日期:2024-05-07 22:31
本发明专利技术公开了一种基于大语言模型的知识库应答方法及系统,其中该方法包括:提供一大语言模型;读取本地存储的知识文档,并将知识文档向量化处理,以获得知识数据库;获取用户的问题语句,并将该问题语句向量化处理,以获得问题数据;将问题数据和知识数据库进行查询匹配,以获得知识数据库中与问题数据相关联的目标知识数据;联合目标知识数据和问题数据一起生成大语言模型的提示词;大语言模型基于提示词生成应当内容。对于上述知识库应答方法,大语言模型不仅依赖用户的问题语句,还结合本地存储的知识文档进行处理,这使得即使用户的问题语句不够精确或完整,系统仍能通过分析本地知识文档与问题语句的关联,找到更准确和相关的知识内容。

【技术实现步骤摘要】

本专利技术涉及智能模型,尤其涉及一种基于大语言模型的知识库应答方法及系统


技术介绍

1、近年来,人工智能领域特别是自然语言处理(nlp)和机器学习(ml)领域取得了显著的进展。在这些进展中,语言模型,尤其是大型的预训练语言模型,如chatmindai(generative pretrained transformer)系列、bert(bidirectional encoderrepresentations from transformers)等,已成为处理和理解自然语言的核心技术。

2、传统的基于知识库的应答系统通常依赖于明确编码的规则和有限的知识库。这些系统在处理复杂的查询时面临困难,尤其是在理解和生成自然语言方面。此外,这些系统的扩展性和适应性通常受限于它们的知识库和规则的维护。

3、近期,利用大型语言模型的发展,基于深度学习的知识库应答方法开始受到重视。这些方法的核心在于利用大型语言模型的强大语言理解和生成能力,提高应答系统的准确性和自然性。

4、然而,目前基于大型语言模型的应答系统主要依赖用户输入的问题语句来直接生成提示词。这种方法在处理用户查询时存在一定的局限性。具体来说,用户在表达问题时可能不够精确或完整,有时甚至含糊不清。这种情况下,用户输入的问题语句可能无法准确地反映其真实的查询意图。

5、因此,当大型语言模型仅依赖这些可能不完整或不准确的问题语句来生成提示词时,模型生成的回答可能与用户实际想要了解的内容存在偏差。这不仅降低了应答的准确性,也影响了用户体验。>

6、在某些情况下,用户可能对特定领域的知识不够熟悉,导致他们难以准确表述查询问题。这进一步增加了基于用户问题语句直接生成提示词的方法在提供准确和相关回答方面的挑战。


技术实现思路

1、本专利技术的目的是提供一种即使在面对不完整或不精确的用户输入时也能生成更准确、更相关的回答的基于大语言模型的知识库应答方法及系统。

2、为了实现上述目的,本专利技术公开了一种基于大语言模型的知识库应答方法,其包括:

3、提供一大语言模型,所述大语言模型基于本地存储的知识文档训练而成;

4、读取本地存储的所述知识文档,并将所述知识文档向量化处理,以获得知识数据库;

5、获取用户的问题语句,并将该问题语句向量化处理,以获得问题数据;

6、将所述问题数据和所述知识数据库进行查询匹配,以获得所述知识数据库中与所述问题数据相关联的目标知识数据;

7、联合所述目标知识数据和问题数据一起生成所述大语言模型的提示词;

8、所述大语言模型基于所述提示词生成应当内容。

9、较佳地,查询匹配以获得所述目标知识数据的方法包括:

10、逐一将所述知识数据库中的每一知识数据与所述问题数据进行相似度计算,以获得匹配相似度;

11、根据数值大小关系对获得的若干所述匹配相似度进行排序;

12、抽取出若干数值较大的所述匹配相似度所对应的知识数据作为所述目标知识数据。

13、较佳地,获得所述匹配相似度后,将小于预设阈值的所述匹配相似度舍弃。

14、较佳地,基于自然语言处理模型对所述知识文档和所述问题语句进行向量化处理。

15、本专利技术还公开一种基于大语言模型的知识库应答系统,其包括:

16、大语言模型,所述大语言模型基于本地存储的知识文档训练而成;

17、知识数据库,所述知识数据库中存储有与所述知识文档相对应的向量化的知识数据;

18、问题处理模块,其用于将用户输入的问题语句向量化处理,以获得问题数据;

19、匹配模块,其用于将所述问题数据和所述知识数据库进行查询匹配,以获得所述知识数据库中与所述问题数据相关联的目标知识数据;

20、提示词生成模块,其用于联合所述目标知识数据和问题数据一起生成所述大语言模型的提示词。

21、较佳地,所述匹配模块包括计算模块、排序模块以及提取模块;

22、所述计算模块,用于逐一将所述知识数据库中的每一知识数据与所述问题数据进行相似度计算,以获得匹配相似度;

23、所述排序模块,用于根据数值大小关系对获得的若干所述匹配相似度进行排序;

24、所述提取模块,用于抽取出若干数值较大的所述匹配相似度所对应的知识数据作为所述目标知识数据。

25、较佳地,所述匹配模块还包括筛选模块,所述筛选模块将小于预设阈值的所述匹配相似度舍弃。

26、较佳地,还包括数据处理模块,所述数据处理模块基于自然语言处理模型对所述知识文档和所述问题语句进行向量化处理。

27、本专利技术还公开一种知识库应答系统,其包括:

28、一个或多个处理器;

29、存储器;

30、以及一个或多个程序,其中一个或多个程序被存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序包括用于执行如上所述的知识库应答方法的指令。

31、本专利技术还公开一种计算机可读存储介质,其包括计算机程序,所述计算机程序可被处理器执行以完成如上所述的知识库应答方法。

32、与现有技术相比,本专利技术上述技术方案公开的知识库应答方法,大语言模型不仅依赖用户的问题语句,还结合本地存储的知识文档进行处理。这使得即使用户的问题语句不够精确或完整,系统仍能通过分析本地知识文档与问题语句的关联,找到更准确和相关的知识内容,这种方法显著提高了应答的准确性和相关性,有效提升用户体验。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的知识库应答方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的知识库应答方法,其特征在于,查询匹配以获得所述目标知识数据的方法包括:

3.根据权利要求2所述的基于大语言模型的知识库应答方法,其特征在于,获得所述匹配相似度后,将小于预设阈值的所述匹配相似度舍弃。

4.根据权利要求1所述的基于大语言模型的知识库应答方法,其特征在于,基于自然语言处理模型对所述知识文档和所述问题语句进行向量化处理。

5.一种基于大语言模型的知识库应答系统,其特征在于,包括:

6.根据权利要求5所述的基于大语言模型的知识库应答系统,其特征在于,所述匹配模块包括计算模块、排序模块以及提取模块;

7.根据权利要求6所述的基于大语言模型的知识库应答系统,其特征在于,所述匹配模块还包括筛选模块,所述筛选模块将小于预设阈值的所述匹配相似度舍弃。

8.根据权利要求5所述的基于大语言模型的知识库应答系统,其特征在于,还包括数据处理模块,所述数据处理模块基于自然语言处理模型对所述知识文档和所述问题语句进行向量化处理。

9.一种知识库应答系统,其特征在于,包括:

10.一种计算机可读存储介质,其特征在于,包括计算机程序,所述计算机程序可被处理器执行以完成如权利要求1至4任一项所述的知识库应答方法。

...

【技术特征摘要】

1.一种基于大语言模型的知识库应答方法,其特征在于,包括:

2.根据权利要求1所述的基于大语言模型的知识库应答方法,其特征在于,查询匹配以获得所述目标知识数据的方法包括:

3.根据权利要求2所述的基于大语言模型的知识库应答方法,其特征在于,获得所述匹配相似度后,将小于预设阈值的所述匹配相似度舍弃。

4.根据权利要求1所述的基于大语言模型的知识库应答方法,其特征在于,基于自然语言处理模型对所述知识文档和所述问题语句进行向量化处理。

5.一种基于大语言模型的知识库应答系统,其特征在于,包括:

6.根据权利要求5所述的基于大语言模型的知识库应答系统...

【专利技术属性】
技术研发人员:梁康康万振华王颉董燕李华
申请(专利权)人:深圳开源互联网安全技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1