【技术实现步骤摘要】
本专利技术涉及神经网络模型应用,具体地说是一种增强大模型外挂知识库检索能力的方法、系统及装置。
技术介绍
1、大模型的出现加速了各行业的自动化进程。为提高模型性能以适应行业,引入外部知识库,在某种程度上解决了大模型的局限性。然而,在将知识库与大模型结合时,仍然存在一些挑战。这些挑战包括知识库的有效加载、检索出的知识是否相关以及处理语义相似性的问题。
2、现有技术尝试将外部知识库与大模型结合,其中一种方法是将知识库文件分割并将其向量化,然后与模型的输入进行相似度计算,如图2所示。然而,这些方法在向量检索过程中存在问题。例如,对于具有高度语义相似性的文本,如"白酒礼包1"、"白酒礼包2"和"白酒礼包3",传统方法可能无法对这些文本进行有效区分。
技术实现思路
1、本专利技术的技术任务是针对以上不足之处,提供一种增强大模型外挂知识库检索能力的方法、系统及装置,通过增强对外部知识库的检索能力,使得大模型获取准确的文本,从而使其在特定任务上的表现更加优越。
2、本专利技术解决
...【技术保护点】
1.一种增强大模型外挂知识库检索能力的方法,其特征在于,该方法的实现方式如下:
2.根据权利要求1所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,使用工具langchain中的文件加载器将本地知识库中的知识文件进行加载切分,切分长度是文本段落或者是一个句子。
3.根据权利要求1或2所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述预训练的文本嵌入模型为m3e模型。
4.根据权利要求3所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述使用预训练的文本嵌入模型将文本转化为向量,将向量存储到milvus。
5.根...
【技术特征摘要】
1.一种增强大模型外挂知识库检索能力的方法,其特征在于,该方法的实现方式如下:
2.根据权利要求1所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,使用工具langchain中的文件加载器将本地知识库中的知识文件进行加载切分,切分长度是文本段落或者是一个句子。
3.根据权利要求1或2所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述预训练的文本嵌入模型为m3e模型。
4.根据权利要求3所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述使用预训练的文本嵌入模型将文本转化为向量,将向量存储到milvus。
5.根据权利要求1所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述问题文本的向量与本地向量库中的向量进行相似度计算...
【专利技术属性】
技术研发人员:张峻铭,冯落落,李志芸,尹青山,
申请(专利权)人:山东新一代信息产业技术研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。