一种增强大模型外挂知识库检索能力的方法、系统及装置制造方法及图纸

技术编号:40182951 阅读:27 留言:0更新日期:2024-01-26 23:48
本发明专利技术公开了一种增强大模型外挂知识库检索能力的方法、系统及装置,属于神经网络模型应用技术领域,该方法的实现方式如下:1)、根据问题,使用大模型生成相应的mysql语句;2)、判断sql是否为空或者报错,如果不为空,不报错,则检索mysql数据库中的数据,并传给大模型,该检索过程完成;3)、如果sql为空,或者检索失败,则进行:向量检索与BM25重排过程,使用向量检索与BM25算法融合,先用向量检索出相近的文本,再将这些文本使用BM25算法重排。本发明专利技术通过增强对外部知识库的检索能力,使得大模型获取准确的文本,从而使其在特定任务上的表现更加优越。

【技术实现步骤摘要】

本专利技术涉及神经网络模型应用,具体地说是一种增强大模型外挂知识库检索能力的方法、系统及装置


技术介绍

1、大模型的出现加速了各行业的自动化进程。为提高模型性能以适应行业,引入外部知识库,在某种程度上解决了大模型的局限性。然而,在将知识库与大模型结合时,仍然存在一些挑战。这些挑战包括知识库的有效加载、检索出的知识是否相关以及处理语义相似性的问题。

2、现有技术尝试将外部知识库与大模型结合,其中一种方法是将知识库文件分割并将其向量化,然后与模型的输入进行相似度计算,如图2所示。然而,这些方法在向量检索过程中存在问题。例如,对于具有高度语义相似性的文本,如"白酒礼包1"、"白酒礼包2"和"白酒礼包3",传统方法可能无法对这些文本进行有效区分。


技术实现思路

1、本专利技术的技术任务是针对以上不足之处,提供一种增强大模型外挂知识库检索能力的方法、系统及装置,通过增强对外部知识库的检索能力,使得大模型获取准确的文本,从而使其在特定任务上的表现更加优越。

2、本专利技术解决其技术问题所采用的技本文档来自技高网...

【技术保护点】

1.一种增强大模型外挂知识库检索能力的方法,其特征在于,该方法的实现方式如下:

2.根据权利要求1所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,使用工具langchain中的文件加载器将本地知识库中的知识文件进行加载切分,切分长度是文本段落或者是一个句子。

3.根据权利要求1或2所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述预训练的文本嵌入模型为m3e模型。

4.根据权利要求3所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述使用预训练的文本嵌入模型将文本转化为向量,将向量存储到milvus。

5.根...

【技术特征摘要】

1.一种增强大模型外挂知识库检索能力的方法,其特征在于,该方法的实现方式如下:

2.根据权利要求1所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,使用工具langchain中的文件加载器将本地知识库中的知识文件进行加载切分,切分长度是文本段落或者是一个句子。

3.根据权利要求1或2所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述预训练的文本嵌入模型为m3e模型。

4.根据权利要求3所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述使用预训练的文本嵌入模型将文本转化为向量,将向量存储到milvus。

5.根据权利要求1所述的一种增强大模型外挂知识库检索能力的方法,其特征在于,所述问题文本的向量与本地向量库中的向量进行相似度计算...

【专利技术属性】
技术研发人员:张峻铭冯落落李志芸尹青山
申请(专利权)人:山东新一代信息产业技术研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1