基于多粒度检索的大模型知识库检索方法技术

技术编号:44698511 阅读:13 留言:0更新日期:2025-03-19 20:49
本发明专利技术公开了基于多粒度检索的大模型知识库检索方法,包括:构建基于标题、片段和句三个级别知识的知识库,知识库包括存储有第一向量和第二向量的向量数据库,和第一向量和第二向量对应的索引值和索引类型的关系型数据库;利用向量模型生成用户查询的向量值,分别在第一向量和第二向量中查询与查询向量值相似度最高的若干查询索引向量,在关系型数据库中获取与查询索引向量对应的查询索引值和查询索引类型,作为候选检索结果;将若干候选检索结果与用户查询共同构建查询提示词,输入大模型中获得最终查询答复。本发明专利技术显著提高了检索系统的精度、效率和智能化水平,解决了现有技术中存在的精度不高、查询适应性差和知识库更新缓慢等问题。

【技术实现步骤摘要】

本专利技术涉及大模型,尤其涉及基于多粒度检索的大模型知识库检索方法


技术介绍

1、随着信息技术的快速发展,海量的文本数据和知识库不断涌现,如何有效地对这些数据进行检索、处理和利用,已经成为许多领域中的关键问题。尤其是在自然语言处理(nlp)和人工智能(ai)领域,随着深度学习技术和大模型(如gpt、llama等)的不断进步,智能检索技术逐渐成为提高信息获取效率的核心技术。

2、传统的知识库检索方法通常依赖于基于关键字匹配的检索机制。这些方法虽然在某些特定场景下可以提供基本的检索功能,但在面对大规模、多维度、语义复杂的知识库时,其检索效率和准确性往往无法满足实际需求。特别是在面对非结构化文本数据时,传统方法很难应对复杂的查询需求,无法从不同的层次和维度对知识进行有效抽取。

3、目前,许多现代检索方法已经开始结合向量空间模型,通过将文本转换为高维向量表示,以捕捉文本间的语义关系。这些方法通常采用深度学习模型对文本进行编码,生成向量表示,然后通过计算向量之间的相似度进行检索。然而,现有的检索方法仍然存在一些问题和挑战

4、本文档来自技高网...

【技术保护点】

1.基于多粒度检索的大模型知识库检索方法,其特征在于,包括步骤:

2.如权利要求1所述的基于多粒度检索的大模型知识库检索方法,其特征在于,所述知识库的构建方法包括:

3.如权利要求2所述的基于多粒度检索的大模型知识库检索方法,其特征在于,所述步骤S101包括:

4.如权利要求2所述的基于多粒度检索的大模型知识库检索方法,其特征在于,所述步骤S102包括:

5.如权利要求1所述的基于多粒度检索的大模型知识库检索方法,其特征在于,所述查询索引向量的获取方法包括:

6.如权利要求5所述的基于多粒度检索的大模型知识库检索方法,其特征在于...

【技术特征摘要】

1.基于多粒度检索的大模型知识库检索方法,其特征在于,包括步骤:

2.如权利要求1所述的基于多粒度检索的大模型知识库检索方法,其特征在于,所述知识库的构建方法包括:

3.如权利要求2所述的基于多粒度检索的大模型知识库检索方法,其特征在于,所述步骤s101包括:

4.如权利要求2所述的基于多粒度检索的大模型知识库检索方法,其特征在于,所述步...

【专利技术属性】
技术研发人员:邓宏杰张静然沈复民申恒涛
申请(专利权)人:成都考拉悠然科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1