一种基于深度学习的RAG检索优化方法、系统及电子设备技术方案

技术编号:44264767 阅读:36 留言:0更新日期:2025-02-14 22:08
本发明专利技术公开了一种基于深度学习的RAG检索优化方法、系统及电子设备,包括将存储于不同场景的知识库中的各类文档进行预处理;将预处理后的文本块进行分词处理,获得文本块分词处理后的语料;获取待检索的用户问题,将用户问题和文档中的文本块进行向量化;将向量化后的文本块通过python Annoy框架近似搜索算法构建向量搜索库,得到问题向量的相似向量;利用TF‑IDF算法,基于文本块分词后的语料,提取出文本块的关键词;利用文本块的关键词和所述相似向量进行模型训练;基于训练好的TF‑IDF模型,抽取输入问题和文本块的关键词集合的相似度,分类召回目标知识库。上述方案利用深度学习实现知识库分类粗召回,可弥补采用以往的全量文本块召回导致的耗时长的缺陷。

【技术实现步骤摘要】

本专利技术涉及检索增强生成,具体为一种基于深度学习的rag检索优化方法、系统及电子设备。


技术介绍

1、在rag(检索增强生成)检索领域,当知识库文档较多的时候,文本块成正比的多,可以达到数百万级别,此时将用户的问题向量化后从数百万级别的文本块索引计算召回数个文本块会使得效率较低,召回速度慢,影响用户体验。

2、rag现有的方法和实现原理,将文档中的文本块进行分块后,向量化存储构建索引,随后将问题向量化后与知识库中的文本块求相似,召回出topk文本块返回给大模型生成答案。


技术实现思路

1、本专利技术的目的在于提供一种基于深度学习的rag检索优化方法、系统及电子设备,以解决上述
技术介绍
中提出的问题。

2、通过采用上述技术方案,实现了知识库分类粗召回,可弥补采用以往的全量文本块召回导致的耗时长的缺陷。

3、本专利技术的目的是采用下述技术方案实现的:

4、本专利技术第一方面提供了一种基于深度学习的rag检索优化方法,所述方法包括:

5、将存储于不同场景的本文档来自技高网...

【技术保护点】

1.一种基于深度学习的RAG检索优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的RAG检索优化方法,其特征在于,所述将存储于不同场景的知识库中的各类文档进行预处理包括:

3.根据权利要求1所述的RAG检索优化方法,其特征在于,所述获得预先训练的TF-IDF模型包括:

4.根据权利要求1所述的RAG检索优化方法,其特征在于,所述基于训练好的TF-IDF模型,抽取输入问题和文本块的关键词集合的相似度,分类召回目标知识库包括:通过训练好的TF-IDF模型进行抽取,输入问题和文本块的关键词集合,按照与问题query分数由高到低排序,依次选取预设数...

【技术特征摘要】

1.一种基于深度学习的rag检索优化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的rag检索优化方法,其特征在于,所述将存储于不同场景的知识库中的各类文档进行预处理包括:

3.根据权利要求1所述的rag检索优化方法,其特征在于,所述获得预先训练的tf-idf模型包括:

4.根据权利要求1所述的rag检索优化方法,其特征在于,所述基于训练好的tf-idf模型,抽取输入问题和文本块的关键词集合的相似度,分类召回目标知识库包括:通过训练好的tf-idf模型进行抽取,输入问题和文本块的关键词集合,按照与问题query分数由高到低排序,依次选取预设数量的文本块代码;

5.一种基于深度学习的rag检索优化系统,其特征在于,所述系统包括:

6.根据权利要求5所述的rag检索优化...

【专利技术属性】
技术研发人员:刘寓非刘帅王伟伟冯超宋公朴陈洪武
申请(专利权)人:上海圆擎信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1