一种RAG索引方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:46414913 阅读:5 留言:0更新日期:2025-09-16 20:03
本发明专利技术可应用于智慧医疗和金融领域的智能客服或智能助手,公开了一种RAG索引方法、装置、计算机设备及存储介质,包括:对原始文档采用自适应摘要策略构建多级摘要;根据构建获得的多级摘要结合文档结构形成树形索引组织原始文档的文档内容。通过实施上述方法可提高检索速度和检索精度。

【技术实现步骤摘要】

本专利技术涉及人工智能技术、自然语言处理,可应用于智慧医疗和金融领域,尤其涉及一种rag索引方法、装置、计算机设备及存储介质。


技术介绍

1、智能客服或智能助手,是自然语言处理((natural language processing,nlp)技术落地实际场景的最广泛最重要的方式之一,其中搜索引擎是智能助手系统的核心模块,搜索引擎可应用于智慧医疗或金融领域,以可查询或管理相应的医疗记录、医学论文、法律文件或金融书籍等参考材料。在当前的自然语言处理领域,检索增强生成(retrieval-augmented generation,rag)技术是提升模型生成质量和准确性的关键策略之一,有效利用大规模文本数据源以生成更加准确和详尽的回答。传统的基于rag的索引方法主要依赖如向量数据库结合嵌入向量的形式进行信息检索。

2、但是,传统的基于rag的索引方法通常将文本切分成小块后进行嵌入和检索,难以保证文本分块的连贯性和信息的完整性,会导致部分内容被拆散而使得难以在检索到的片段中准确还原上下文,且容易由于文本的分块而上下文丢失导致语义割裂,使得生成的回答缺乏本文档来自技高网...

【技术保护点】

1.一种RAG索引方法,其特征在于,包括:

2.如权利要求1所述的RAG索引方法,其特征在于,所述对原始文档采用自适应摘要策略构建多级摘要,包括:

3.如权利要求2所述的RAG索引方法,其特征在于,所述对原始文档进行预处理,获得规范文档,具体为:

4.如权利要求2所述的RAG索引方法,其特征在于,所述采用聚类策略对文本单元进行分组,获得文本块类组,具体为:

5.如权利要求2所述的RAG索引方法,其特征在于,所述利用大型语言模型对各文本块类组内的各文本块生成对应的文本摘要,对各文本摘要采用递归聚合方式生成全局摘要,包括:</p>

6.如权...

【技术特征摘要】

1.一种rag索引方法,其特征在于,包括:

2.如权利要求1所述的rag索引方法,其特征在于,所述对原始文档采用自适应摘要策略构建多级摘要,包括:

3.如权利要求2所述的rag索引方法,其特征在于,所述对原始文档进行预处理,获得规范文档,具体为:

4.如权利要求2所述的rag索引方法,其特征在于,所述采用聚类策略对文本单元进行分组,获得文本块类组,具体为:

5.如权利要求2所述的rag索引方法,其特征在于,所述利用大型语言模型对各文本块类组内的各文本块生成对应的文本摘要,对各文本摘要采用递归聚合方式生成全局摘要,包括:

6.如权利要求1所述的rag索引方法,其特征在于,所述根据构...

【专利技术属性】
技术研发人员:田野
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1