基于模型知识边界的自适应检索增强生成方法及系统技术方案

技术编号:42457437 阅读:16 留言:0更新日期:2024-08-21 12:47
本发明专利技术提供一种基于模型知识边界的自适应检索增强生成方法及系统,涉及大语言模型的检索增强生成技术领域。其中,基于模型知识边界的自适应检索增强生成方法,其首先基于改进的prompt模板的格式组织提示词,同时利用预先构建的大语言模型重排器对与用户提示相关的召回信息进行自适应重排;然后将上述用户提示和自适应重排的结果拼接后输入目标大语言模型,以最终获取生成结果。相比于现有大语言模型检索增强生成技术,本发明专利技术生成结果质量更高,推理速度更快,成本更低,能实现各种不同的应用场景,普适性更好。

【技术实现步骤摘要】

本专利技术涉及大语言模型的检索增强生成,具体涉及一种基于模型知识边界的自适应检索增强生成方法及系统


技术介绍

1、大语言模型的检索增强生成(retrieval-augmented generation,rag)技术,是一种结合了信息检索和文本生成的技术。它利用大型预训练语言模型(large languagemodels,llm),并增加一个检索组件来查询存储的知识库,以获取与输入查询相关的额外信息(即召回文章)。然后,将检索到的信息与初始输入一起被用作生成组件的上下文,从而产生更加丰富、准确和有信息量的输出。这一技术可以解决大模型幻觉和持续学习的难题,被广泛应用于回答系统、内容创作、对话生成等场景中。

2、然而,现有的大语言模型的检索增强生成技术依然存在以下问题:

3、1)在召回文章的重排方面,一般采用点粒度的相关性排序的方法(如upr),或者基于列粒度的方法(如rankvicuna和rankzephyr等),前者虽高效简单但无法很好的获取到多个篇章之间的内在关联,而后者只能返回固定数量篇目的排序结果,这可能会导致检索噪声的引入,本文档来自技高网...

【技术保护点】

1.一种基于模型知识边界的自适应检索增强生成方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,基于拥有自适应重排能力的闭源模型标注的数据对开源模型进行训练包括:

3.如权利要求2所述的方法,其特征在于,所述两步渐进蒸馏包括:

4.如权利要求3所述的方法,其特征在于,所述改进的prompt模板包括:调整prompt模板中的关键词以让模型自适应的输出召回文章数量。

5.如权利要求3所述的方法,其特征在于,在执行S123之前,分别采用K-means算法和Min-max算法对用户提示和召回信息中的数据进行采样。

...

【技术特征摘要】

1.一种基于模型知识边界的自适应检索增强生成方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,基于拥有自适应重排能力的闭源模型标注的数据对开源模型进行训练包括:

3.如权利要求2所述的方法,其特征在于,所述两步渐进蒸馏包括:

4.如权利要求3所述的方法,其特征在于,所述改进的prompt模板包括:调整prompt模板中的关键词以让模型自适应的输出召回文章数量。

5.如权利要求3所述的方法,其特征在于,在执行s123之前,分别采用k-means算法和min-max算法对用户提示和召回信息中的数据进行采样。

6.如权利要求5所述的方法,其特征在于,采用k-means算法和min-max算...

【专利技术属性】
技术研发人员:王皓陈恩红连德富顾宏超吕航
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1