【技术实现步骤摘要】
本专利技术涉及大语言模型的检索增强生成,具体涉及一种基于模型知识边界的自适应检索增强生成方法及系统。
技术介绍
1、大语言模型的检索增强生成(retrieval-augmented generation,rag)技术,是一种结合了信息检索和文本生成的技术。它利用大型预训练语言模型(large languagemodels,llm),并增加一个检索组件来查询存储的知识库,以获取与输入查询相关的额外信息(即召回文章)。然后,将检索到的信息与初始输入一起被用作生成组件的上下文,从而产生更加丰富、准确和有信息量的输出。这一技术可以解决大模型幻觉和持续学习的难题,被广泛应用于回答系统、内容创作、对话生成等场景中。
2、然而,现有的大语言模型的检索增强生成技术依然存在以下问题:
3、1)在召回文章的重排方面,一般采用点粒度的相关性排序的方法(如upr),或者基于列粒度的方法(如rankvicuna和rankzephyr等),前者虽高效简单但无法很好的获取到多个篇章之间的内在关联,而后者只能返回固定数量篇目的排序结果,这可能会
...【技术保护点】
1.一种基于模型知识边界的自适应检索增强生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,基于拥有自适应重排能力的闭源模型标注的数据对开源模型进行训练包括:
3.如权利要求2所述的方法,其特征在于,所述两步渐进蒸馏包括:
4.如权利要求3所述的方法,其特征在于,所述改进的prompt模板包括:调整prompt模板中的关键词以让模型自适应的输出召回文章数量。
5.如权利要求3所述的方法,其特征在于,在执行S123之前,分别采用K-means算法和Min-max算法对用户提示和召回信息中的数据进行
...
【技术特征摘要】
1.一种基于模型知识边界的自适应检索增强生成方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,基于拥有自适应重排能力的闭源模型标注的数据对开源模型进行训练包括:
3.如权利要求2所述的方法,其特征在于,所述两步渐进蒸馏包括:
4.如权利要求3所述的方法,其特征在于,所述改进的prompt模板包括:调整prompt模板中的关键词以让模型自适应的输出召回文章数量。
5.如权利要求3所述的方法,其特征在于,在执行s123之前,分别采用k-means算法和min-max算法对用户提示和召回信息中的数据进行采样。
6.如权利要求5所述的方法,其特征在于,采用k-means算法和min-max算...
【专利技术属性】
技术研发人员:王皓,陈恩红,连德富,顾宏超,吕航,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。