System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 大模型检索增强生成方法及装置制造方法及图纸_技高网

大模型检索增强生成方法及装置制造方法及图纸

技术编号:42304893 阅读:11 留言:0更新日期:2024-08-14 15:51
本发明专利技术实施例提供了一种大模型检索增强生成方法及装置,该方法包括:获取第一问题,将第一问题进行编码得到第一问题向量;根据第一问题向量确定第一向量;根据第一向量确定第二向量;通过大语言模型对第二向量进行处理得到目标答案;在第一向量的类型为文本向量时,第一向量表征至少一个文本分块向量与对应的上下文信息组合成的至少一个文本块向量,至少一个文本分块向量为在向量数据库中检索到的与第一问题向量相关的文本分块向量;在第一向量的类型为问题向量时,第一向量包括以下其中一项:向量数据库中与第一问题向量满足相似度条件的至少一个第二问题向量、与第一问题向量相关的至少一个第三问题向量、第一问题向量的至少一个子问题向量。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种大模型检索增强生成方法及装置


技术介绍

1、目前大模型结合检索增强生成器回答用户问题,由于检索集中并非所有块都与查询相关,检索结果输入大模型,会导致潜在的大模型幻觉问题,即大模型编造了一个上下文中不存在的答案,还会导致检索结果不准确的问题,从而影响到大语言模型生成答案的相关性和准确性。


技术实现思路

1、鉴于上述问题,本申请实施例提供一种克服上述问题或者至少部分地解决上述问题的大模型检索增强生成方法及装置。

2、第一方面,本专利技术实施例提供了一种大模型检索增强生成方法,所述方法包括:

3、获取第一问题,并将所述第一问题进行编码,得到第一问题向量;

4、根据所述第一问题向量,确定第一向量,所述第一向量的类型为文本向量或者问题向量;

5、根据所述第一向量,确定第二向量,所述第二向量的类型为文本向量;

6、通过大语言模型对所述第二向量进行处理,得到目标答案;

7、其中,在所述第一向量的类型为文本向量的情况下,所述第一向量表征至少一个文本分块向量与对应的上下文信息组合成的至少一个文本块向量,所述至少一个文本分块向量为在向量数据库中检索到的与所述第一问题向量相关的文本分块向量;

8、在所述第一向量的类型为问题向量的情况下,所述第一向量包括以下其中一项:所述向量数据库中与所述第一问题向量满足相似度条件的至少一个第二问题向量、与所述第一问题向量相关的至少一个第三问题向量、所述第一问题向量的至少一个子问题向量。

9、第二方面,本专利技术实施例还提供了一种大模型检索增强生成装置,所述装置包括:

10、第一获取模块,用于获取第一问题,并将所述第一问题进行编码,得到第一问题向量;

11、第一确定模块,用于根据所述第一问题向量,确定第一向量,所述第一向量的类型为文本向量或者问题向量;

12、第二确定模块,用于根据所述第一向量,确定第二向量,所述第二向量的类型为文本向量;

13、第一处理模块,用于通过大语言模型对所述第二向量进行处理,得到目标答案;

14、其中,在所述第一向量的类型为文本向量的情况下,所述第一向量表征至少一个文本分块向量与对应的上下文信息组合成的至少一个文本块向量,所述至少一个文本分块向量为在向量数据库中检索到的与所述第一问题向量相关的文本分块向量;

15、在所述第一向量的类型为问题向量的情况下,所述第一向量包括以下其中一项:所述向量数据库中与所述第一问题向量满足相似度条件的至少一个第二问题向量、与所述第一问题向量相关的至少一个第三问题向量、所述第一问题向量的至少一个子问题向量。

16、第三方面,本专利技术实施例还提供了一种电子设备,包括存储器,收发机,处理器:

17、存储器,用于存储计算机程序;收发机,用于在处理器的控制下收发数据;处理器,用于读取存储器中的计算机程序并执行如上述第一方面所述的方法。

18、第四方面,本专利技术实施例还提供一种处理器可读存储介质,处理器可读存储介质存储有计算机程序,计算机程序用于使处理器执行上述第一方面所述的方法。

19、本专利技术上述实施例,获取第一问题,并将所述第一问题进行编码,得到第一问题向量;根据所述第一问题向量,确定第一向量,所述第一向量的类型为文本向量或者问题向量,根据所述第一向量,确定第二向量,所述第二向量的类型为文本向量;通过大语言模型对所述第二向量进行处理,得到目标答案。如果所述第一向量的类型为文本向量,则所述第一向量表征至少一个文本分块向量与对应的上下文信息组合成的至少一个文本块向量,所述至少一个文本分块向量为在向量数据库中检索到的与所述第一问题向量相关的文本分块向量。如果所述第一向量的类型为问题向量,则所述第一向量包括以下其中一项:所述向量数据库中与所述第一问题向量满足相似度条件的至少一个第二问题向量、与所述第一问题向量相关的至少一个第三问题向量、所述第一问题向量的至少一个子问题向量。即在检索过程中,如果第一问题向量与向量数据库中的文本向量不相关,则可以通过检索出问题向量再进一步得到文本向量,再通过文本向量生成目标答案,通过对检索过程的优化,有效减少答案的误差和虚假内容,提升大语言模型生成答案的相关性和准确性。

本文档来自技高网...

【技术保护点】

1.一种大模型检索增强生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述第一向量的类型为文本向量的情况下,所述根据所述第一问题向量,确定第一向量,包括:

3.根据权利要求1所述的方法,其特征在于,在所述第一向量的类型为问题向量的情况下,所述根据所述第一问题向量,确定第一向量,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一向量,确定第二向量,包括:

5.根据权利要求1所述的方法,其特征在于,在所述第一向量的类型为问题向量的情况下,所述根据所述第一问题向量,确定第一向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述第一向量,确定第二向量,包括:

7.根据权利要求6所述的方法,其特征在于,所述通过大语言模型对所述第二向量进行处理,得到目标答案,包括:

8.根据权利要求1所述的方法,其特征在于,在所述第一向量的类型为问题向量的情况下,所述根据所述第一问题向量,确定第一向量,包括:

9.根据权利要求8所述的方法,其特征在于,所述根据所述第一向量,确定第二向量,包括:

10.根据权利要求9所述的方法,其特征在于,所述通过大语言模型对所述第二向量进行处理,得到目标答案,包括:

11.一种大模型检索增强生成装置,其特征在于,所述装置包括:

12.一种电子设备,其特征在于,包括存储器,收发机,处理器:

13.一种处理器可读存储介质,其特征在于,所述处理器可读存储介质存储有计算机程序,所述计算机程序用于使所述处理器执行如权利要求1至10任一项所述的大模型检索增强生成方法。

...

【技术特征摘要】

1.一种大模型检索增强生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在所述第一向量的类型为文本向量的情况下,所述根据所述第一问题向量,确定第一向量,包括:

3.根据权利要求1所述的方法,其特征在于,在所述第一向量的类型为问题向量的情况下,所述根据所述第一问题向量,确定第一向量,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一向量,确定第二向量,包括:

5.根据权利要求1所述的方法,其特征在于,在所述第一向量的类型为问题向量的情况下,所述根据所述第一问题向量,确定第一向量,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述第一向量,确定第二向量,包括:

7.根据权利要求6所述的方法,其特征在于,所述通过大...

【专利技术属性】
技术研发人员:郑振宇何全胜林妍黄雪伟郑博邓敏仪胡春英谢香梅刘彦林惠
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1