基于大模型的检索方法、装置及智能体制造方法及图纸

技术编号:43838230 阅读:21 留言:0更新日期:2024-12-31 18:35
本公开提供了基于大模型的检索方法、装置及智能体,涉及人工智能技领域,尤其涉及深度学习、大语言模型与检索增强生成式模型技术领域。该基于大模型的训练样本生成方法包括:利用大语言模型处理源文档,得到问答信息组;从预设知识库中,确定与问答信息组的问题信息相匹配的多个知识片段;基于问答信息组的答案信息与知识片段之间的相似度,从多个知识片段中确定正负样本知识片段;以及基于问答信息组和正负样本知识片段,生成用于训练检索生成大模型的正负训练样本。

【技术实现步骤摘要】

本公开涉及人工智能技术,尤其涉及深度学习、大语言模型与检索增强生成式模型,可应用于智能检索、智能问答等场景。


技术介绍

1、随着人工智能技术的发展,大模型逐渐广泛应用于例如自然语言处理、计算机视觉、语音识别等各种领域。可以利用训练样本数据对大模型进行训练,以提高大模型的性能或使大模型适用于特定场景。


技术实现思路

1、本公开提供了一种基于大模型的训练样本生成方法、检索生成大模型的训练方法、基于大模型的检索方法、装置、设备、介质、程序产品及智能体。

2、根据本公开的一方面,提供了一种基于大模型的训练样本生成方法,包括:利用大语言模型处理源文档,得到问答信息组;从预设知识库中,确定与问答信息组的问题信息相匹配的多个知识片段;基于问答信息组的答案信息与知识片段之间的相似度,从多个知识片段中确定正负样本知识片段;以及基于问答信息组和正负样本知识片段,生成用于训练检索生成大模型的正负训练样本。

3、根据本公开的另一方面,提供了一种检索生成大模型的训练方法,包括:获取正负训练样本,正负训练样本是上本文档来自技高网...

【技术保护点】

1.一种基于大模型的训练样本生成方法,包括:

2.根据权利要求1所述的方法,其中,所述基于所述问答信息组的答案信息与所述知识片段之间的相似度,从多个所述知识片段中确定正负样本知识片段包括:

3.根据权利要求1或2所述的方法,其中,所述基于所述问答信息组和所述正负样本知识片段,生成用于训练检索生成大模型的正负训练样本包括:

4.根据权利要求1所述的方法,其中,所述利用大语言模型处理源文档,得到问答信息组包括:

5.根据权利要求4所述的方法,其中,所述问答需求属性包括以下至少一项:

6.根据权利要求4所述的方法,还包括:

...

【技术特征摘要】

1.一种基于大模型的训练样本生成方法,包括:

2.根据权利要求1所述的方法,其中,所述基于所述问答信息组的答案信息与所述知识片段之间的相似度,从多个所述知识片段中确定正负样本知识片段包括:

3.根据权利要求1或2所述的方法,其中,所述基于所述问答信息组和所述正负样本知识片段,生成用于训练检索生成大模型的正负训练样本包括:

4.根据权利要求1所述的方法,其中,所述利用大语言模型处理源文档,得到问答信息组包括:

5.根据权利要求4所述的方法,其中,所述问答需求属性包括以下至少一项:

6.根据权利要求4所述的方法,还包括:

7.根据权利要求6所述的方法,其中,所述根据所述目标请求携带的需求信息,确定所述问答属性提示词包括:

8.根据权利要求4至7中任一项所述的方法,其中,所述利用大语言模型处理所述源文档和问答属性提示词,得到所述问答信息组包括:

9.根据权利要求8所述的方法,其中,所述基于属性评估结果更新所述问答属性提示词包括:

10.根据权利要求9所述的方法,其中,所述属性缺陷评估信息包括问答语义缺陷信息,所述问答语义缺陷信息表征所述初始问答信息组中的初始问题信息和初始答案信息之间的语义相似度不满足预设语义相似度条件;

11.一种检索生成大模型的训练方法,包括:

12.根据权利要求11所述的方法,其中,所述正负训练样本包括正训练样本和负训练样本,

13.一种基于大模型的检索方法,包括:

14.一种基于大模型的训练样本生成装置,包括:

15...

【专利技术属性】
技术研发人员:李薿骆金昌陈坤斌何伯磊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1