System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型的资源检索方法、训练方法以及装置制造方法及图纸_技高网

基于大语言模型的资源检索方法、训练方法以及装置制造方法及图纸

技术编号:40873380 阅读:5 留言:0更新日期:2024-04-08 16:41
本公开提供了基于大语言模型的资源检索方法、训练方法以及装置,涉及人工智能技术领域,尤其涉及智能搜索、大数据、深度学习、大语言模型等技术领域,可用于信息检索、人机交互等场景。基于大语言模型的资源检索方法的具体实现方案为:基于大语言模型的资源检索方法,包括:响应于接收到搜索信息,利用大语言模型处理搜索信息,得到语义编码序列,其中,语义编码序列包括至少一个语义编码标识,语义编码标识表征至少一个语义属性;从预设资源库的候选资源中确定与语义编码序列相关联的中间资源;根据中间资源,确定与搜索信息相匹配的目标资源;以及展示目标资源。

【技术实现步骤摘要】

本公开涉及人工智能,尤其涉及智能搜索、大数据、深度学习、大语言模型等,可用于信息检索、人机交互等场景。


技术介绍

1、随着互联网技术的快速发展,用户可以通过智能手机等终端设备快速地浏览新闻等资源信息,也可以基于需求在终端设备中输入文本、图像等搜索信息,进行资源信息检索,从而可以检索到与实际需求相匹配的资源信息,提升资源获取效率。


技术实现思路

1、本公开提供了一种基于大语言模型的资源检索方法、训练方法、装置、电子设备以及存储介质。

2、根据本公开的一方面,提供了一种基于大语言模型的资源检索方法,包括:响应于接收到搜索信息,利用大语言模型处理搜索信息,得到语义编码序列,其中,语义编码序列包括至少一个语义编码标识,语义编码标识表征至少一个语义属性;从预设资源库的候选资源中确定与语义编码序列相关联的中间资源;根据中间资源,确定与搜索信息相匹配的目标资源;以及展示目标资源。

3、根据本公开的另一方面,提供了一种大语言模型的训练方法,包括:获取训练样本,训练样本包括样本搜索信息和与样本资源相对应的样本语义编码序列,其中,样本搜索信息和样本资源相关联,样本语义编码序列包括至少一个样本语义编码标识,样本语义编码标识表征至少一个样本语义属性;基于样本搜索信息和样本语义编码序列训练初始大语言模型,得到训练后的大语言模型。

4、根据本公开的另一方面,提供了一种基于大语言模型的资源检索装置,包括:语义编码序列获得模块,用于响应于接收到搜索信息,利用大语言模型处理搜索信息,得到语义编码序列,其中,语义编码序列包括至少一个语义编码标识,语义编码标识表征至少一个语义属性;中间资源确定模块,用于从预设资源库的候选资源中确定与语义编码序列相关联的中间资源;目标资源确定模块,用于根据中间资源,确定与搜索信息相匹配的目标资源;以及第一展示模块,用于展示目标资源。

5、根据本公开的另一方面,提供了一种大语言模型的训练装置,包括:获取模块,用于获取训练样本,训练样本包括样本搜索信息和与样本资源相对应的样本语义编码序列,其中,样本搜索信息和样本资源相关联,样本语义编码序列包括至少一个样本语义编码标识,样本语义编码标识表征至少一个样本语义属性;训练模块,用于基于样本搜索信息和样本语义编码序列训练初始大语言模型,得到训练后的大语言模型。

6、根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行根据本公开实施例提供的方法。

7、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据本公开实施例提供的方法。

8、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据本公开实施例提供的方法。

9、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的资源检索方法,包括:

2.根据权利要求1所述的方法,其中,所述候选资源与候选语义编码序列相关联,所述候选语义编码序列是基于如下操作确定的:

3.根据权利要求2所述的方法,其中,所述根据所述候选资源相关语义特征,确定所述候选语义编码序列包括:

4.根据权利要求1所述的方法,其中,所述利用大语言模型处理所述搜索信息,得到语义编码序列包括:

5.根据权利要求1所述的方法,其中,所述利用大语言模型处理所述搜索信息,得到语义编码序列包括:

6.根据权利要求1至5中任一项所述的方法,还包括:

7.根据权利要求1至5中任一项所述的方法,还包括:

8.一种大语言模型的训练方法,包括:

9.根据权利要求8所述的方法,其中,所述训练样本还包括与所述样本资源相对应的样本资源相关信息,

10.根据权利要求9所述的方法,其中,所述根据所述样本资源相关信息训练所述初始大语言模型,得到中间大语言模型包括:

11.根据权利要求10所述的方法,其中,所述训练样本还包括与所述样本资源相关语义特征相对应的标签语义特征;

12.根据权利要求10所述的方法,其中,所述与样本资源相对应的样本语义编码序列是基于如下操作确定的:

13.根据权利要求9所述的方法,其中,所述根据所述样本资源相关信息训练所述初始大语言模型包括:

14.一种基于大语言模型的资源检索装置,包括:

15.根据权利要求14所述的装置,其中,所述候选资源与候选语义编码序列相关联,所述候选语义编码序列是基于如下操作确定的:

16.根据权利要求15所述的装置,其中,所述根据所述候选资源相关语义特征,确定所述候选语义编码序列包括:

17.根据权利要求14所述的装置,其中,所述语义编码序列获得模块包括:

18.根据权利要求14所述的装置,其中,所述语义编码序列获得模块包括:

19.根据权利要求14至18中任一项所述的装置,还包括:

20.根据权利要求14至18中任一项所述的装置,还包括:

21.一种大语言模型的训练装置,包括:

22.根据权利要求21所述的装置,其中,所述训练样本还包括与所述样本资源相对应的样本资源相关信息,

23.根据权利要求23所述的装置,其中,所述第一训练子模块包括:

24.根据权利要求23所述的装置,其中,所述训练样本还包括与所述样本资源相关语义特征相对应的标签语义特征;

25.根据权利要求23所述的装置,其中,所述与样本资源相对应的样本语义编码序列是基于如下操作确定的:

26.根据权利要求22所述的装置,其中,所述第一训练子模块包括:

27.一种电子设备,包括:

28.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1至13中任一项所述的方法。

29.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1至13中任一项所述的方法。

...

【技术特征摘要】

1.一种基于大语言模型的资源检索方法,包括:

2.根据权利要求1所述的方法,其中,所述候选资源与候选语义编码序列相关联,所述候选语义编码序列是基于如下操作确定的:

3.根据权利要求2所述的方法,其中,所述根据所述候选资源相关语义特征,确定所述候选语义编码序列包括:

4.根据权利要求1所述的方法,其中,所述利用大语言模型处理所述搜索信息,得到语义编码序列包括:

5.根据权利要求1所述的方法,其中,所述利用大语言模型处理所述搜索信息,得到语义编码序列包括:

6.根据权利要求1至5中任一项所述的方法,还包括:

7.根据权利要求1至5中任一项所述的方法,还包括:

8.一种大语言模型的训练方法,包括:

9.根据权利要求8所述的方法,其中,所述训练样本还包括与所述样本资源相对应的样本资源相关信息,

10.根据权利要求9所述的方法,其中,所述根据所述样本资源相关信息训练所述初始大语言模型,得到中间大语言模型包括:

11.根据权利要求10所述的方法,其中,所述训练样本还包括与所述样本资源相关语义特征相对应的标签语义特征;

12.根据权利要求10所述的方法,其中,所述与样本资源相对应的样本语义编码序列是基于如下操作确定的:

13.根据权利要求9所述的方法,其中,所述根据所述样本资源相关信息训练所述初始大语言模型包括:

14.一种基于大语言模型的资源检索装置,包括:

15.根据权利要求14所述的装置,其中,所...

【专利技术属性】
技术研发人员:王超黄飞贺登武
申请(专利权)人:百度时代网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1