基于上下文的模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:37057153 阅读:6 留言:0更新日期:2023-03-29 19:33
本公开提供了一种基于上下文的模型训练方法、装置、电子设备及存储介质,涉及人工智能技术领域,尤其涉及智能搜索、自动驾驶、自主泊车、智能交通等领域。具体实现方案为:根据当前搜索请求及n个历史搜索请求,得到用于表征搜索意图的上下文信息,n为大于1的正整数;根据所述上下文信息,得到与所述当前搜索请求相关联的k个历史搜索请求,所述k为小于n的正整数;将所述k个历史搜索请求作为第一模型的训练样本,对所述第一模型进行训练,得到训练后的第二模型。采用本公开,可以提高模型的搜索性能,进而提高搜索精度。进而提高搜索精度。进而提高搜索精度。

【技术实现步骤摘要】
基于上下文的模型训练方法、装置、电子设备及存储介质


[0001]本公开涉及人工智能
,尤其涉及智能搜索、自动驾驶、自主泊车、智能交通等领域。

技术介绍

[0002]随着技术的发展,可以通过人工智能改善硬件性能,所适用的应用场景多种多样,比如搜索、地图导航、自动驾驶、自主泊车、智能交通等应用场景,在这些应用场景的硬件设计中都可以采用人工智能技术,即将训练好的模型部署于硬件中,以提高硬件的处理速度及处理准确率。
[0003]以搜索为例,大多需要用户多阶段的搜索才可以明确用户意图,导致成本高且搜索精度低,需要提高所部署模型的搜索性能。

技术实现思路

[0004]本公开提供了一种基于上下文的模型训练方法、搜索方法、装置、电子设备以及存储介质。
[0005]根据本公开的一方面,提供了一种基于上下文的模型训练方法,包括:
[0006]根据当前搜索请求及n个历史搜索请求,得到用于表征搜索意图的上下文信息,n为大于1的正整数;
[0007]根据上下文信息,得到与当前搜索请求相关联的k个历史搜索请求,k为小于n的正整数;
[0008]将k个历史搜索请求作为第一模型的训练样本,对第一模型进行训练,得到训练后的第二模型。
[0009]根据本公开的另一方面,提供了一种搜索方法,包括:
[0010]响应当前搜索请求,得到当前搜索请求中的至少一个搜索关键词;
[0011]根据至少一个搜索关键词,得到与当前搜索请求相关联的多个历史搜索请求;
[0012]将多个历史搜索请求输入第二模型,得到搜索结果;
[0013]其中,多个历史搜索请求中携带用于表征与当前搜索请求的搜索意图相关联的上下文信息;
[0014]其中,第二模型为根据上述任一实施例训练得到的搜索模型。
[0015]根据本公开的另一方面,提供了一种基于上下文的模型训练装置,包括:
[0016]第一处理模块,用于根据当前搜索请求及n个历史搜索请求,得到用于表征搜索意图的上下文信息,n为大于1的正整数;
[0017]第二处理模块,用于根据上下文信息,得到与当前搜索请求相关联的k个历史搜索请求,k为小于n的正整数;
[0018]第一训练模块,用于将k个历史搜索请求作为第一模型的训练样本,对第一模型进行训练,得到训练后的第二模型。
[0019]根据本公开的另一方面,提供了一种搜索装置,包括:
[0020]请求响应模块,用于响应当前搜索请求,得到当前搜索请求中的至少一个搜索关键词;
[0021]搜索关联模块,用于根据至少一个搜索关键词,得到与当前搜索请求相关联的多个历史搜索请求;
[0022]搜索处理模块,用于将多个历史搜索请求输入第二模型,得到搜索结果;
[0023]其中,多个历史搜索请求中携带用于表征与当前搜索请求的搜索意图相关联的上下文信息;
[0024]其中,第二模型为根据上述任一实施例训练得到的搜索模型。
[0025]根据本公开的另一方面,提供了一种电子设备,包括:
[0026]至少一个处理器;以及
[0027]与该至少一个处理器通信连接的存储器;其中,
[0028]该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任意一实施例所提供的方法。
[0029]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使该计算机执行本公开任意一项实施例所提供的方法。
[0030]根据本公开的另一方面,提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现本公开任意一项实施例所提供的方法。
[0031]采用本公开,可以根据当前搜索请求及n个历史搜索请求,得到用于表征搜索意图的上下文信息,n为大于1的正整数;根据该上下文信息可以得到与当前搜索请求相关联的k个历史搜索请求,k为小于n的正整数。可以将k个历史搜索请求作为第一模型的训练样本,对第一模型进行训练,以得到训练后的第二模型,由于可以基于上下文信息进行模型训练,因此,提高了模型的搜索性能,进而提高搜索精度。
[0032]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0033]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0034]图1是根据本公开实施例的一分布式集群处理场景的示意图;
[0035]图2是根据本公开实施例的基于上下文的模型训练方法的流程示意图;
[0036]图3是根据本公开实施例的搜索方法的流程示意图;
[0037]图4是根据本公开实施例的一应用示例中搜索框架的示意图;
[0038]图5是根据本公开实施例的一应用示例中关联标注模型的示意图;
[0039]图6是根据本公开实施例的一应用示例中POI向量召回模型的示意图;
[0040]图7是根据本公开实施例的一应用示例中POI语义排序模型的示意图;
[0041]图8是根据本公开实施例的一应用示例中响应文本输入的搜索排序示意图;
[0042]图9是根据本公开实施例的一应用示例中响应语音输入的搜索排序示意图;
[0043]图10是根据本公开实施例的基于上下文的模型训练装置的组成结构示意图;
[0044]图11是根据本公开实施例的搜索装置的组成结构示意图;
[0045]图12是用来实现本公开实施例的基于上下文的模型训练方法/搜索方法的电子设备的框图。
具体实施方式
[0046]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0047]本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。
[0048]另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于上下文的模型训练方法,包括:根据当前搜索请求及n个历史搜索请求,得到用于表征搜索意图的上下文信息,n为大于1的正整数;根据所述上下文信息,得到与所述当前搜索请求相关联的k个历史搜索请求,所述k为小于n的正整数;将所述k个历史搜索请求作为第一模型的训练样本,对所述第一模型进行训练,得到训练后的第二模型。2.根据权利要求1所述的方法,其中,所述根据当前搜索请求及n个历史搜索请求,得到用于表征搜索意图的上下文信息,包括:将所述当前搜索请求及所述n个历史搜索请求输入第三模型;在所述第三模型中进行语义关联,得到在语义上相关联的上下文信息。3.根据权利要求2所述的方法,其中,所述根据所述上下文信息,得到与所述当前搜索请求相关联的k个历史搜索请求,包括:根据所述在语义上相关联的上下文信息,从所述n个历史搜索请求中筛选出所述k个历史搜索请求。4.根据权利要求1

3中任一项所述的方法,其中,所述将所述k个历史搜索请求作为第一模型的训练样本,对所述第一模型进行训练,得到训练后的第二模型,包括:所述第一模型为双塔模型的情况下,将所述k个历史搜索请求输入所述双塔模型的第一分支,将地图数据中的兴趣点输入所述双塔模型的第二分支;获取所述第一分支输出的与所述k个历史搜索请求相关联的第一语义向量;获取所述第二分支输出的与所述兴趣点相关联的第二语义向量;在基于所述第一语义向量与所述第二语义向量的相关性打分满足预期分值的情况下结束训练,得到所述第二模型。5.根据权利要求4所述的方法,还包括:将所述k个历史搜索请求输入所述第二模型,得到与所述k个历史搜索请求相关联的候选兴趣点,其中,所述候选兴趣点中包括目的兴趣点。6.根据权利要求5所述的方法,还包括:将所述k个历史搜索请求及所述候选兴趣点作为第四模型的训练样本,对所述第四模型进行训练,得到训练后的第五模型。7.根据权利要求6所述的方法,其中,所述将所述k个历史搜索请求及所述候选兴趣点作为第四模型的训练样本,对所述第四模型进行训练,得到训练后的第五模型,包括:将所述k个历史搜索请求及所述候选兴趣点输入第四模型;在所述第四模型中进行所述k个历史搜索请求及所述候选兴趣点之间的语义聚合,得到语义聚合的相关性打分;在所述语义聚合的相关性打分满足预期分值的情况下结束训练,得到所述第五模型。8.一种搜索方法,包括:响应当前搜索请求,得到所述当前搜索请求中的至少一个搜索关键词;根据所述至少一个搜索关键词,得到与所述当前搜索请求相关联的多个历史搜索请求;
将所述多个历史搜索请求输入第二模型,得到搜索结果;其中,所述多个历史搜索请求中携带用于表征与所述当前搜索请求的搜索意图相关联的上下文信息;其中,所述第二模型为根据权利要求1

7训练得到的搜索模型。9.根据权利要求8所述的方法,其中,所述将所述多个历史搜索请求输入第二模型,得到搜索结果,包括:所述至少一个搜索关键词包括地图数据中兴趣点的情况下,根据所述第二模型对与所述多个历史搜索请求相关联的兴趣点进行搜索,得到候选兴趣点,其中,所述候选兴趣点中包括目的兴趣点;将所述候选兴趣点作为所述搜索结果。10.根据权利要求9所述的方法,还包括:对所述候选兴趣点进行排序,得到排序在前的所述目的兴趣点;以文本标识模式或语音播报模式反馈所述目的兴趣点。11.一种基于上下文的模型训练装置,包括:第一处理模块,用于根据当前搜索请求及n个历史搜索请求,得到用于表征搜索意图的上下文信息,n为大于1的正整数;第二处理模块,用于根据所述上下文信息,得到与所述当前搜索请求相关联的k个历史搜索请求...

【专利技术属性】
技术研发人员:康张琦卓安
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1