模型训练的方法及装置制造方法及图纸

技术编号:25989341 阅读:16 留言:0更新日期:2020-10-20 18:57
本说明书公开了一种模型训练的方法及装置,由于在对排序模型进行训练的过程中,可以将各排序位置对应的位置影响参数加入到模型训练过程中,这使得训练后的排序模型所输出的排序结果不仅考虑了各搜索结果与用户需要搜索的搜索对象之间的相关性,还考虑了各排序位置对搜索结果所带来的影响,从而有效的提高了排序模型所输出的排序结果的准确性,同时还提高了用户的搜索体验。

【技术实现步骤摘要】
模型训练的方法及装置
本说明书涉及搜索
,尤其涉及一种模型训练的方法及装置。
技术介绍
目前,用户可以根据实际需求,在终端或是安装于终端的应用(Application,App)中输入搜索关键词,以搜索出想要的搜索结果。而为了提高用户的体验,通常情况下,服务器需要将搜索出的搜索结果按照与该搜索关键词之间的相关度来进行排序,并将得到的排序结果返回给终端,以在用户的终端上以一定的排序样式予以显示。然而在实际应用中,用户是否会对某一搜索结果进行查看,除了与该搜索结果的相关性有关以外,通常还会与该搜索结果在搜索结果页中所处的排序位置有关。排序位置所带来的影响在多列排序样式的排序结果中尤为显著。所以,如何能够向用户提供更为准确、合理的排序结果,则是一个亟待解决的问题。
技术实现思路
本说明书提供一种模型训练的方法及装置,以部分的解决现有技术存在的上述问题。本说明书采用下述技术方案:本说明书提供了一种模型训练的方法,包括:获取各用户发送的各搜索请求;针对所述各搜索请求中包含的每个搜索对象,确定针对该搜索对象的搜索结果;通过预设的排序模型,对该搜索对象的搜索结果按照多列排序样式进行排序,并将得到的排序结果作为基准排序结果;将所述基准排序结果中搜索结果的排序位置进行调整,得到至少一个对照排序结果;获取各用户针对所述基准排序结果中搜索结果的浏览情况,作为所述基准排序结果的浏览情况,以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况,作为所述至少一个对照排序结果的浏览情况;根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况,确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数;根据所述位置影响参数,对所述排序模型进行训练。可选地,将所述基准排序结果中搜索结果的排序位置进行调整,得到至少一个对照排序结果,包括:将发送针对该搜索对象的搜索请求的各用户,作为各目标用户;将所述各目标用户进行分组,得到基准用户组以及至少一个用户对照组;针对每个用户对照组,确定该用户对照组在针对该搜索对象的排序结果中所对应的排序位置对;将所述基准排序结果中位于所述排序位置对的搜索结果进行位置交换,得到该用户对照组对应的对照排序结果。可选地,获取各用户针对所述基准排序结果中搜索结果的浏览情况,作为所述基准排序结果的浏览情况,以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况,作为所述至少一个对照排序结果的浏览情况,包括:从所述基准用户组中包含的各用户的浏览日志,获取所述基准用户组针对所述基准排序结果的浏览情况,以及从所述至少一个用户对照组中包含的各用户的浏览日志,获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况。可选地,从所述基准用户组中包含的各用户的浏览日志,获取所述基准用户组针对所述基准排序结果的浏览情况,以及从所述至少一个用户对照组中包含的各用户的浏览日志,获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况,包括:针对用户所使用的终端的每种屏幕规格,将所述基准用户组中使用该屏幕规格的终端的用户归为所述基准用户组在该屏幕规格下所对应的子基准用户组,以及针对每个用户对照组,将该用户对照组中使用该屏幕规格的终端的用户归为该用户对照组在该屏幕规格下所对应的子用户对照组;从所述子基准用户组中包含的各用户的浏览日志,获取所述子基准用户组针对所述基准排序结果的浏览情况,以及从所述子用户对照组中包含的各用户的浏览日志,获取所述子用户对照组针对所述子用户对照组对应的对照排序结果的浏览情况。可选地,根据所述基准排序结果对应的浏览情况以及所述至少一个对照排序结果对应的浏览情况,确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数,包括:根据获取到的所述子基准用户组针对所述基准排序结果的浏览情况,以及获取到的所述子用户对照组针对所述子用户对照组对应的对照排序结果的浏览情况,确定在该屏幕规格下针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数。可选地,根据所述位置影响参数,对所述排序模型进行训练,包括:针对该搜索对象的排序结果中每个排序位置,根据该排序位置对应的位置影响参数,确定该排序位置对应的相关性评价参数;针对该搜索对象的排序结果中每个排序位置对应的相关性评价参数,对所述排序模型进行训练。可选地,所述相关性评价参数包括:归一化折损累计增益NDCG;根据该排序位置对应的位置影响参数,确定该排序位置对应的相关性评价参数,包括:根据该排序位置对应的位置影响参数,确定在该排序位置对应的位置影响参数下的折损累计增益DCG,以及确定在该排序位置对应的位置影响参数下的理想折损累计增益IDCG;根据所述DCG以及所述IDCG,确定该排序位置对应的归一化折损累计增益NDCG。本说明书提供了一种模型训练的装置,包括:第一获取模块,用于获取各用户发送的各搜索请求;确定模块,用于针对所述各搜索请求中包含的每个搜索对象,确定针对该搜索对象的搜索结果;排序模块,用于通过预设的排序模型,对该搜索对象的各搜索结果按照多列排序样式进行排序,并将得到的排序结果作为基准排序结果;调整模块,用于将所述基准排序结果中搜索结果的排序位置进行调整,得到至少一个对照排序结果;第二获取模块,用于获取各用户针对所述基准排序结果中搜索结果的浏览情况,作为所述基准排序结果的浏览情况,以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况,作为所述至少一个对照排序结果的浏览情况;参数确定模块,用于根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况,确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数;训练模块,用于根据所述位置影响参数,对所述排序模型进行训练。本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。本说明书采用的上述至少一个技术方案能够达到以下有益效果:在本说明书提供的模型训练的方法中,可以获取各用户发送的各搜索请求,针对各搜索请求中包含的每个搜索对象,确定针对该搜索对象的搜索结果,通预设的排序模型,对该搜索对象的搜索结果进行排序,并将得到的排序结果作为基准排序结果,将该基准排序结果中搜索结果的排序位置进行调整,得到至少一个对照排序结果,获取各用户针对该基准排序结果中搜索结果的浏览情况,作为该基准排序结果的浏览情况,以及获取各用户针对至少一个对照排序结果中搜索结果的浏览情况,作为至少一个对照排序结构的浏览情况,根据该基准排序结构的浏览请求以及至少一个对照排序结果的浏本文档来自技高网...

【技术保护点】
1.一种模型训练的方法,其特征在于,包括:/n获取各用户发送的各搜索请求;/n针对所述各搜索请求中包含的每个搜索对象,确定针对该搜索对象的搜索结果;/n通过预设的排序模型,对该搜索对象的搜索结果按照多列排序样式进行排序,并将得到的排序结果作为基准排序结果;/n将所述基准排序结果中搜索结果的排序位置进行调整,得到至少一个对照排序结果;/n获取各用户针对所述基准排序结果中搜索结果的浏览情况,作为所述基准排序结果的浏览情况,以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况,作为所述至少一个对照排序结果的浏览情况;/n根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况,确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数;/n根据所述位置影响参数,对所述排序模型进行训练。/n

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:
获取各用户发送的各搜索请求;
针对所述各搜索请求中包含的每个搜索对象,确定针对该搜索对象的搜索结果;
通过预设的排序模型,对该搜索对象的搜索结果按照多列排序样式进行排序,并将得到的排序结果作为基准排序结果;
将所述基准排序结果中搜索结果的排序位置进行调整,得到至少一个对照排序结果;
获取各用户针对所述基准排序结果中搜索结果的浏览情况,作为所述基准排序结果的浏览情况,以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况,作为所述至少一个对照排序结果的浏览情况;
根据所述基准排序结果的浏览情况以及所述至少一个对照排序结果的浏览情况,确定针对该搜索对象的排序结果中每个排序位置所对应的位置影响参数;
根据所述位置影响参数,对所述排序模型进行训练。


2.如权利要求1所述的方法,其特征在于,将所述基准排序结果中搜索结果的排序位置进行调整,得到至少一个对照排序结果,包括:
将发送针对该搜索对象的搜索请求的各用户,作为各目标用户;
将所述各目标用户进行分组,得到基准用户组以及至少一个用户对照组;
针对每个用户对照组,确定该用户对照组在针对该搜索对象的排序结果中所对应的排序位置对;
将所述基准排序结果中位于所述排序位置对的搜索结果进行位置交换,得到该用户对照组对应的对照排序结果。


3.如权利要求2所述的方法,其特征在于,获取各用户针对所述基准排序结果中搜索结果的浏览情况,作为所述基准排序结果的浏览情况,以及获取各用户针对所述至少一个对照排序结果中搜索结果的浏览情况,作为所述至少一个对照排序结果的浏览情况,包括:
从所述基准用户组中包含的各用户的浏览日志,获取所述基准用户组针对所述基准排序结果的浏览情况,以及从所述至少一个用户对照组中包含的各用户的浏览日志,获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况。


4.如权利要求3所述的方法,其特征在于,从所述基准用户组中包含的各用户的浏览日志,获取所述基准用户组针对所述基准排序结果的浏览情况,以及从所述至少一个用户对照组中包含的各用户的浏览日志,获取所述至少一个用户对照组针对所述至少一个对照排序结果的浏览情况,包括:
针对用户所使用的终端的每种屏幕规格,将所述基准用户组中使用该屏幕规格的终端的用户归为所述基准用户组在该屏幕规格下所对应的子基准用户组,以及针对每个用户对照组,将该用户对照组中使用该屏幕规格的终端的用户归为该用户对照组在该屏幕规格下所对应的子用户对照组;
从所述子基准用户组中包含的各用户的浏览日志,获取所述子基准用户组针对所述基准排序结果的浏览情况,以及从所述子用户对照组中包含的各用户的浏览日志,获取所述子用户对照组针对所述子用户对照组对应的对照排序结果的...

【专利技术属性】
技术研发人员:郭圣昱杨一帆李悦
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1