提升推荐系统近线召回能力的方法、装置、设备及介质制造方法及图纸

技术编号:38406519 阅读:10 留言:0更新日期:2023-08-07 11:15
本发明专利技术涉及一种提升推荐系统近线召回能力的方法、装置、设备及介质,所述方法包括响应资源获取请求,采用相应的预设策略进行资源召回;分别通过预构建的展现率DNN模型和点击率DNN模型萃取各资源的展现率得分和点击率得分;利用双塔结构模型对各资源的展现率得分和点击率得分进行线性加权,得到目标函数;根据目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选,得到资源候选集。本发明专利技术在展现率DNN模型和点击率DNN模型的基础上,新增展现且兼顾点击为优化目标函数的双塔结构模型,使得近线召回除了能够缓存和召回其他队列的中间结果外,还能够主动从全库资源中捞取异于在线队列召回结果的优质资源,以开阔近线召回内容候选集的视野范围。回内容候选集的视野范围。回内容候选集的视野范围。

【技术实现步骤摘要】
提升推荐系统近线召回能力的方法、装置、设备及介质


[0001]本专利技术属于推荐系统
,具体涉及一种提升推荐系统近线召回能力的方法、装置、设备及介质。

技术介绍

[0002]个性化推荐系统在面临海量资源的推荐分发时,通常将系统架构设计为召回层、排序层、重排层的三级级联结构,通过逐级层层筛选,实现在毫秒级时间内从千万量级内容库中为用户推荐出感兴趣的资源。对于召回层而言,一般采用多路召回来提升多样性,包括热点召回、兴趣召回、协同召回、探索召回、近线召回等。
[0003]其中,近线召回所采用的近线(nearline)计算是处于在线、离线计算之间的一种折衷的计算模式。它有如下优点:对比在线计算:因为时延约束,在线计算使用的模型一般比较简单,如果提升模型复杂度则需要耗费较多计算资源。而近线计算不要求对请求立刻做计算,而是将结果预先缓存起来,后续直接使用。对比离线计算:用户行为千变万化,离线计算不能很及时的响应行为带来的特征变动,而近线计算能较快速的响应这种情况。
[0004]相关技术中,推荐系统普遍将近线计算用于召回模块,并形成了一个分支——近线召回。近线召回可以预先计算召回结果,并将召回结果缓存,作为多路召回中的一路,供在线推理服务直接使用。目前推荐系统中所采用的近线召回,主要通过缓存其他在线召回队列的中间结果进行二次召回,虽然有效提升了召回系统整体的效率,但是召回视野受限,无法主动从全库资源中捞取异于在线队列召回结果的优质资源,无法充分发挥出近线召回的能力。

技术实现思路

[0005]有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种提升推荐系统近线召回能力的方法、装置、设备及介质,以解决现有技术推荐系统无法充分发挥出近线召回的能力的问题。
[0006]为实现以上目的,本专利技术采用如下技术方案:一种提升推荐系统近线召回能力的方法,包括:
[0007]响应资源获取请求,结合资源属性采用相应的预设策略进行资源召回;
[0008]分别通过预构建的展现率DNN模型和点击率DNN模型萃取各资源的展现率得分和点击率得分;
[0009]利用预构建的双塔结构模型对所述展现率得分和点击率得分进行线性加权,得到目标函数;其中,所述双塔结构模型包括用户塔和资源塔;
[0010]根据所述目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选,得到资源候选集。
[0011]进一步的,所述用户塔包括用户特征,所述用户特征包括用户ID、手机信息、地域、年龄及历史行为序列;
[0012]所述资源塔包括资源特征,所述资源特征包括资源关键字、资源类别、资源来源及资源内容特征。
[0013]进一步的,采用以下方式对所述展现率得分和点击率得分进行线性加权,得到目标函数,
[0014]label=w
·
q
show
+(1

w)q
click
[0015]其中,label为目标函数;w为线性加权的权重值,介于0~1之间;q
show
为展现率得分;q
click
为点击率得分。
[0016]进一步的,根据所述目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选,得到资源候选集,包括:
[0017]利用所述双塔结构模型根据所述目标函数从全库资源中筛选用户感兴趣的资源,利用所述感兴趣的资源补充在线队列召回结果中所缓存的资源,得到资源候选集。
[0018]进一步的,所述展现率DNN模型和点击率DNN模型每小时训练更新一次。
[0019]进一步的,所述展现率DNN模型用于对资源展现的可能性进行评估,所述点击率DNN模型用于计算资源被用户选择点击的概率;
[0020]所述展现率DNN模型和点击率DNN模型均采用DNN网络模型。
[0021]进一步的,所述用户塔与所述资源塔之间的参数不共享。
[0022]本申请实施例提供一种提升推荐系统近线召回能力的装置,包括:
[0023]响应模块,用于响应资源获取请求,结合资源属性采用相应的预设策略进行资源召回;
[0024]萃取模块,用于分别通过预构建的展现率DNN模型和点击率DNN模型萃取各资源的展现率得分和点击率得分;
[0025]加权模块,用于利用预构建的双塔结构模型对所述的展现率得分和点击率得分进行线性加权,得到目标函数;其中,所述双塔结构模型包括用户塔和资源塔;
[0026]筛选模块,用于根据所述目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选,得到资源候选集。
[0027]本申请实施例提供一种计算机设备,包括:存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述任一项提升推荐系统近线召回能力的方法的步骤。
[0028]本申请实施例还提供一种计算机存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述任一项提升推荐系统近线召回能力的方法的步骤。
[0029]本专利技术采用以上技术方案,能够达到的有益效果包括:
[0030]本专利技术在展现率DNN模型和点击率DNN模型的基础上,新增以展现且兼顾点击为优化目标函数的双塔结构模型,使得近线召回除了能够缓存和召回其他队列的中间结果外,还能够主动从全库资源中捞取异于在线队列召回结果的优质资源,以开阔近线召回内容候选集的视野范围。
附图说明
[0031]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1为本专利技术提升推荐系统近线召回能力的方法的步骤示意图;
[0033]图2为本专利技术提升推荐系统近线召回能力的方法的流程示意图;
[0034]图3为本专利技术提升推荐系统近线召回能力的装置的结构示意图;
[0035]图4为本专利技术提升推荐系统近线召回能力的方法涉及的计算机设备的结构示意图。
具体实施方式
[0036]为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。
[0037]近线召回,主要原理是通过缓存其他在线召回队列没有及时推送出去的中间结果进行二次召回,这就决定了被缓存的中间结果往往不是其他召回队列的头部最优结果,从而使得近线召回的结果在排序层和重排层的级联筛选漏斗中,经常竞争不过其他召回队列的结果。
[0038]为了解决近线召回这种在结果筛选竞争中处于弱势地位的问题,现有技术中通常在近线召回队本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提升推荐系统近线召回能力的方法,其特征在于,包括:响应资源获取请求,结合资源属性采用相应的预设策略进行资源召回;分别通过预构建的展现率DNN模型和点击率DNN模型萃取各资源的展现率得分和点击率得分;利用预构建的双塔结构模型对所述展现率得分和点击率得分进行线性加权,得到目标函数;其中,所述双塔结构模型包括用户塔和资源塔;根据所述目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选,得到资源候选集。2.根据权利要求1所述的方法,其特征在于,所述用户塔包括用户特征,所述用户特征包括用户ID、手机信息、地域、年龄及历史行为序列;所述资源塔包括资源特征,所述资源特征包括资源关键字、资源类别、资源来源及资源内容特征。3.根据权利要求1或2所述的方法,其特征在于,采用以下方式对所述展现率得分和点击率得分进行线性加权,得到目标函数,label=w
·
q
show
+(1

w)q
click
其中,label为目标函数;w为线性加权的权重值,介于0~1之间;q
show
为展现率得分;q
click
为点击率得分。4.根据权利要求1所述的方法,其特征在于,根据所述目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选,得到资源候选集,包括:利用所述双塔结构模型根据所述目标函数从全库资源中筛选用户感兴趣的资源,利用所述感兴趣的资源补...

【专利技术属性】
技术研发人员:于满泉莫倩王升蔡锦森张传文贾承斌朱若曦
申请(专利权)人:网智天元科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1