提升推荐系统近线召回能力的方法、装置、设备及介质制造方法及图纸

技术编号：38406519 阅读：10 留言：0更新日期：2023-08-07 11:15

本发明专利技术涉及一种提升推荐系统近线召回能力的方法、装置、设备及介质，所述方法包括响应资源获取请求，采用相应的预设策略进行资源召回；分别通过预构建的展现率DNN模型和点击率DNN模型萃取各资源的展现率得分和点击率得分；利用双塔结构模型对各资源的展现率得分和点击率得分进行线性加权，得到目标函数；根据目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选，得到资源候选集。本发明专利技术在展现率DNN模型和点击率DNN模型的基础上，新增展现且兼顾点击为优化目标函数的双塔结构模型，使得近线召回除了能够缓存和召回其他队列的中间结果外，还能够主动从全库资源中捞取异于在线队列召回结果的优质资源，以开阔近线召回内容候选集的视野范围。回内容候选集的视野范围。回内容候选集的视野范围。

全部详细技术资料下载

【技术实现步骤摘要】
提升推荐系统近线召回能力的方法、装置、设备及介质

[0001]本专利技术属于推荐系统
，具体涉及一种提升推荐系统近线召回能力的方法、装置、设备及介质。

技术介绍

[0002]个性化推荐系统在面临海量资源的推荐分发时，通常将系统架构设计为召回层、排序层、重排层的三级级联结构，通过逐级层层筛选，实现在毫秒级时间内从千万量级内容库中为用户推荐出感兴趣的资源。对于召回层而言，一般采用多路召回来提升多样性，包括热点召回、兴趣召回、协同召回、探索召回、近线召回等。
[0003]其中，近线召回所采用的近线(nearline)计算是处于在线、离线计算之间的一种折衷的计算模式。它有如下优点：对比在线计算：因为时延约束，在线计算使用的模型一般比较简单，如果提升模型复杂度则需要耗费较多计算资源。而近线计算不要求对请求立刻做计算，而是将结果预先缓存起来，后续直接使用。对比离线计算：用户行为千变万化，离线计算不能很及时的响应行为带来的特征变动，而近线计算能较快速的响应这种情况。
[0004]相关技术中，推荐系统普遍将近线计算用于召回模块，并形成了一个分支——近线召回。近线召回可以预先计算召回结果，并将召回结果缓存，作为多路召回中的一路，供在线推理服务直接使用。目前推荐系统中所采用的近线召回，主要通过缓存其他在线召回队列的中间结果进行二次召回，虽然有效提升了召回系统整体的效率，但是召回视野受限，无法主动从全库资源中捞取异于在线队列召回结果的优质资源，无法充分发挥出近线召回的能力。

技术实现思路

[0005]...

【技术保护点】

【技术特征摘要】
1.一种提升推荐系统近线召回能力的方法，其特征在于，包括：响应资源获取请求，结合资源属性采用相应的预设策略进行资源召回；分别通过预构建的展现率DNN模型和点击率DNN模型萃取各资源的展现率得分和点击率得分；利用预构建的双塔结构模型对所述展现率得分和点击率得分进行线性加权，得到目标函数；其中，所述双塔结构模型包括用户塔和资源塔；根据所述目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选，得到资源候选集。2.根据权利要求1所述的方法，其特征在于，所述用户塔包括用户特征，所述用户特征包括用户ID、手机信息、地域、年龄及历史行为序列；所述资源塔包括资源特征，所述资源特征包括资源关键字、资源类别、资源来源及资源内容特征。3.根据权利要求1或2所述的方法，其特征在于，采用以下方式对所述展现率得分和点击率得分进行线性加权，得到目标函数，label＝w
·
q
show
+(1
‑
w)q
click
其中，label为目标函数；w为线性加权的权重值，介于0～1之间；q
show
为展现率得分；q
click
为点击率得分。4.根据权利要求1所述的方法，其特征在于，根据所述目标函数对全库资源、在线队列召回结果中所缓存的资源进行筛选，得到资源候选集，包括：利用所述双塔结构模型根据所述目标函数从全库资源中筛选用户感兴趣的资源，利用所述感兴趣的资源补...

【专利技术属性】
技术研发人员：于满泉，莫倩，王升，蔡锦森，张传文，贾承斌，朱若曦，
申请(专利权)人：网智天元科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人