资源召回及模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38893656 阅读:21 留言:0更新日期:2023-09-22 14:16
本公开提供了一种资源召回及模型训练方法、装置、电子设备及存储介质,涉及资源检索与召回、人工智能等技术领域。具体实现方案包括:基于历史行为信息,获取用户点击过的触发资源的特征以及所述用户点击所述触发资源的点击信号强度特征;基于所述触发资源的特征和资源库中各资源的特征、以及所述用户点击所述触发资源的点击信号强度特征,采用预先训练的资源召回模型,从所述资源库中为所述用户召回目标资源。本公开,能够有效地提高资源召回的准确性和资源召回效率。性和资源召回效率。性和资源召回效率。

【技术实现步骤摘要】
资源召回及模型训练方法、装置、电子设备及存储介质


[0001]本公开涉及计算机
,具体涉及资源检索与召回、人工智能等
,尤其涉及一种资源召回及模型训练方法、装置、电子设备及存储介质。

技术介绍

[0002]当前的信息流推荐系统中,主要分为召回和排序两个阶段。项目协作筛选(Item Collaborative Filtering;ICF)召回是一种非常高效且成熟的召回方式。
[0003]现有的ICF召回中,构建用户与资源的图模型,通过训练,得到资源的嵌入(embeding)向量,即资源的特征。然后资源两两之间用向量计算余弦(cos)相似度,余弦相似度的值越大,说明两个资源越相似。在线召回流程为:先获取用户点击过的资源的特征;然后计算该资源的特征和待索引的资源库中的各资源的特征之间的余弦相似度。并按照余弦相似度从高到底的顺序排列,取相似度最高的多条资源,进行召回。

技术实现思路

[0004]本公开提供了一种资源召回及模型训练方法、装置、电子设备及存储介质。
[0005]根据本公开的一方面,提供了一种资源召本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种资源召回方法,包括:基于历史行为信息,获取用户点击过的触发资源的特征以及所述用户点击所述触发资源的点击信号强度特征;基于所述触发资源的特征和资源库中各资源的特征、以及所述用户点击所述触发资源的点击信号强度特征,采用预先训练的资源召回模型,从所述资源库中为所述用户召回目标资源。2.根据权利要求1所述的方法,其中,所述触发资源为当前时刻之前,所述用户最新点击的预设数量的资源。3.根据权利要求1所述的方法,其中,基于历史行为信息,获取用户点击过的触发资源的特征以及所述用户点击所述触发资源的点击信号强度特征,包括:基于所述历史行为信息,获取所述用户点击过的所述触发资源的信息;基于所述触发资源的信息,获取所述触发资源的特征;基于所述历史行为信息,获取所述用户与所述触发资源的互动特征、以及预设属性特征。4.根据权利要求3所述的方法,其中,所述用户与所述触发资源的互动特征包括互动动作特征和/或互动时间特征;所述预设属性特征包括:所述触发资源的内容类型、和/或所述用户点击所述触发资源的时刻与当前时刻的间隔时长。5.根据权利要求4所述的方法,其中,所述用户与所述触发资源的互动动作特征,包括:所述用户是否点赞所述触发资源、所述用户是否评论所述触发资源、所述用户是否收藏所述触发资源、所述用户是否关注所述触发资源的作者、所述用户是否转发所述触发资源、所述用户是否打赏所述触发资源的作者、所述用户是否发弹幕、所述用户针对所述触发资源是否做正向评论、所述用户针对所述触发资源是否做负向评论、所述用户针对所述触发资源是否做正向弹幕、所述用户针对所述触发资源是否做负向弹幕、所述用户是否进所述触发资源的作者主页、所述用户是否点击不喜欢标签、以及所述用户是否取关所述触发资源的作者中至少一个。6.根据权利要求4所述的方法,其中,所述用户与所述触发资源的互动时间特征,包括:所述用户浏览所述触发资源的时长、所述用户是否浏览完所述触发资源、以及所述用户是否分别在多个预设时长中的各预设时长内划走所述触发资源中的至少一个。7.根据权利要求1

6任一所述的方法,其中,基于所述触发资源的特征和资源库中各资源的特征、以及所述用户点击所述触发资源的点击信号强度特征,采用预先训练的资源召回模型,从所述资源库中为所述用户召回目标资源,包括:基于所述触发资源的特征和所述资源库中各资源的特征,计算所述触发资源与各所述资源的特征相似度;基于所述触发资源与所述资源库中各所述资源的特征相似度、所述用户点击所述触发资源的点击信号强度特征,采用所述资源召回模型,从所述资源库中为所述用户召回所述目标资源。8.根据权利要求7所述的方法,其中,基于所述触发资源与所述资源库中各所述资源的特征相似度、所述用户点击所述触发资源的点击信号强度特征,采用预先训练的资源召回
模型,从所述资源库中为所述用户召回目标资源,包括:对于所述资源库中各所述资源,将所述触发资源与对应的所述资源的特征相似度以及所述用户点击所述触发资源的点击信号强度特征拼接,得到拼接特征;对于所述资源库中各所述资源,将对应的所述拼接特征输入至所述资源召回模型;并获取所述资源召回模型基于所述拼接特征预测的所述资源与所述触发资源的推荐相关度;基于所述资源库中各所述资源与所述触发资源的推荐相关度,从所述资源库中为所述用户召回所述目标资源。9.根据权利要求1

6任一所述的方法,其中,基于所述触发资源的特征和资源库中各资源的特征、以及所述用户点击所述触发资源的点击信号强度特征,采用预先训练的资源召回模型,从所述资源库中为所述用户召回预设数量的目标资源,包括:对于所述资源库中的各所述资源,将对应的所述资源的特征、所述触发资源的特征、以及所述用户点击所述触发资源的点击信号强度特征,输入至所述资源召回模型中;对于所述资源库中的各所述资源,获取所述资源召回模型基于输入的信息,预测的所述资源与所述触发资源的推荐相关度;基于所述资源库中各所述资源与所述触发资源的推荐相关度,从所述资源库中为所述用户召回所述目标资源。10.一种资源召回模型的训练方法,包括:获取训练样本中训练用户点击过的触发资源的特征、所述训练用户点击所述触发资源的点击信号强度特征以及推荐资源的特征;基于所述触发资源的特征、所述训练用户点击所述触发资源的点击信号强度特征以及所述推荐资源的特征,采用所述资源召回模型,预测所述推荐资源与所述触发资源的预测推荐相关度;基于所述训练样本中的所述推荐资源与所述触发资源的真实推荐相关度、以及所述预测推荐相关度,对所述资源召回模型进行参数调整。11.根据权利要求10所述的方法,其中,基于所述触发资源的特征、所述训练用户点击所述触发资源的点击信号强度特征以及所述推荐资源的特征,采用所述资源召回模型,预测所述推荐资源与所述触发资源的预测推荐相关度,包括:基于所述触发资源的特征和所述推荐资源的特征,计算所述触发资源与所述推荐资源的特征相似度;将所述触发资源与所述推荐资源的特征相似度以及所述训练用户点击所述触发资源的点击信号强度特征进行拼接,得到拼接特征;将对应的所述拼接特征输入至所述资源召回模型;并获取所述资源召回模型基于所述拼接特征预测的所述推荐资源与所述触发资源的预测推荐相关度。12.根据权利要求10所述的方法,其中,基于所述触发资源的特征、所述训练用户点击所述触发资源的点击信号强度特征以及所述推荐资源的特征,采用所述资源召回模型,预测所述推荐资源与所述触发资源的预测推荐相关度,包括:将所述触发资源的特征、所述训练用户点击所述触发资源的点击信号强度特征以及所述推荐资源的特征,输入至所述资源召回模型中;获取所述资源召回模型基于输入的信息,预测的所述推荐资源与所述触发资源的预测
推荐相关度。13.根据权利要求10所述的方法,其中,基于所述训练样本中的所述推荐资源与所述触发资源的真实推荐相关度、以及所述预测推荐相关度,对所述资源召回模型进行参数调整,包括:基于所述训练样本中的所述推荐资源与所述触发资源的真实推荐相关度,构建损失函数;基于所述损失函数,对所述资源召回模型的参数进行调整,使得所述损失函数收敛。14.根据权利要求10

13任一所述的方法,其中,获取训练样本中训练用户点击过的触发资源的特征、所述训练用户点击所述触发资源的点击信号强度特征以及推荐资源的特征之前,所述方法还包括:基于历史行为信息,构建所述训练样本;所述训练样本中包括所述训练用户点击过的所述触发资源的特征以及所述训练用户点击所述触发资源的点击信号强度特征、所述推荐资源的特征、以及所述推荐资源与所述触发资源的真实推荐相关度;其中,若所述推荐资源为所述历史行为信息中所述训练用户点击所述触发资源之后点击的资源时,所述训练样本为正样本,所述推荐资源与所述触发资源的真实推荐相关度最大;若所述推荐资源为所述历史行为信息中所述训练用户点击所述触发资源之后未点击...

【专利技术属性】
技术研发人员:肖涛李善涛
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1