The embodiment of the invention provides a content recommendation method and device, wherein the method includes: combining the recent behavior of the user to be recommended, the long-term interest of the user to be recommended in the user profile to be recommended and the user characteristics of the user to be recommended as the input of the trained interest representation model, outputting the vector of the overall interest of the user to be recommended through the trained interest representation model Embedded representation. Because long-term interest is interest in historical period, and the latest behavior is the latest behavior before the current time, long-term interest is relatively stable compared with the latest behavior, and the latest behavior will become a part of long-term interest as time goes on. Therefore, considering the recent behavior of the users to be recommended, the long-term interest of the users to be recommended in the user profile to be recommended and the combination of the user characteristics of the users to be recommended can more accurately and comprehensively describe the user interest, and then based on the vector embedding representation of the whole users to be recommended, recommend the content of interest for the users to be recommended.
【技术实现步骤摘要】
一种内容推荐方法及装置
本专利技术涉及个性化推荐服务
,特别是涉及一种内容推荐方法及装置。
技术介绍
随着网络技术的发展,信息数量越来越多,用户常常面对这些信息而束手无策,因此需要通过网络区分这些信息从而为用户提供内容服务。在此背景下,个性化推荐服务(PersonalizedRecommenderServices,简称PRS)技术应运而生。PRS中的个性化推荐是内容分发的重要途径,通过描述用户兴趣,为用户推荐感兴趣的内容,从而实现内容分发。目前相关技术中内容推荐方法的主要步骤如下:第一步,基于用户user的行为项目item序列,通过词向量计算的工具word2vec技术,得到所有item的向量嵌入embedding表示作为分布式表示;第二步,将user中当前时间之前的预设时间段内的行为,称为user最近行为,取user最近行为中两个以上item的embedding表示,取加权平均或者平均,其中,embedding表示包括:观看行为的embedding表示以及搜索query行为的embedding表 ...
【技术保护点】
1.一种内容推荐方法,其特征在于,包括:/n获取待推荐用户画像及待推荐用户的最近行为,所述待推荐用户画像包括:所述待推荐用户的长期兴趣及所述待推荐用户的用户特征,所述待推荐用户的长期兴趣是指当前时间之前历史时间段内所述待推荐用户的兴趣;/n确定所述待推荐用户的最近行为中项目的向量嵌入表示;/n将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入,通过所述已训练兴趣表示模型,输出所述待推荐用户整体兴趣的向量嵌入表示,所述已训练兴趣表示模型是基于样本集训练得到的,所述样本集包括:用户行为的项目序列及用户画像,所述用户行为的项目包括:用户 ...
【技术特征摘要】 【专利技术属性】
1.一种内容推荐方法,其特征在于,包括:
获取待推荐用户画像及待推荐用户的最近行为,所述待推荐用户画像包括:所述待推荐用户的长期兴趣及所述待推荐用户的用户特征,所述待推荐用户的长期兴趣是指当前时间之前历史时间段内所述待推荐用户的兴趣;
确定所述待推荐用户的最近行为中项目的向量嵌入表示;
将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入,通过所述已训练兴趣表示模型,输出所述待推荐用户整体兴趣的向量嵌入表示,所述已训练兴趣表示模型是基于样本集训练得到的,所述样本集包括:用户行为的项目序列及用户画像,所述用户行为的项目包括:用户最近行为的项目,所述用户画像包括:用户的长期兴趣及用户的用户特征;
基于所述待推荐用户整体的向量嵌入表示,为所述待推荐用户推荐感兴趣的内容。
2.如权利要求1所述的方法,其特征在于,所述基于所述待推荐用户整体兴趣的向量嵌入表示,为所述待推荐用户推荐感兴趣的内容,包括:
根据预先构建的预推荐内容的召回索引,通过所述待推荐用户整体兴趣的向量嵌入表示,召回所述待推荐用户整体兴趣的向量嵌入表示的预推荐内容;
确定所述待推荐用户整体兴趣的向量嵌入表示与所述待推荐用户整体兴趣的向量嵌入表示的预推荐内容之间的距离;
将与所述待推荐用户整体兴趣的向量嵌入表示之间距离最小的,所述待推荐用户整体兴趣的向量嵌入表示的预推荐内容,作为感兴趣的内容;
为所述待推荐用户推荐所述感兴趣的内容。
3.如权利要求1所述的方法,其特征在于,采用如下步骤,得到所述已训练兴趣表示模型:
获取用户行为的项目序列及用户画像,得到用户的项目的向量嵌入表示;
从所述用户行为的项目序列中,确定正向样本及负向样本,所述正向样本是指用户的点击行为的项目,所述负向样本是指用户的浏览行为的项目;
通过所述正向样本,确定所述正向样本中用户最近行为及用户画像;
通过所述负向样本,确定所述负向样本中用户最近行为及用户画像;
将所述正向样本中用户最近行为及用户画像、所述负向样本中用户最近行为及用户画像,及所述用户的项目的向量嵌入表示,作为待训练兴趣表示模型的样本集;
将所述待训练兴趣表示模型的样本集作为所述待训练兴趣表示模型,通过所述待训练兴趣表示模型进行训练,得到已训练兴趣表示模型。
4.如权利要求1所述的方法,其特征在于,所述将所述待推荐用户的最近行为中项目的向量嵌入表示及所述待推荐用户画像作为已训练兴趣表示模型的输入,通过所述已训练兴趣表示模型,输出所述待推荐用户整体兴趣的向量嵌入表示,包括:
将待推荐用户的最近行为中项目的向量嵌入表示作为已训练兴趣表示模型中的已训练Transformer模型的输入,通过所述已训练Transformer模型,得到待推荐用户的最近行为的兴趣向量嵌入表示;
池化所述待推荐用户的最近行为的兴趣向量嵌入表示,得到所述待推荐用户短期兴趣的向量嵌入表示;
将所述待推荐用户短期兴趣的向量嵌入表示,所述待推荐用户画像中的待推荐用户的长期兴趣及所述待推荐用户的用户特征进行交叉融合,得到所述待推荐用户整体兴趣的向量嵌入表示。
5.如权利要求4所述的方法,其特征在于,采用如下步骤,得到所述已训练Transformer模型:
获取用户行为的项目序列及用户短期兴趣的向量嵌入表示;
通过查询项目的向量嵌入表示字典,限制所述用户行为的项目序列的长度,得到用户行为的定长项目序列的向量嵌入表示;
将所述用户行为的定长项目序列的向量嵌入表示及所述用户短期兴趣的向量嵌入表示,作为待训练Transformer模型的样本集;
将所述待训练Transformer模型的样本集作为所述待训练Transformer模型的输入,利用所述待训练Transformer模型进行训练,得到所述已训练Transformer模型。
6.如权利要求4所述的方法,其特征在于,所述将所述待推荐用户短期兴趣的向量嵌入表示,所述待推荐用户画像中的待推荐用户的长期兴趣及所述待推荐用户的用户特征进行交叉融合,得到所述待推荐用户整体兴趣的向量嵌入表示,包括:
将所述待推荐用户短期兴趣的向量嵌入表示,所述待推荐用户画像中的待推荐用户的长期兴趣及所述待推荐用户的用户特征作为已训练兴趣表示模型中的已训练交叉融合模型的输入,通过所述已训练交叉融合模型,得到所述待推荐用户整体兴趣的向量嵌入表示。
7.如权利要求6所述的方法,其特征在于,采用如下步骤,得到所述已训练交叉融合模型:
获取用户短期兴趣的向量嵌入表示及所述用户的长期兴趣;
将所述用户短期兴趣的向量嵌入表示及所述用户的长期兴趣,作为待训练交叉融合模型的样本集;
将所述待训练交叉融合模型的样本集作为所述待训练交叉融合模型的输入,利用所述待训练交叉融合模型进行训练,得到所述已训练交叉融合模型。
技术研发人员:黄腾玉,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。