【技术实现步骤摘要】
模型的训练方法、物料的召回方法及装置
[0001]本申请涉及信息召回领域,尤其涉及一种模型的训练方法、物料的召回方法及装置。
技术介绍
[0002]在社交场景中,个性化推荐系统负责将各个博主的微博博文(即物料)以消息推送的形式推送给感兴趣的用户,让用户及时获取感兴趣的信息。而个性化推荐系统包括召回模块,召回模块应用多种召回算法从百万级候选博文库中筛选出千级用户可能感兴趣的博文,组成召回博文库。由于用户协同过滤算法能够通过用户历史行为计算用户的相似度,为用户推荐相似用户喜欢的物料,因此,用户协同过滤算法已经被广泛应用于各类个性化推荐系统的召回模块中。
[0003]在相关技术中,用户协同过滤算法的计算步骤为:基于用户标识(identity,ID)和物料ID构造行为矩阵,然后将该行为矩阵分解为表示用户兴趣偏好的用户矩阵和表示物料属性的物料矩阵,在此种情况下,每个用户的兴趣偏好可以用用户矩阵中与该用户对应的向量进行表示,接着,基于各个用户对应的向量,对用户进行分组,最后统计同一组用户喜欢的物料,为同一组未分发过此物料的其他用 ...
【技术保护点】
【技术特征摘要】
1.一种模型的训练方法,其特征在于,包括:获取在第一预设时间内与目标用户对应的多个用户特征集,以及在所述第一预设时间内用户点击过的物料组成的物料集,其中,所述用户特征集为所述目标用户在每次点击物料时对应的用户特征的集合;基于所述用户特征集,确定与所述用户特征集对应的特征向量;通过多个所述特征向量对待训练的目标模型进行迭代训练,其中,每次迭代训练将所述特征向量输入所述待训练的目标模型,获取所述待训练的目标模型输出的与所述目标用户对应的兴趣偏好向量;基于所述兴趣偏好向量、以及根据所述物料集构造得到的物料向量矩阵,确定在所述第一预设时间内所述目标用户点击过的目标物料的预估点击概率;在所述预估点击概率达到目标值的情况下,得到训练完成的目标模型。2.根据权利要求1所述的训练方法,其特征在于,所述基于所述兴趣偏好向量、以及根据所述物料集构造得到的物料向量矩阵,确定在所述第一预设时间内所述目标用户点击过的目标物料的预估点击概率,包括:对所述兴趣偏好向量与目标物料向量做向量内积运算,并进行归一化处理,确定在所述第一预设时间内所述目标用户点击过的目标物料的预估点击概率,其中,所述目标物料向量为根据所述物料集构造得到的物料向量矩阵中与所述目标物料对应的向量。3.根据权利要求2所述的训练方法,其特征在于,所述对所述兴趣偏好向量与目标物料向量做向量内积运算,并进行归一化处理,确定在所述第一预设时间内所述目标用户点击过的目标物料的预估点击概率,包括:通过下述公式,确定在所述第一预设时间内所述目标用户点击过的目标物料的预估点击概率;其中,P(v
i
|u)为在所述第一预设时间内所述目标用户点击过的目标物料的预估点击概率,v
i
为所述目标物料向量,u为所述兴趣偏好向量,V为所述物料向量矩阵,v
j
为所述物料向量矩阵中的任一物料向量。4.根据权利要求1所述的训练方法,其特征在于,所述基于所述用户特征集,确定与所述用户特征集对应的特征向量,包括:分别将所述用户特征集中的多个用户特征编码为向量;通过将多个所述向量拼接,得到与所述用户特征集对应的特征向量。5.根据权利要求1所述的训练方法,其特征在于,所述用户特征集中的用户特征至少包括用户的基础信息、用户的兴趣画像以及用户的行为特征中的一个。6.一种物料的召回方法,其特征在于,包括:分别获取多个用户对应的用户特征集;基于所述用户特征集,确定与所述用户特征集对应的特征向量;分别将多个所述特征向量中的各个所述特征向量输入目标模型,获取所述目标模型输出的多个与所述用户对应的兴趣偏好向量;通过对多个所述兴趣偏好向量进行聚类,确定至少一个用户群;分别获取在第二预设时间内目标用户群中的...
【专利技术属性】
技术研发人员:张鹏涛,刘广东,韩梦凡,
申请(专利权)人:微梦创科网络科技中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。