用于推荐内容的方法和装置制造方法及图纸

技术编号:38885991 阅读:17 留言:0更新日期:2023-09-22 14:13
本申请涉及用于推荐内容的方法和装置。一种用于推荐内容的方法,包括:由教师网络侧和学生网络侧接收数据样本,其中数据样本包括内容特征向量和用户特征向量;在学生网络侧,利用召回模型对数据样本进行处理以得到项目向量和多个目标向量,合并所述多个目标向量以得到用户向量,并利用项目向量和用户向量得到预测概率;在教师网络侧,利用精排模型对数据样本进行处理以针对多个目标中的每一个得到对应的参考概率,所述多个目标对应于所述多个目标向量;根据每一个参考概率和预测概率获得相应的损失函数;基于获得的损失函数调整用户向量;利用项目向量和调整后的用户向量在学生网络侧得到输出概率;和根据输出概率推荐内容。和根据输出概率推荐内容。和根据输出概率推荐内容。

【技术实现步骤摘要】
用于推荐内容的方法和装置


[0001]本公开涉及计算机
,特别涉及用于推荐内容的方法和装置。

技术介绍

[0002]在常规的推荐系统中,主要包括召回(Matching)和排序(Ranking)。召回用于候选生成,例如从全量的视频中快速筛选出几百个候选视频。一般而言,召回模型注重推荐结果的相关性,而精排模型注重推荐结果的个性化,从而导致这两种模型的推荐结果的一致性通常较差,使得推荐效果变差。
[0003]因此,存在对于能够兼顾个性化和相关性的推荐方法的需求。

技术实现思路

[0004]本公开提供了用于推荐内容的方法和装置。
[0005]根据本公开的第一方面,提供了一种用于推荐内容的方法,包括:由教师网络侧和学生网络侧接收数据样本,其中所述数据样本包括内容特征向量和用户特征向量;在学生网络侧,利用召回模型对所述数据样本进行处理以得到项目向量和多个目标向量,合并所述多个目标向量以得到用户向量,并利用所述项目向量和所述用户向量得到预测概率;在教师网络侧,利用精排模型对所述数据样本进行处理以针对多个目标中的每一个得到对应的参考概率,所述多个目标对应于所述多个目标向量;根据每一个参考概率和预测概率获得相应的损失函数;基于获得的损失函数调整所述用户向量;利用所述项目向量和调整后的用户向量在学生网络侧得到输出概率;和根据所述输出概率推荐内容。
[0006]根据本公开的第二方面,提供了一种用于推荐内容的装置,包括:存储器,其上存储有指令;和处理器,被配置为基于所述存储器上存储的指令,执行根据本公开所述的方法。
[0007]根据本公开的第三方面,提供了一种记录介质,其上存储有计算机可执行指令,所述计算机可执行指令在由处理器运行时,使所述处理器执行根据本公开所述的方法。
[0008]在根据本公开的方法中,所述内容特征向量和所述用户特征向量是通过对内容特征和用户特征进行特征映射而得到的。
[0009]在根据本公开的方法中,可以同时训练所述召回模型和所述精排模型。
[0010]在根据本公开的方法中,对于所述数据样本而言,例如,正样本可以是与所述多个目标中的至少一个对应的数据样本;并且负样本可以是不与所述多个目标中的任一个对应的数据样本,其中可以对所述负样本进行随机负采样。
[0011]在根据本公开的方法中,在学生网络侧,所述项目向量是利用多层深度神经网络DNN模型从所述内容特征向量得到的;并且所述多个目标向量是利用多层DNN模型针对所述多个目标从所述用户特征向量得到的,其中所述多个目标向量至少可以包括评论向量、关注向量、点赞向量、私聊向量和长停留向量中的两个或更多个。
[0012]在根据本公开的方法中,例如,所述多个目标可以基于用户的行为特征,并且所述
多个目标至少包括评论、关注、点赞、私聊和长停留中的两个或更多个。此外,所述多个目标还可以是例如基于用户的背景资料等,所述多个目标取决于推荐内容的目的,此处仅为例示而非限制。
[0013]在根据本公开的方法中,多层DNN模型可以包括双塔DNN模型。
[0014]在根据本公开的方法中,所述合并可以包括利用可学习的第一参数组对所述多个目标向量执行合并,以得到所述用户向量。
[0015]在根据本公开的方法中,针对所述多个目标中的每一个,利用在学生网络侧得到的相应预测概率和在教师网络侧得到的对应目标的参考概率,得到相应的损失函数,从而调整可学习的第一参数组中的相应参数。
[0016]在根据本公开的方法中,所述损失函数可以包括关于召回模型的损失函数L1、关于精排模型的损失函数L
teacher
和关于学生网络的损失函数L
student
;并且可以利用可学习的第二参数组对所述损失函数中的每一项进行加权。在本文中,所述损失函数可以被表示为L=α1×
L1+α2×
L
teacher
+α3×
L
student

[0017]在根据本公开的方法中,所述L
teacher
可以包括在教师网络侧针对所述多个目标中的每一个的子项损失函数,并且在所述L
teacher
中可以进一步利用第三参数组对各子项损失函数进行加权。
[0018]在根据本公开的方法中,所述L
student
可以利用Kullback

Leibler散度损失函数KL Loss根据参考概率和预测概率来获得,并且所述L
student
进一步可以针对所述多个目标向量中的每一个。
[0019]在根据本公开的方法中,可以利用单层DNN模型对所述项目向量和所述用户向量的点乘结果进行映射处理。在本文中,映射处理后的结果可以是概率。
[0020]通过以下参照附图对本公开的示例性实施例的详细描述,本技术的其他特征及其优点将会变得更为清楚。
附图说明
[0021]构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本技术的原理。
[0022]参照附图,根据下面的详细描述,可以更加清楚地理解本技术,其中:
[0023]图1示出了根据本公开的一个示例性实施例的知识蒸馏的示意性图。
[0024]图2示出了根据本公开的一个示例性实施例的内容推荐方法的流程图。
[0025]图3示出了可以实现根据本公开的实施例的计算设备的示例性配置。
具体实施方式
[0026]下面将参考附图来详细描述本技术的优选的实施例。不是本技术必需的细节和功能被省略,以便不会混淆本技术的理解。
[0027]以下对至少一个示例性实施例的描述实际上仅是说明性的,而不作为对本公开及其应用或使用的任何限制。
[0028]注意,类似的参考数字和字母指的是图中的类似的项目,因而一旦在一幅图中定义了一个项目,就不需要在之后的图中讨论了。
[0029]注意,就附图标记而言,对于同一类型的个体应用相同的数字,并通过字母来区分各个个体,如图1所示的103A和103B那样。另外,在本说明书中,在没有区分各个个体的特殊需要的情况下,将不记载附图标记的字母。
[0030]在本说明书中,术语“第一”、“第二”等仅被用来在元素或步骤之间进行区分,而并不意图表示时间顺序、优先级或重要性。
[0031]图1示出了根据本公开的一个示例性实施例的知识蒸馏的示意性图。
[0032]在常规的推荐系统中,可以包括例如召回、粗排、精排和重排。在召回阶段,例如可以根据用户的兴趣和历史行为,从海量的物品库里,快速找回一小部分用户潜在感兴趣的物品。而在精排阶段,例如使用可以想到的任何特征,利用复杂模型,尽量精准地对物品进行个性化排序。
[0033]根据本技术,可以将知识蒸馏方法用于推荐内容,一般而言,知识蒸馏采取教师

学生(teacher

student)模式。针对本技术,在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于推荐内容的方法,包括:由教师网络侧和学生网络侧接收数据样本,其中所述数据样本包括内容特征向量和用户特征向量;在学生网络侧,利用召回模型对所述数据样本进行处理以得到项目向量和多个目标向量,合并所述多个目标向量以得到用户向量,并利用所述项目向量和所述用户向量得到预测概率;在教师网络侧,利用精排模型对所述数据样本进行处理以针对多个目标中的每一个得到对应的参考概率,所述多个目标对应于所述多个目标向量;根据每一个参考概率和预测概率获得相应的损失函数;基于获得的损失函数调整所述用户向量;利用所述项目向量和调整后的用户向量在学生网络侧得到输出概率;和根据所述输出概率推荐内容。2.根据权利要求1所述的方法,其中,在学生网络侧,所述项目向量是利用多层深度神经网络DNN模型从所述内容特征向量得到的;并且所述多个目标向量是利用多层DNN模型针对所述多个目标从所述用户特征向量得到的,其中所述多个目标向量至少包括评论向量、关注向量、点赞向量、私聊向量和长停留向量中的两个或更多个。3.根据权利要求1和2中任一项所述的方法,其中所述多个目标基于用户的行为特征,并且所述多个目标至少包括评论、关注、点赞、私聊和长停留中的两个或更多个。4.根据权利要求1所述的方法,其中,所述合并包括利用可学习的第一参数组对所述多个目标向量执行合并,以得到所述用户向量。5.根据权利要求4所述的方法,其中针对所述多个目标中的每一个,利用在学生网络侧得到的相应预测概...

【专利技术属性】
技术研发人员:顾茂杰张璐陶明
申请(专利权)人:上海任意门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1