基于深度学习的多目标视频推荐方法、装置及存储介质制造方法及图纸

技术编号：31508520 阅读：70 留言：0更新日期：2021-12-22 23:43

本发明专利技术涉及推荐系统领域，提供了一种基于深度学习的多目标视频推荐方法、装置及存储介质，解决正样本稀疏以及多个目标的视频推荐问题。主要方案包括：1)准备包含用户在目标上的交互行为的数据集；2)多任务框架的修改与设计，完成每个子任务相应的损失计算；3)对得到的每个子任务的损失函数进行动态加权优化；4)底层共享网络结构设计，得到历史交互序列的权重；5)设计权重衰减结构，对得到历史交互序列的权重进行衰减后用于申请网络的训练；6)网络中的embedding层的预热初始化；7)神经网络的训练。本发明专利技术用于视频的多目标推荐。本发明专利技术用于视频的多目标推荐。本发明专利技术用于视频的多目标推荐。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的多目标视频推荐方法、装置及存储介质

[0001]本专利技术涉及视频推荐领域。提供了一种基于深度学习的多目标视频推荐方法、装置及存储介质。

技术介绍

[0002]推荐系统是一项交互式产品功能，产品为推荐系统提供载体，用户通过使用产品触达及触发推荐系统，推荐系统为用户提供个性化的推荐，从而提升用户体验；和搜索引擎不同，推荐系统本质上是在用户需求不明确的情况下，从海量的信息中为用户寻找其感兴趣的信息的技术手段。推荐系统结合用户的信息(地域，年龄，性别等)，物品信息(价格，产地等)，以及用户过去对物品的行为(是否购买，是否点击，是否播放等)，利用机器学习技术构建用户兴趣模型，为用户提供精准的个性化推荐。
[0003]传统的推荐系统算法中经典的便是协同过滤的推荐算法，其主要分为基于用户的协同过滤和基于物品的协同过滤，基本思想根据用户之前的喜好以及其他兴趣相近的用户的选择来给用户推荐物品，基于用户的协同过滤是给用户推荐和他兴趣相似的其他用户喜欢的产品，而基于物品的协同过滤给用户推荐和他之前喜欢的物品相似的物品，但是...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的多目标视频推荐方法，其特征在于，包括以下步骤：步骤1、准备包含用户在目标上的交互行为的数据集，所述数据集包含有id特征；步骤2、多任务框架的修改与设计，通过对MMOE多任务框架中的gate层进行修改，采用attention的机制对多任务框架中专家网络的输出进行加权输出，能够得到每个任务更加清晰的特征向量，最后传入到每个子任务的tower层，完成每个子任务相应的损失计算；步骤3、对步骤2得到的每个子任务的损失函数进行动态加权优化，使得各个子任务能够以相近的速度进行学习，保证最终每个子任务都能达到最优；步骤4、底层共享网络结构设计，先通过固定大小L的滑动窗口按照交互日期为每个样本生成序列长度为L的历史交互视频id序列，将样本中待预测视频的id和历史交互视频的id序列进行attention得到历史交互序列的权重；步骤5、设计权重衰减结构，对步骤4中attention得到的历史交互序列的权重进行衰减，用于步骤7的神经网络的训练；步骤6、网络中的embedding层的预热初始化，生成初始化参数；步骤7、根据初始化参数进行神经网络的训练，得到用于预测每个用户在视频上的每个交互行为情况的可能性，根据每个交互行为情况的重要度计算得分，然后根据得分进行排序，根据排序对视频进行推荐。2.根据权利要求1所述的一种基于深度学习的多目标视频推荐方法，其特征在于，步骤2具体包括以下步骤：采用MMoE的多任务框架，多任务框架的底层部分为底层共享网络，然后底层共享网络的输出作为多个专家网络的输入(多个专家网络是为了增加模型中特征的多样性，学到的不同特征对于不同任务的影响程度不同。)，每个专家网络使用多层的全连接层，然后为每个子任务生成一个query查询向量，然后和专家网络的输出进行attention生成每个子任务的输入，最后将子任务的输入传入到每个子任务的tower层，完成每个子任务相应的损失计算，其中attention的计算放方式如下：scores＝softmax((expert
out
*W
key
)*query)tower
input
＝scores*(expert
out
*W
value
)其中expert
out
表示专家层的输出，W
key
和W
value
都是需要学习的参数，分别用于生成attention中key和value向量，query是为每个任务生成的向量，也是需要学习的参数。3.根据权利要求1所述的一种基于深度学习的多目标视频推荐方法，其特征在于，步骤3具体包括以下步骤：对步骤2中多任务框架中的顶层rower层计算的子任务loss进行加权优化，通过采用动态加权平均的方法，同时考虑不同子任务的loss情况以及训练速度，保证各个子任务能够以相近的速度进行学习，保证最终每个子任务都能达到最优，动态权重的计算方式如下：学习，保证最终每个子任务都能达到最优，动态权重的计算方式如下：
其中，w
i
(t)表示任务i在t步时权重，L
n
(t
‑
1)和r
n
(t
‑
1)分别表示任务n在t
‑
1步时的loss和训练速度，r越小，训练速度越快，N表示子任务的数量，T是一个常数。4.根据权利要求1所述的一种基于深度学习的多目标视频推荐方法，其特征在于，步骤4具体包括：步骤2中的底层共享网络部分采用DNN+Attention的结构，首先是embedding层将步骤1中的数据集中的离散的id特征映射到低维的向量空间，得到embedding向量，然后3层全连接层网络的DNN部分对embedding向量生成高阶交叉特征；Attention部分，先通过固定大小L的滑动窗口按照交互日期为每个样本生成序列长度为L的历史交互视频id序列(具体做法是根据用户id进行分组，然后每组根据样本的交互日期排序，对于每个样本选择前L个交互过的视频id生成当前样本的历史交互序列，不足的则用特殊值代替，例如所有视频的id总和+1)，然...

【专利技术属性】
技术研发人员：谢东霖，罗崇军，魏骁勇，张栩禄，杨震群，
申请(专利权)人：深圳市广联智通科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人