媒体资源推荐方法、推荐模型的训练方法及相关设备技术

技术编号：38247244 阅读：11 留言：0更新日期：2023-07-25 18:07

本公开关于一种媒体资源推荐方法、推荐模型的训练方法及相关设备，该方法通过推荐模型，对媒体资源序列和操作反馈序列进行融合编码处理，得到初始媒体资源特征；初始媒体资源特征包括多个媒体资源子特征，每个所述媒体资源子特征包含对应的正反馈标签或负反馈标签；以及对初始媒体资源特征进行基于所述媒体资源序列对应的正反馈标签和负反馈标签相混合的编码处理，得到目标媒体资源特征；对目标媒体资源特征进行基于正反馈维度的反馈拆分处理，得到正反馈序列表征；以及基于候选资源的推荐结果确定推荐资源，从而提高了媒体资源的推荐准确率。推荐准确率。推荐准确率。

全部详细技术资料下载

【技术实现步骤摘要】
媒体资源推荐方法、推荐模型的训练方法及相关设备

[0001]本公开涉及计算机
，尤其涉及一种媒体资源推荐方法、推荐模型的训练方法及相关设备。

技术介绍

[0002]在一些推荐场景中，可以分为单列推荐形式和双列推荐形式，其中，单列推荐形式是通过用户对象被动接收推荐的媒体资源，双列推荐形式是通过用户对象主动点击感兴趣的媒体资源。
[0003]然而，相比于双列推荐形式，单列推荐形式的这种被动反馈的情况更复杂，无法较好的基于被动反馈的信息来进行媒体资源推荐，推荐的准确率较低。

技术实现思路

[0004]本公开提供一种媒体资源推荐方法、推荐模型的训练方法及相关设备，以至少解决相关技术中计算效率低下等至少一种问题。本公开的技术方案如下：
[0005]根据本公开实施例的第一方面，提供一种媒体资源推荐方法，包括：
[0006]获取对象账号的历史操作数据和候选资源；所述历史操作数据包括媒体资源序列和与所述媒体资源序列对应的操作反馈序列，所述操作反馈序列包括对象账号针对所述媒体资源序列中各媒体资源的正反馈标签和负反馈标签；
[0007]将所述历史操作数据输入推荐模型，对所述媒体资源序列和所述操作反馈序列进行融合编码处理，得到初始媒体资源特征；所述初始媒体资源特征包括多个媒体资源子特征，每个所述媒体资源子特征包含对应的正反馈标签或负反馈标签；
[0008]通过所述推荐模型，对所述初始媒体资源特征进行基于所述媒体资源序列对应的正反馈标签和负反馈标签相混合的编码处理，得到目标媒体资...

【技术保护点】

【技术特征摘要】
1.一种媒体资源推荐方法，其特征在于，包括：获取对象账号的历史操作数据和候选资源；所述历史操作数据包括媒体资源序列和与所述媒体资源序列对应的操作反馈序列，所述操作反馈序列包括对象账号针对所述媒体资源序列中各媒体资源的正反馈标签和负反馈标签；将所述历史操作数据输入推荐模型，对所述媒体资源序列和所述操作反馈序列进行融合编码处理，得到初始媒体资源特征；所述初始媒体资源特征包括多个媒体资源子特征，每个所述媒体资源子特征包含对应的正反馈标签或负反馈标签；通过所述推荐模型，对所述初始媒体资源特征进行基于所述媒体资源序列对应的正反馈标签和负反馈标签相混合的编码处理，得到目标媒体资源特征；通过所述推荐模型，对所述目标媒体资源特征进行基于正反馈维度的反馈拆分处理，得到正反馈序列表征；所述正反馈序列表征用于表征所述对象账号对所述媒体资源序列的正兴趣信息；通过所述推荐模型基于所述正反馈序列表征对所述候选资源进行预测处理，得到所述候选资源对应的推荐结果；所述推荐结果表征候选资源的推荐概率；基于所述候选资源的推荐结果确定推荐资源。2.根据权利要求1所述的方法，其特征在于，所述对所述媒体资源序列和所述操作反馈序列进行处理，得到初始媒体资源特征，包括：对所述媒体资源序列和所述操作反馈序列进行编码处理，对应得到资源嵌入表示特征和操作嵌入表示特征；基于所述媒体资源序列对应的序列顺序和所述操作反馈序列对应的序列顺序，融合所述资源嵌入表示特征和所述操作嵌入表示特征，得到所述初始媒体资源特征。3.根据权利要求1所述的方法，其特征在于，所述通过推荐模型，对所述初始媒体资源特征进行编码处理，得到目标媒体资源特征，包括：将所述初始媒体资源特征输入至所述推荐模型中序列编码层；所述序列编码层包括第一模块和第二模块；通过所述第一模块，对所述初始媒体资源特征进行线性转换处理，得到所述初始媒体资源特征中各媒体资源子特征对应的目标映射矩阵；通过所述第二模块，对所述目标映射矩阵进行多头注意力处理，得到所述目标媒体资源特征。4.根据权利要求3所述的方法，其特征在于，所述第二模块包括多头注意力层，所述多头注意力层包括第一数量的正反馈类型的注意力头和第二数量的负反馈类型的注意力头，所述第一数量和所述第二数量的和值为所述多头注意力层中多个注意力头的总数；所述对所述目标映射矩阵进行多头注意力处理，得到所述目标媒体资源特征，包括：获取多个注意力头中各个头各自对应的注意力掩码矩阵，各个所述注意力掩码矩阵是基于所述目标注意力头的反馈类型、所述多个注意力头中各个头各自对应的反馈类型、所述目标映射矩阵对应的各媒体资源子特征的反馈类型所确定；基于所述注意力掩码矩阵对所述目标映射矩阵进行多头注意力处理，得到所述目标媒体资源特征；所述目标媒体资源特征的特征维度与所述初始媒体资源特征的特征维度相同。
5.根据权利要求4所述的方法，其特征在于，所述目标映射矩阵包括多个注意力头分别对应的查询矩阵、键矩阵和值矩阵；所述基于所述注意力掩码矩阵对所述目标映射矩阵进行多头注意力处理，得到所述目标媒体资源特征，包括：针对目标注意力头的键矩阵，分别与所述多个注意力头中各个头各自对应的查询矩阵进行处理，得到所述目标注意力头的初始权重矩阵；所述目标注意力头为所述多个注意力头中任一个；基于目标注意力头的所述初始权重矩阵和各个头对应的所述注意力掩码矩阵，确定所述目标注意力头对应的多个目标权重矩阵；所述目标权重矩阵的数量与所述多个注意力头的总数相同；基于所述目标注意力头的各个目标权重矩阵和所述目标注意力头的值矩阵，确定所述目标注意力头的中间注意力特征；在确定所述多个注意力头中各个头分别对应的中间注意力特征的情况下，对各个头对应的中间注意力特征进行融合处理，得到所述目标媒体资源特征；所述目标媒体资源特征的特征维度与所述初始媒体资源特征的特征维度相同。6.根据权利要求4所述的方法，其特征在于，所述对各个头对应的中间注意力特征进行融合处理，得到所述目标媒体资源特征，包括：拼接各个头对应的中间注意力特征，得到中间媒体资源特征；对所述中间媒体资源特征进行池化处理，得到所述目标媒体资源特征。7.根据权利要求4所述的方法，其特征在于，所述获取所述多个注意力头中各个头各自对应的注意力掩码矩阵，包括：对于各媒体资源子特征中的第一媒体资源子特征和第二媒体资源子特征，基于所述第一媒体资源子特征的反馈类型和所述第二媒体资源子特征的反馈类型、以及所述目标映射矩阵中当前查询矩阵对应的注意力头的反馈类型和所述目标注意力头的反馈类型，确定所述多个注意力头中对应的各头的注意力掩码；基于所述多个注意力头中对应的各头的注意力掩码，构建所述多个注意力头中各个头各自对应的注意力掩码矩阵。8.根据权利要求7所述的方法，其特征在于，所述基于所述第一媒体资源子特征的反馈类型和所述第二媒体资源子特征的反馈类型、以及所述目标映射矩阵中当前查询矩阵对应的注意力头的反馈类型和所述目标注意力头的反馈类型，确定所述多个注意力头中对应的各头的注意力掩码，包括：对于各媒体资源子特征中的第一媒体资源子特征和第二媒体资源子特征，在所述第一媒体资源子特征的反馈类型和所述第二媒体资源子特征的反馈类型，与当前查询矩阵对应的注意力头的反馈类型和所述目标注意力头的反馈类型一一对应的情况下，确定当前查询矩阵对应的注意力头的第一注意力掩码分量为1；所述第一注意力掩码分量用于反映所述第一媒体资源子特征到所述第二媒体资源子特征的注意力；在所述第二媒体资源子特征的反馈类型和所述第一媒体资源子特征的反馈类型，与当前查询矩阵对应的注意力头的反馈类型和所述目标注意力头的反馈类型一一对应的情况下，确定当前查询矩阵对应的注意力头的第二注意力掩码分量为1；所述第二注意力掩码分量用于反映所述第二媒体资源子特征到所述第一媒体资源子特征的注意力；
确定所述当前查询矩阵对应的注意力头的第三注意力掩码分量为0；所述第三注意力掩码分量为注意力掩码矩阵中除所述第一注意力掩码分量和/或所述第二注意力掩码分量之外位置的掩码分量；确定所述多个注意力头中除当前查询矩阵对应的注意力头之外的其他各头的第一注意力掩码分量、第二注意力掩码分量和第三注意力掩码分量；将所述多个注意力头中各个头分别对应的第一注意力掩码分量、第二注意力掩码分量和第三注意力掩码分量，作为所述多个注意力头中对应的各头的注意力掩码。9.根据权利要求1
‑
8任一所述的方法，其特征在于，所述对所述目标媒体资源特征进行基于正反馈维度的反馈拆分处理，得到正反馈序列表征，包括：基于所述操作反馈序列中各兴趣反馈的反馈标签，确定正兴趣掩码矩阵；所述正兴趣掩码矩阵中正反馈标签对应的向量配置为1，且负反馈标签对应的向量配置为0；基于所述正兴趣掩码矩阵对所述目标媒体资源特征进行基于正反馈维度的反馈拆分处理，得到所述正反馈序列表征。10.根据权利要求1
‑
8任一所述的方法，其特征在于，所述通过所述推荐模型基于所述正反馈序列表征对所述候选资源进行预测处理，得到所述候选资源对应的推荐结果，包括：将所述正反馈序列表征和所述候选资源的资源特征输入至正反馈预测层进行预测处理，得到所述候选资源的推荐指标；所述推荐指标用于指示所述对象账号对所述候选资源的点击概率；将所述候选资源的推荐指标作为所述所述候选资源对应的推荐结果；相应的，所述基于所述候选资源的推荐结果确定推荐资源，包括：将点击概率大于或等于预设点击概率阈值的候选资源，确定为推荐资源。11.一种推荐模型的训练方法，其特征在于，包括：获取样本对象账号的历史操作样本数据，所述历史操作样本数据包括样本媒体资源序列和与所述样本媒体资源序列对应的样本操作反馈序列，所述样本操作反馈序列包括所述样本对象账号针对所述样本媒体资源序列中各样本媒体资源的正反馈标签和负反馈标签；将所述历史操作样本数据输入初始推荐模型，对所述样本媒体资源序列和所述样本操作反馈序列进行融合编码处理，得到初始样本资源特征，所述初始样本资源特征包括多个样本资源子特征，每个所述样本资源子特征包含对应的正反馈标签或负反馈标签；通过所述初始推荐模型，对所述初始样本资源特征进行基于所述媒体资源序列对应的正反馈标签和负反馈标签相混合的编码处理，得到目标样本资源特征；通过所述初始推荐模型，对所述目标样本资源特征进行基于混合反馈维度的反馈拆分处理，得到正反馈样本序列特征和负反馈样本序列特征；所述正反馈样本序列表征用于表征所述样本对象账号对所述样本媒体资源序列中的正...

【专利技术属性】
技术研发人员：李勇，宋洋，林冠煜，高宸，郑瑜，常健新，牛亚男，金德鹏，李志恒，
申请(专利权)人：北京达佳互联信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人