内容推荐模型的训练方法及装置制造方法及图纸

技术编号:39150829 阅读:8 留言:0更新日期:2023-10-23 14:58
本申请提供了一种内容推荐模型的训练方法及装置,该方法包括:基于预先构建的多媒体内容的统一标识,获取多个地区的多媒体内容的统计特征,对同一多媒体内容在多个地区的统计特征进行合并,得到所述多媒体内容的合并统计特征;基于每个用户访问的多媒体内容的统一标识,获取各个地区用户的多媒体内容访问特征;利用所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征,训练一个内容推荐模型,其中,所述内容推荐模型用于为不同地区用户生成内容推荐结果。本申请能够在保证模型推荐准确性的情况下,节省资源开销与系统维护的成本。护的成本。护的成本。

【技术实现步骤摘要】
内容推荐模型的训练方法及装置


[0001]本申请涉及内容推荐
,具体涉及一种内容推荐模型的训练方法及装置。

技术介绍

[0002]随着互联网数字家庭电视的推广与普及,多媒体内容的不断完善,资源的数量不断增加,达到了百万计甚至是千万级的量,用户要想从中找到自己感兴趣的话题和视频,需要花费大量的精力和时间。内容推荐系统可以根据用户的兴趣推荐合适的视频,提升用户的体验。如何高效的提升推荐的准确性与体验,就是其中研究的重点方向。目前,内容推荐还涉及到多兴趣与不同地区(如不同省份)的不同用户习惯、地域差异等多方面的挑战。
[0003]以省份为例,在互联网数字家庭电视的推荐中,大多数的推荐方案还是多省多模型的方案以及借鉴多任务和多场景模型的一些技术方案。如果采用各省份独立的方式,会忽视场景共性,导致长尾小场景难以学好,同时每个场景维护一个模型,又极大地增加系统资源开销和人力成本。此外,每个省份的最受欢迎的内容通常是不一样的,这带来视频特征的迁移难题。
[0004]目前的多技术方案大致分为以下几类:(1)直接将样本混合,训练共享模型,该方案忽视了场景差异性,导致预测准度下降;同时如果各场景数据量不均衡,容易被数据量大的大场景主导,数据量小的小场景学习不好。(2)把场景相关特征作为模型输入,但由于场景特征的维度一般较少,随着网络深度的增加,场景特征对最终预测结果影响有限。(3)将场景看作bias,构建辅助子网络,在输出层直接与主网络结果相加或相乘,这种方式能让场景特征直接影响到最终结果,但对主网络中间层影响有限。(4)多任务模型的相关结构(MMOE,多塔结构),多塔的硬参数共享较难学习到模型的差异,MMOE的专家模型需要手动制定专家的个数,并且专家之间不通信,多场景的时候较难取得好的效果。
[0005]现有技术存在以下问题:通常采用的简单数据和特征的融合方式会忽略多个省份之间的数据行为差异,无法保持各个省份都取得比较好的推荐效果和体验。第二个是采用多任务的方式,多场景和多任务之间具有明显的差异,同一个任务数据分布不同,完全套用多任务,会出现严重的跷跷板现象。目前,现有技术的内容推荐模型,为保证推荐准确性,通常多是采用按照各个地区(如省份)单独建模的方式进行,导致资源开销大,维护成本高。

技术实现思路

[0006]本申请的至少一个实施例提供了一种内容推荐模型的训练方法及装置,用于解决现有技术中按照地区单独建模的方式所导致的资源开销大和维护成本高的问题。
[0007]为了解决上述技术问题,本申请是这样实现的:
[0008]第一方面,本申请实施例提供了一种内容推荐模型的训练方法,包括:
[0009]基于预先构建的多媒体内容的统一标识,获取多个地区的多媒体内容的统计特征,对同一多媒体内容在多个地区的统计特征进行合并,得到所述多媒体内容的合并统计特征;
[0010]基于每个用户访问的多媒体内容的统一标识,获取各个地区用户的多媒体内容访问特征;
[0011]利用所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征,训练一个内容推荐模型,其中,所述内容推荐模型用于为不同地区用户生成内容推荐结果。
[0012]可选的,还包括:
[0013]利用所述内容推荐模型,生成针对目标地区用户的内容推荐结果。
[0014]可选的,所述内容推荐模型用于:
[0015]基于所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征,生成第一特征;
[0016]基于各个地区的多媒体内容的统计特征和多媒体内容访问特征,生成第二特征;
[0017]基于所述第一特征和第二特征,生成针对各个地区的内容推荐结果。
[0018]可选的,所述内容推荐模型包括主网络和辅助网络,其中,
[0019]所述主网络用于:生成输入特征中每个特征对应的权重;利用所述权重,对输入特征中的每个特征进行加权求和,得到所述第一特征,其中,所述输入特征包括所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征;
[0020]所述辅助网络用于:基于各个地区的地区特征、多媒体内容的统计特征和多媒体内容访问特征,生成第二特征。
[0021]可选的,所述主网络,还用于在进行所述加权求和之前,针对输入特征中的每个特征,对该特征对应的向量进行压缩得到第一值,将所述第一值与第二值、第三值相加,得到该特征对应的压缩值,其中,所述第二值是对所述输入特征中所有特征对应的向量叉乘得到的向量压缩后得到的,所述第三值是对输入特征中所有特征对应的向量拼接得到的向量压缩后得到的;
[0022]所述对输入特征中的每个特征进行加权求和,具体为:对输入特征中每个特征对应的压缩值进行加权求和。
[0023]可选的,所述主网络,还用于将所述输入特征输入一个第一MLP网络,对所述第一MLP网络的输出结果进行归一化后再进行批标准化处理,得到每个特征对应的权重。
[0024]可选的,所述辅助网络,还用于将各个地区的地区特征、多媒体内容的统计特征和多媒体内容访问特征,输入至第二MLP网络,获得由所述第二MLP网络输出的所述第二特征。
[0025]可选的,所述多媒体内容的统计特征包括以下至少一种:所述多媒体内容的标识、所述多媒体内容的页面点击量、所述多媒体内容的访客数量以及统计周期长度;多媒体内容访问特征为用户访问的多媒体内容的统一标识所组成的序列;所述地区特征包括以下至少一种:地区所属的省份名、地区所属的城市名、地区的地域属性。
[0026]第二方面,本申请实施例提供了一种内容推荐模型的训练装置,包括:
[0027]第一获得模块,用于基于预先构建的多媒体内容的统一标识,获取多个地区的多媒体内容的统计特征,对同一多媒体内容在多个地区的统计特征进行合并,得到所述多媒体内容的合并统计特征;
[0028]第二获得模块,用于基于每个用户访问的多媒体内容的统一标识,获取各个地区用户的多媒体内容访问特征;
[0029]模型训练模块,用于利用所述多媒体内容的合并统计特征和各个地区用户的多媒
体内容访问特征,训练一个内容推荐模型,其中,所述内容推荐模型用于为不同地区用户生成内容推荐结果。
[0030]可选的,还包括:
[0031]推理模块,用于利用所述内容推荐模型,生成针对目标地区用户的内容推荐结果。
[0032]可选的,所述内容推荐模型用于:
[0033]基于所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征,生成第一特征;
[0034]基于各个地区的多媒体内容的统计特征和多媒体内容访问特征,生成第二特征;
[0035]基于所述第一特征和第二特征,生成针对各个地区的内容推荐结果。
[0036]可选的,所述内容推荐模型包括主网络和辅助网络,其中,
[0037]所述主网络用于:生成输入特征中每个特征对应的权重;利用所述权重,对输入特征中的每个特征进行加权求和,得到所述第一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容推荐模型的训练方法,其特征在于,包括:基于预先构建的多媒体内容的统一标识,获取多个地区的多媒体内容的统计特征,对同一多媒体内容在多个地区的统计特征进行合并,得到所述多媒体内容的合并统计特征;基于每个用户访问的多媒体内容的统一标识,获取各个地区用户的多媒体内容访问特征;利用所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征,训练一个内容推荐模型,其中,所述内容推荐模型用于为不同地区用户生成内容推荐结果。2.根据权利要求1所述的方法,其特征在于,还包括:利用所述内容推荐模型,生成针对目标地区用户的内容推荐结果。3.根据权利要求1所述的方法,其特征在于,所述内容推荐模型用于:基于所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征,生成第一特征;基于各个地区的多媒体内容的统计特征和多媒体内容访问特征,生成第二特征;基于所述第一特征和第二特征,生成针对各个地区的内容推荐结果。4.根据权利要求3所述的方法,其特征在于,所述内容推荐模型包括主网络和辅助网络,其中,所述主网络用于:生成输入特征中每个特征对应的权重;利用所述权重,对输入特征中的每个特征进行加权求和,得到所述第一特征,其中,所述输入特征包括所述多媒体内容的合并统计特征和各个地区用户的多媒体内容访问特征;所述辅助网络用于:基于各个地区的地区特征、多媒体内容的统计特征和多媒体内容访问特征,生成第二特征。5.根据权利要求4所述的方法,其特征在于,所述主网络,还用于在进行所述加权求和之前,针对输入特征中的每个特征,对该特征对应的向量进行压缩得到第一值,将所述第一值与第二值、第三值相加,得到该特征对应的压缩值,其中,所述第二值是对所述输入特征中所有特征对应的向量叉乘得到的向量压缩后得到的,所述第三值是对输入特征中所有特征对应的向量拼接得到的向量压缩后得到的;所述对输入特征中的每个特征进行加权求和,具体为:对输入特征中每个特征对应的压缩值进行加权求和。6.根据权利要求4所述的方法,其特征在于,所述主网络,还用于将所述输入特征输入一个第一MLP网络,对所述第一MLP网络的输出结果进行归一化后再进行批标准化处理,得到每个特征对应的权重。7.根据权利要求4所述的方法,其特征在于,所述辅助网络,还用于将各个地区的地区特征、多媒体内容的统计特征和多媒体内容访问特征,输入至第二MLP网络,获得由所述第二MLP网络输出的所述第二特征。8.根据权利要求4所述的方法,其特征在于,所述多媒体内容的统计特征包括以下至少一种:所述多媒体内容的标识、所述多媒体内容的页面点击量、所述多媒体内容的访客数量以及统计周期长度;多媒体内容访问特征为用户访问的多媒体内容的统一标识所组成的序列;所述地区特征包括以下至少一种:地区所属的省份名、地区所属的城市名、地区的地域属性。
9.一种内容推荐模型的训练装置,其特征在于,包括:第一获得模块,用于基于预先构建的多媒体内容的统一标识,获取多个地区的多媒体内容的统计特征,对同一多媒体内容在多个地区的统计特征进行合并,得到所述多媒体内容的合并统计特征;第二...

【专利技术属性】
技术研发人员:左霖
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1