一种用于向用户推荐内容的推荐模型的训练方法技术

技术编号:39396700 阅读:11 留言:0更新日期:2023-11-19 15:51
本公开提供用于向用户推荐内容的推荐模型的训练方法,包括基于用户特征生成第一样本,基于与用户特征相关的内容特征生成对应的第二样本;丢失第一样本中的部分用户特征生成不同的第三样本和第四样本;丢失第二样本中的部分内容特征生成不同的第五样本和第六样本;基于第一和第二样本对由用户和内容特征神经网络两者组成的主双塔模型进行主训练任务;基于第三和第四样本对第一辅助双塔模型进行第一辅助训练任务;基于第五和第六样本对第二辅助双塔模型进行第二辅助训练任务,基于由主训练、第一辅助训练和第二辅助训练任务各自的损失函数确定的联合损失函数调整用户和内容特征神经网络两者,得到推荐模型。本公开还涉及用于向用户推荐内容的方法。用于向用户推荐内容的方法。用于向用户推荐内容的方法。

【技术实现步骤摘要】
一种用于向用户推荐内容的推荐模型的训练方法


[0001]本公开涉及推荐系统
,尤其是一种用于向用户推荐内容的推荐模型的训练方法。

技术介绍

[0002]互联网的出现和普及给用户带来了大量的信息,满足了用户在信息时代对信息的需求,但随着网络的迅速发展,网络上的信息量的大幅增长,使得用户在面对大量信息时无法从中获得对自己真正想要的那部分信息,对信息的使用效率反而降低了,这就是所谓的信息超载问题。
[0003]解决信息超载问题的一个非常有潜力的办法是推荐系统,它可以根据用户历史行为和偏好,提供内容的个性化排序结果,从而使得用户能够快速获得自己真正想要获取的内容。推荐系统通常包括召回、粗排和精排等模块。召回模块能够从海量内容中快速筛选出潜在候选内容。粗排可以对召回模块筛选出的潜在候选内容再进行一次筛选。精排能够进行更加细致的排序。

技术实现思路

[0004]本公开一个或多个实施例的目的之一是提供一种用于向用户推荐内容的推荐模型的训练方法。
[0005]根据本公开实施例的第一方面,提供一种用于向用户推荐内容的推荐模型的训练方法,包括:基于多个用户特征生成第一样本,基于与多个用户特征相关的多个内容特征生成与第一样本对应的第二样本;分别以第一丢失方式和第二丢失方式丢失第一样本中的部分用户特征,以生成不同的第三样本和第四样本;分别以第三丢失方式和第四丢失方式丢失第二样本中的部分内容特征,以生成不同的第五样本和第六样本;基于包含多个第一样本的第一样本集和包含多个第二样本的第二样本集,对由用户特征神经网络和内容特征神经网络组成的主双塔模型进行主训练任务;基于包含多个第三样本的第三样本集和包含多个第四样本的第四样本集对第一辅助双塔模型进行第一辅助训练任务,第一辅助双塔模型中的两个神经网络均为从主双塔模型共享的所述用户特征神经网络;基于包含多个第五样本的第五样本集和包含多个第六样本的第六样本集对第二辅助双塔模型进行第二辅助训练任务,第二辅助双塔模型中的两个神经网络均为从主双塔模型共享的所述内容特征神经网络,其中,基于由主训练任务的损失函数、第一辅助训练任务的损失函数和第二辅助训练任务的损失函数三者确定的联合损失函数对所述用户特征神经网络和所述内容特征神经网络进行调整,以便得到所述推荐模型。
[0006]本公开一个或多个实施例的目的之二是提供一种用于向用户推荐内容的方法。
[0007]根据本公开实施例的第二方面,提供一种用于向用户推荐内容的方法,包括:利用根据上述任意一个实施例所述的方法训练的所述推荐模型,基于推荐的目标用户的用户特征对内容库中的内容进行召回处理;基于召回处理筛选出的内容确定待推荐内容;以及向
目标用户展示所述待推荐内容。
[0008]根据本公开实施例的第三方面,提供一种用于向用户推荐内容的装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行上述实施例所述的方法。
[0009]根据本公开实施例的第四方面,提供一种计算机可读存储介质,包括计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述任意一个实施例所述的方法。
[0010]根据本公开实施例的第五方面,提供一种计算机程序产品,包括计算机程序,其中,所述计算机程序被处理器执行时实现上述任意一个实施例所述的方法。
[0011]下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
[0012]为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0013]图1是根据本公开实施例的用于向用户推荐内容的推荐模型的训练方法的流程示意图。
[0014]图2是根据本公开实施例的用于向用户推荐内容的推荐模型的结构示意图。
[0015]图3是根据本公开实施例的用于向用户推荐内容的推荐模型的训练方法中的第一辅助训练任务的训练目标的示意图。
[0016]图4是根据本公开实施例的用于向用户推荐内容的方法的流程示意图。
[0017]图5是根据本公开实施例的用于向用户推荐内容的装置的结构示意图。
具体实施方式
[0018]下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
[0019]除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0020]同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0021]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0022]在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。
[0023]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0024]双塔模型可以学习用户和内容之间的相关性,因此常用于推荐系统中的召回模
块。双塔模型由两个独立的神经网络塔组成,两个神经网络塔分别学习用户和内容的表示向量,再计算它们的相似度,从而进行召回。双塔模型能捕捉包括长期兴趣、短期兴趣和上下文信息等在内的复杂关系,并实现快速召回。
[0025]专利技术人注意到双塔模型在处理长尾内容和不活跃用户的用户数据时效果不佳。这里的长尾内容例如包括小众内容和不活跃用户发布的内容,不活跃用户可以包括注册了较长时间但是用户历史行为较少的用户和新注册的用户。专利技术人通过研究发现,这是由于数据稀疏性导致召回模块对长尾内容的内容样本和不活跃用户的用户样本的训练不充分。一方面,这使得召回模块更倾向于筛选出互动量很高的内容或者活跃用户的发布的内容,无法给小众内容和不活跃用户发布的内容带来流量分发,导致用户通常只能看到热门贴,很少看到符合自己兴趣的小众内容,不能充分满足用户需求。另一方面,这使得召回模块忽略了不活跃用户的兴趣,使得其面向不活跃用户的个性化推荐能力较差。这两方面综合导致了推荐系统无法实现针对长尾内容以及不活跃用户的个性化推荐,造成长尾问题和推荐冷启动问题,降低了用户体验。为了解决这一问题,专利技术人提出了如下方法。
[0026]图1是根据本公开实施例的用于向用户推荐内容的推荐模型的训练方法的流程示意图。图2是根据本公开实施例的用于向用户推荐内容的推荐模型的结构示意图。图3是根据本公开实施例的用于向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于向用户推荐内容的推荐模型的训练方法,包括:基于多个用户特征生成第一样本,基于与多个用户特征相关的多个内容特征生成与第一样本对应的第二样本;分别以第一丢失方式和第二丢失方式丢失第一样本中的部分用户特征,以生成不同的第三样本和第四样本;分别以第三丢失方式和第四丢失方式丢失第二样本中的部分内容特征,以生成不同的第五样本和第六样本;基于包含多个第一样本的第一样本集和包含多个第二样本的第二样本集,对由用户特征神经网络和内容特征神经网络组成的主双塔模型进行主训练任务;基于包含多个第三样本的第三样本集和包含多个第四样本的第四样本集对第一辅助双塔模型进行第一辅助训练任务,第一辅助双塔模型中的两个神经网络均为从主双塔模型共享的所述用户特征神经网络;基于包含多个第五样本的第五样本集和包含多个第六样本的第六样本集对第二辅助双塔模型进行第二辅助训练任务,第二辅助双塔模型中的两个神经网络均为从主双塔模型共享的所述内容特征神经网络,其中,基于由主训练任务的损失函数、第一辅助训练任务的损失函数和第二辅助训练任务的损失函数三者确定的联合损失函数对所述用户特征神经网络和所述内容特征神经网络进行调整,以便得到所述推荐模型。2.根据权利要求1所述的方法,其中,第一丢失方式和第二丢失方式为不同的随机丢失,第三丢失方式和第四丢失方式为不同的随机丢失。3.根据权利要求2所述的方法,其中,第一丢失方式和第二丢失方式使用不同的随机数生成函数或不同的随机数种子,第三丢失方式和第四丢失方式使用不同的随机数生成函数或不同的随机数种子。4.根据权利要求1所述的...

【专利技术属性】
技术研发人员:魏鑫轩方琨唐方爽张璐陶明
申请(专利权)人:上海任意门科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1