【技术实现步骤摘要】
用于生成商品表征的生成模型的训练方法及装置
[0001]本说明书一个或多个实施例涉及推荐领域,尤其涉及一种用于生成商品表征的生成模型的训练方法及装置。
技术介绍
[0002]在营销业务中,为了满足用户日益多元的消费需求,会有周期性的新商品上线。对于这样频繁的上新活动,会出现冷启动的问题,即在短时间内无法积累足够多的训练样本,导致推荐模型不能充分拟合这些新投放的商品,进而影响这些新投放的商品的推荐结果。
[0003]因此,需要提供一种方案,可以更准确地对新投放的商品进行推荐。
技术实现思路
[0004]本说明书一个或多个实施例描述了一种用于生成商品表征的生成模型的训练方法及装置,所训练的生成模块能够生成精确的商品表征,这有助于提升商品推荐的准确性。
[0005]根据第一方面,提供了一种用于生成商品表征的生成模型的训练方法,包括:
[0006]获取第一训练样本,其中至少包括商品标识和商品属性;
[0007]分别确定所述商品标识和商品属性各自对应的第一原始向量和第二原始向量;所述第一 ...
【技术保护点】
【技术特征摘要】
1.一种用于生成商品表征的生成模型的训练方法,包括:获取第一训练样本,其中至少包括商品标识和商品属性;分别确定所述商品标识和商品属性各自对应的第一原始向量和第二原始向量;所述第一原始向量用于作为真实的商品表征;将所述第一原始向量和第二原始向量输入生成模型;所述生成模型包括,第一自编码器和第二自编码器;其中,通过所述第一自编码器,基于所述第一原始向量确定所述商品标识的第一生成向量;通过所述第二自编码器,基于所述第二原始向量确定所述商品属性的第二生成向量;通过预训练的判别器,输出所述第二生成向量为真实的商品表征的预测概率;以减小第一损失为目标,调整所述判别器的参数;其中,所述第一损失正相关于所述预测概率;以减小第二损失为目标,调整所述第一自编码器和第二自编码器的参数;其中,所述第二损失正相关于基于所述第一原始向量和第一生成向量的比对确定的重构损失,负相关于所述第一损失。2.根据权利要求1所述的方法,其中,所述第一训练样本还包括,确定与对应商品进行预定交互行为的用户的用户特征;所述输出所述第二生成向量为真实的商品表征的预测概率,包括:将所述第二生成向量与所述用户特征对应的用户向量进行拼接,得到拼接向量;通过预训练的判别器,基于所述拼接向量,输出所述用户与对应商品进行所述预定交互行为的概率,并将输出的概率作为所述预测概率。3.根据权利要求2所述的方法,所述第一训练样本还包括,用于指示用户确定与对应商品进行预定交互行为的样本标签;所述判别器通过以下步骤进行预训练:在嵌入层中,分别对所述商品标识、商品属性和用户特征进行嵌入处理,得到所述商品标识、商品属性和用户特征对应的各个特征向量;在所述判别器中,基于所述各个特征向量的拼接结果,预测用户与对应商品进行所述预定交互行为的概率;基于所述第一训练样本的样本标签和预测的概率,调整所述嵌入层和判别器的参数。4.根据权利要求3所述的方法,其中,所述第一原始向量和第二原始向量是在经过调整参数的嵌入层中,分别对所述商品标识和商品属性进行嵌入处理得到的。5.根据权利要求1所述的方法,其中,所述第一训练样本与热商品相对应,所述热商品是指对应样本数目大于预定阈值的商品;所述方法还包括:基于第二训练样本,对嵌入层和所述判别器的参数进行微调;所述第二训练样本与冷商品相对应,所述冷商品是指对应样本数目小于预定阈值的商品。6.根据权利要求1所述的方法,其中,所述第一自编码器包括第一编码器和解码器;所述第二自编码器包括第二编码器和所述解码器;所述确定所述商品标识的第一生成向量,包括:通过所述第一编码器,基于所述第一原始向量,确定所述第一原始向量对应的第一分布的第一均值和第一标准差;通过所述解码器,对从所述第一均值和第一标准差限定的第一分布中采样的隐向量进行解码,得到所述第一生成向量;
所述确定所述商品属性的第二生成向量,包括:通过所述第二编码器,基于所述第二原始向量,确定所述第二原始向量对应的第二分布的第二均值和第二标准差;通过所述解码器,对从所述第二均值和第二标准差限定的第...
【专利技术属性】
技术研发人员:李嘉兴,郇兆鑫,张晓露,周俊,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。