【技术实现步骤摘要】
序列生成模型的训练方法、装置、电子设备和存储介质
[0001]本申请涉及数据处理
,尤其涉及一种序列生成模型的训练方法
、
装置
、
电子设备和存储介质
。
技术介绍
[0002]目前推荐系统中的一个重要模块为打散环节,主要解决推荐物品相似度过高
、
过于集中的问题
。
而现有的打散技术的出发点均为将相似的物品“间隔”开,无法验证扩散结果是否符合点击率最优化
。
且技术方案中存在较多人为干预因素,影响推荐系统的客观性
。
技术实现思路
[0003]本申请提供一种序列生成模型的训练方法
、
装置
、
电子设备
、
计算机可读存储介质及计算机程序产品,以解决推荐系统无法以点击率作为参考,且推荐系统主观因素过多的问题
。
本申请的技术方案如下:
[0004]根据本申请实施例的第一方面,提供一种序列生成模型的训练方法,包括:获取样本物料序列,所述 ...
【技术保护点】
【技术特征摘要】
1.
一种序列生成模型的训练方法,其特征在于,包括:获取样本物料序列,所述样本物料序列中包括按照按序排列的已推荐过的
K
个样本物料,其中,
K
为大于1的整数;获取所述样本序列中每个样本物料的第一向量表示,并基于所述样本序列中前
K
‑1个样本物料的第一向量表示,得到第一向量序列;将所述第一向量序列输入序列生成模型中,输出所述样本序列中第
K
个样本物料的第二向量表示;基于所述第
K
个样本物料的所述第一向量表示和所述第二向量表示,对所述序列生成模型进行修正,直至训练结束得到目标序列生成模型
。2.
根据权利要求1所述的方法,其特征在于,所述序列生成模型包括编码层和池化层,其中,所述将所述第一向量序列输入序列生成模型中,输出所述样本序列中第
K
个样本物料的第二向量表示,包括:由所述编码层对所述第一向量序列进行双向信息抽取,得到第二向量序列,其中所述第二向量序列包括所述前
K
‑1个样本物料各自的第三向量表示;由所述池化层对所述第二向量序列进行池化操作,得到所述第
K
个样本物料的第二向量表示
。3.
根据权利要求2所述的方法,其特征在于,所述由所述池化层对所述第二向量序列进行池化操作,得到所述第
K
个样本物料的第二向量表示,包括:确定所述序列生成模型的注意力向量和空间变换矩阵;基于所述注意力向量
、
所述空间变换矩阵和所述第二向量序列,得到所述
K
个样本物料的第二向量表示
。4.
根据权利要求3所述的方法,其特征在于,所述基于所述注意力向量
、
所述空间变换矩阵和所述第二向量序列,得到所述
K
个样本物料的第二向量表示,包括:基于所述注意力向量
、
所述空间变换矩阵和所述前
K
‑1个样本物料各自的第三向量表示,分别得到所述前
K
‑1个样本物料各自的注意力权重;针对所述前
K
‑1个样本物料中每个样本物料,基于所述样本物料的注意力权重,对所述样本物料的第三向量表示进行加权,得到所述样本物料的第四向量表示;对所述前
K
‑1个样本物料的所述第四向量表示求和,得到所述
K
个样本物料的第二向量表示
。5.
根据权利要求1所述的方法,其特征在于,所述获取所述样本序列中每个样本物料的第一向量表示,包括:获取所述样本物料的属性特征和预测点击率,其中,所述属性特征包括物料标识
、
物料类型和物料品牌中一个或多个特征信息;对所述样本物料的属性特征和所述预测点击率进行编码,得到所述样本物料的第一向量表示
。6.
根据权利要求1‑5中任一项所述的方法,其特征在于,所述基于所述第
K
个样本物料的所述第一向量表示和所述第二向量表示,对所述序列生成模型进行修正,直至训练结束得到目标序列生成模型,包括:对所述第
K
个样本物料的所述第一向量表示和所述第二向量表示做向量内积,得到所
述样本物料序列被预测为正样本的概率;基于所述样本物料序列的所述概率和样本标签,对所述序列生成模型的模型参数进行修正,直至训练结束得到目标序列生成模型
。7.
根据权利要求6所述的方法,其特征在于,所述基于所述样本物料序列的所述概率和样本标签,对所述序列生成模型的模型参数进行修正,包括:基于所述样本物料序列的所述概率和所述样本标签,确定所述样本物料序列对应的损失值,并基于所述损失函数,对所述序列生成模型的模型参数进行修正
。8.
根据权利要求6所述的方法,其特征在于,所述基于所述样本物料序列的所述概率和样本标签,对所述序列生成模型的模型参数进行修正,包括:在采用批量样本物料序列对所述序列生成模型进行训练的情况下,针对当前批次内的每个所述样本物料序列,基于所述样本物料序列的所述概率和所述样本标签,确定所述样本物料序列对应的损失值;对当前批次内所述样本物料序列的所述损失值进行求平均,得到所...
【专利技术属性】
技术研发人员:吴跃,
申请(专利权)人:京东科技信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。