【技术实现步骤摘要】
物品数据处理方法、装置、计算机设备和存储介质
[0001]本申请涉及计算机
,特别是涉及一种物品数据处理方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
[0002]互联网的出现和普及给用户带来了海量信息,满足了用户在信息时代的信息需求。然而,随着信息量的大幅增长,用户在面对海量信息时,难以从海量的信息中快速获取想要的或者感兴趣的内容,此时推荐功能应运而生。
[0003]针对物品的推荐,通常是基于机器学习模型预测用户感兴趣的物品,将预测得到的物品推荐给用户。传统方法中,通常是获取具有训练标签的训练样本,基于训练样本和训练标签对用于预测用户感兴趣物品的机器学习模型进行有监督训练。然而,训练标签的标注费时费力,容易导致模型训练效率低的问题。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高模型训练效率的物品数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]本申请提供了一种物品数据处理方法。所述方法包括:获取训练物品标识序列 ...
【技术保护点】
【技术特征摘要】
1.一种物品数据处理方法,其特征在于,所述方法包括:获取训练物品标识序列,将所述训练物品标识序列输入初始物品预测模型;所述训练物品标识序列包括依次关联的物品标识;通过所述初始物品预测模型,在预设语义嵌入特征集中,查询所述训练物品标识序列中处于目标位置之前的各个物品标识对应的语义嵌入特征,对处于所述目标位置之前的各个物品标识对应的语义嵌入特征进行特征解码,得到所述目标位置对应的预测物品特征,基于所述目标位置对应的预测物品特征,得到在所述目标位置上的物品标识所对应的预测概率;所述目标位置是从所述训练物品标识序列对应的各个物品标识位置中确定的,所述预测概率表征在所述目标位置上的物品标识所属的物品和所述目标位置对应的前向物品序列的预测关联度,所述前向物品序列包括处于所述目标位置之前的各个物品标识对应的物品;基于所述训练物品标识序列中在各个目标位置上的物品标识分别对应的预测概率,得到模型损失;基于所述模型损失调整所述初始物品预测模型的模型参数,直至满足第一收敛条件,得到目标物品预测模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取候选物品集中各个物品分别对应的初始嵌入特征,将所述各个物品分别对应的初始嵌入特征输入目标语义塔;针对各个初始嵌入特征中任意的初始嵌入特征,通过目标语义塔,对物品对应的初始嵌入特征进行特征编码,得到物品对应的中间嵌入特征,对物品对应的中间嵌入特征进行特征压缩,得到物品对应的语义嵌入特征;基于所述各个物品分别对应的语义嵌入特征,得到所述预设语义嵌入特征集。3.根据权利要求2所述的方法,其特征在于,所述获取候选物品集中各个物品分别对应的初始嵌入特征,包括:获取候选物品集中各个物品分别对应的物品属性集;针对各个物品属性集中任意的物品属性集,对物品属性集中的各个物品属性进行特征提取,得到各个物品属性分别对应的物品属性特征,拼接各个物品属性分别对应的物品属性特征,得到物品属性集所属物品对应的初始嵌入特征。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取训练物品对;将所述训练物品对中的第一物品输入待训练的第一语义塔,得到所述第一物品对应的语义嵌入特征,将所述训练物品对中的第二物品输入待训练的第二语义塔,得到所述第二物品对应的语义嵌入特征;基于所述第一物品对应的语义嵌入特征和所述第二物品对应的语义嵌入特征之间的特征相似度,得到所述训练物品对所对应的物品关系预测标签;基于所述训练物品对所对应的物品关系训练标签和物品关系预测标签之间的差异,调整所述待训练的第一语义塔和第二语义塔的模型参数,直至满足第二收敛条件,得到完成训练的第一语义塔和第二语义塔;所述目标语义塔是从所述完成训练的第一语义塔和第二语义塔中确定的。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:通过所述初始物品预测模型,获取处于所述目标位置之前的各个物品标识位置分别对应的位置嵌入特征,将物品标识对应的语义嵌入特征和物品标识所属物品标识位置对应的位置嵌入特征进行融合,分别得到所述训练物品标识序列中处于所述目标位置之前的各个物品标识对应的融合嵌入特征;所述对处于所述目标位置之前的各个物品标识对应的语义嵌入特征进行特征解码,得到所述目标位置对应的预测物品特征,包括:对处于所述目标位置之前的各个物品标识对应的融合嵌入特征进行特征解码,得到所述目标位置对应的预测物品特征。6.根据权利要求1所述的方法,其特征在于,所述基于所述目标位置对应的预测物品特征,得到在所述目标位置上的物品标识所对应的预测概率,包括:将所述目标位置对应的预测物品特征进行线性变换,得到所述目标位置对应的初始物品分布特征;所述初始物品分布特征包括候选物品集中各个物品分别对应的特征值;对所述初始物品分布特征进行特征值压缩,得到所述目标位置对应的目标物品分布特征;所述目标物品分布特征包括所述候选物品集中各个物品分别对应的预测概率;所述候选物品集包括所述训练物品标识序列中各个物品标识分别对应的物品;从所述目标物品分布特征中确定在所述目标位置上的物品标识所对应的预测概率。7.根据权利要求1所述的方法,其特征在于,所述初始物品预测模型包括嵌入层、解码层和输出层,所述嵌入层包括第一子嵌入层和第二子嵌入层,所述第一子嵌入层用于查询语义嵌入特征,所述第二子嵌入层用于获取位置嵌入特征,所述解码层用于进行特征解码,所述输出层用于输出预测概率;所述基于所述模型损失调整所述初始物品预测模型的模型参数,直至满足第一收敛条件,得到目标物品预测模型,包括:基于所述模型损失调整所述初始物品预测模型中所述第二子嵌入层、所述解码层和所述输出层的模型参数,直至满足第一收敛条件,得到目标物品预测模型。8.根据权利要求7所述的方法,其特征在于,所述输出层用于基于所述解码层的输出数据得到候选物品集中各个物品分别对应的预测概率,所述方法还包括:在得到所述目标物品预测模型后,当所述候选物品集加入了补充...
【专利技术属性】
技术研发人员:叶祺,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。