推荐模型的训练方法、推荐方法、装置、介质及设备制造方法及图纸

技术编号:33744110 阅读:26 留言:0更新日期:2022-06-08 21:43
本公开说明书中提供的推荐模型的训练方法、推荐方法、装置、介质及设备,在训练过程中,通过基于对应第一对象的第一特征向量的集合聚类得到至少一第一对象类簇,以及基于对应第二对象的第二特征向量的集合聚类得到至少一第二类簇;基于第一损失函数所计算的损失更新推荐模型;第一损失部分基于当前训练样本中第一特征向量与第二特征向量所属第二类簇的类簇中心间的第一间距得到;第二损失部分基于当前训练样本中第二特征向量同第一特征向量所属第一对象类簇的类簇中心的第二间距得到。通过对两个对象的特征分别聚类,且以优化一对象特征向量到另一对象相应类簇中心的间距以替代相关技术中优化相似度损失,使低频样本也能被充分训练。被充分训练。被充分训练。

【技术实现步骤摘要】
推荐模型的训练方法、推荐方法、装置、介质及设备


[0001]本公开的实施方式涉及人工智能数据处理
,更具体地,本公开的实施方式涉及推荐模型的训练方法、推荐方法、装置、介质及设备。

技术介绍

[0002]本部分旨在为权利要求中陈述的本公开的实施方式提供背景或上下文,此处的描述不因为包括在本部分中就承认是现有技术。
[0003]随着机器学习的不断发展,各大互联网平台普遍采用基于机器学习的推荐模型来为用户提供内容推荐的服务。基于机器学习的推荐模型需要预先根据训练数据进行训练以学习到用户的偏好,因此对应各种情形的训练数据的数量足够,则得到的推荐模型区分不同情形作准确推荐的能力越强。
[0004]然而,由于长尾效应的存在,训练样本集中的样本分布存在不均衡的问题,故而低频样本无法得到充分训练,导致预测模型中得到训练样本的特征表示并不准确。

技术实现思路

[0005]在本上下文中,本公开的实施方式提供推荐模型的训练方法、推荐方法、装置、介质及设备。
[0006]根据本公开的第一个方面,提供一种推荐模型的训练方法,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种推荐模型的训练方法,其特征在于,包括:获取一组训练样本,所述训练样本包括:第一对象的第一对象特征数据、第二对象的第二对象特征数据、以及标识训练样本为正样本或负样本的标签;输入所述一组训练样本至推荐模型,执行训练过程包括:基于输入的当前训练样本的第一对象特征数据映射得到第一特征向量,以及基于当前训练样本的第二对象特征数据映射得到第二特征向量;基于已得到的各第一特征向量聚类得到至少一第一对象类簇,以及基于已得到的各第二特征向量聚类得到至少一第二类簇;基于第一损失函数所计算的损失更新所述推荐模型;其中,所述第一损失函数所计算损失包括:第一损失部分和第二损失部分;所述第一损失部分基于当前训练样本中第一特征向量与第二特征向量所属第二类簇的类簇中心间的第一间距得到;所述第二损失部分基于所述当前训练样本中第二特征向量同第一特征向量所属第一对象类簇的类簇中心的第二间距得到。2.根据权利要求1所述的训练方法,其特征在于,在所述输入所述一组训练样本至推荐模型之前,还包括:基于训练样本中的第一对象特征数据分别执行剪裁处理得到第一剪裁特征数据对,以及至少基于训练样本中的第二对象特征数据分别执行剪裁处理得到的第二剪裁特征数据对。3.根据权利要求1所述的训练方法,其特征在于,所述第一间距根据第一特征向量与第二类簇中心之间的相似度得到,所述第二间距根据第二特征向量与第一类簇中心之间的相似度得到;所述相似度的计算函数包含可调的温度超参,以用于控制第一损失函数所计算损失受到不同识别难度的负样本的影响。4.根据权利要求1所述的训练方法,其特征在于,所述推荐模型包括第一特征向量处理层、第一深度神经网络、第二特征向量处理层及第二深度神经网络;所述基于输入的所述第一对象特征数据映射得到第一特征向量,以及基于输入的第二对象特征数据映射得到第二特征向量,包括:通过第一特征处理层对第一特征数据进行特征向量处理以得到第一初步特征向量,通过第二特征处理层对第二特征数据进行特征向量处理以得到第二初步特征向量;通过第一深度神经网络基于所述第一初步特征向量得到所述第一对象特征向量,通过第二深度神经网络基于所述第二初步特征向量得到所述第二对象特征向量。5.一种推荐方法,其特征在于,包括:获取至少一个第一对象的第一特征数据和多个第二对象的第二特征数据;输入所述第一特征数据和第二特征数据至推荐模型,以得到所述至少...

【专利技术属性】
技术研发人员:程纯段石石王军正谭钧心刘长伟汪磊朱一飞苏杭蒋文伟陈荣生孙梓涵陆超红
申请(专利权)人:杭州网易云音乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1