特征提取网络的训练方法、信息推荐方法、装置及设备制造方法及图纸

技术编号:30898075 阅读:36 留言:0更新日期:2021-11-22 23:41
本申请公开了一种特征提取网络的训练方法、信息推荐方法、装置及设备,属于计算机技术领域。所述方法包括:获取曝光推荐信息以及第一历史行为信息;获取历史推荐信息序列;根据历史推荐信息序列获取第二历史行为信息序列;通过曝光推荐信息、第一历史行为信息、历史推荐信息序列以及第二历史行为信息序列训练特征提取网络,特征提取网络用于提取曝光推荐信息以及历史推荐信息的语义向量。通过特征提取网络能够实现提取信息的语义向量,从而能够实现基于语义向量的匹配结果向用户推荐感兴趣的信息。在训练过程中,使用的训练数据是在实际应用场景中的数据,因此能够提升提取的语义向量的准确度,从而提升向用户推荐图文组合时的准确度。的准确度。的准确度。

【技术实现步骤摘要】
特征提取网络的训练方法、信息推荐方法、装置及设备


[0001]本申请涉及计算机
,特别涉及一种特征提取网络的训练方法、信息推荐方法、装置及设备。

技术介绍

[0002]具有推荐功能的客户端能够向用户推荐其感兴趣的图文组合,图文组合是由图片和标题构成的文档(item),其中,标题用于描述图片。
[0003]在进行图文组合推荐的过程中,服务器需要通过机器学习模型提取待推荐图文组合的第一语义向量,之后根据用户过去感兴趣的图文组合的第二语义向量与第一语义向量的相似度,确定出与用户过去感兴趣的图文组合匹配的待推荐图文组合,并推荐给用户,从而实现向用户推荐用户感兴趣的图文组合。
[0004]在通过上述方式向用户推荐图文组合时,需要使用样本数据对机器学习模型进行预训练。但是样本数据来源广泛,与实际应用场景中的数据可能存在较大的差异,导致提取的图文组合的语义向量不准确,从而导致推荐图文组合的准确度较低。

技术实现思路

[0005]本申请提供了一种特征提取网络的训练方法、信息推荐方法、装置及设备,可以提升推荐图文组合时的准确本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种特征提取网络的训练方法,其特征在于,所述方法包括:获取曝光推荐信息以及第一历史行为信息,所述曝光推荐信息是推荐给样本用户帐号集合中的样本用户帐号的推荐信息,所述第一历史行为信息用于反映所述样本用户帐号与所述曝光推荐信息产生过第一交互行为;获取历史推荐信息序列,所述历史推荐信息序列包括在所述曝光推荐信息之前,推荐给所述样本用户帐号的历史推荐信息;根据所述历史推荐信息序列获取第二历史行为信息序列,所述第二历史行为信息序列包括第二历史行为信息,所述第二历史行为信息用于反映所述样本用户帐号与所述历史推荐信息产生过第二交互行为;通过所述曝光推荐信息、所述第一历史行为信息、所述历史推荐信息序列以及所述第二历史行为信息序列训练特征提取网络,所述特征提取网络用于提取所述曝光推荐信息以及所述历史推荐信息的语义向量。2.根据权利要求1所述的方法,其特征在于,所述特征提取网络是机器学习模型中的子网络,所述机器学习模型还包括与所述特征提取网络级联的行为预测网络;所述通过所述曝光推荐信息、所述第一历史行为信息、所述历史推荐信息序列以及所述第二历史行为信息序列训练特征提取网络,包括:通过所述特征提取网络提取所述曝光推荐信息的第一语义向量,以及所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量;将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量,与所述历史推荐信息对应的第二历史行为信息的特征进行融合,得到所述历史推荐信息对应的融合特征;基于所述第一语义向量以及所述历史推荐信息序列中每个所述历史推荐信息对应的融合特征,通过所述行为预测网络预测所述曝光推荐信息的预测行为信息;根据所述第一历史行为信息与所述预测行为信息之间的差异,训练所述机器学习模型。3.根据权利要求2所述的方法,其特征在于,所述机器学习模型还包括行为编码网络,所述行为编码网络与所述特征提取网络和所述行为预测网络级联;所述将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量,与所述历史推荐信息对应的第二历史行为信息的特征进行融合,得到所述历史推荐信息对应的融合特征,包括:通过所述行为编码网络处理所述第二历史行为信息序列中每个所述第二历史行为信息,得到所述第二历史行为信息对应的历史行为编码向量;将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量,与所述历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合,得到所述融合特征。4.根据权利要求3所述的方法,其特征在于,所述机器学习模型还包括行为融合网络,所述行为融合网络与所述行为预测网络、所述行为编码网络以及所述特征提取网络级联;所述将所述历史推荐信息序列中每个所述历史推荐信息的第二语义向量,与所述历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合,得到所述融合特征,包括:通过所述行为融合网络,将所述历史推荐信息序列中每个所述历史推荐信息的第二语
义向量,与所述历史推荐信息对应的第二历史行为信息的历史行为编码向量进行融合,得到所述融合特征。5.根据权利要求1至4任一所述的方法,其特征在于,所述曝光推荐信息以及所述历史推荐信息的内容为图文组合,所述图文组合是由图片和标题构成的文档,所述标题用于描述所述图片。6.根据权利要求1至4任一所述的方法,其特征在于,所述获取历史推荐信息序列,包括:获取浏览信息序列和交互信息序列中的至少一种;其中,所述浏览信息序列是由在所述曝光推荐信息的推荐时刻之前,向所述样本用户帐号推荐的浏览推荐信息组成的,所述交互信息序列是由在所述曝光推荐信息的推荐时刻之前,与所述样本用户帐号产生过第三交互行为的交互推荐信息组成的。7.根据权利要求6所述的方法,其特征在于,所述交互推荐信息,...

【专利技术属性】
技术研发人员:彭冲程兵
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1