【技术实现步骤摘要】
推荐模型的训练方法、推荐方法、装置、服务器及介质
[0001]本公开涉及信息推荐
,尤其涉及一种推荐模型的训练方法、推荐方法、装置、服务器及存储介质。
技术介绍
[0002]随着信息推荐技术的发展,出现了一种利用神经网络模型实现信息推荐的技术,通过对推荐模型进行训练,在对用户进行信息推荐时,可以将推荐信息的特征以及用户的特征输入模型中,由模型输出用户访问各推荐信息的概率,从而可以为用户提供高契合度的推荐信息。
[0003]相关技术中,目前的推荐模型中,在得到推荐信息的特征以及用户的特征后,可以将上述特征按照一定的方式跳跃输入至推荐模型各层级的网络中,然而,目前这种跳跃输入方式的设置一般需要通过大量实验的方式确定得到,因此,训练出的推荐模型灵活性较低。
技术实现思路
[0004]本公开提供一种推荐模型的训练方法、推荐方法、装置、服务器及存储介质,以至少解决相关技术中训练出的推荐模型灵活性较低的问题。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种推荐模型的训练方法,包括:获取训练样本数据 ...
【技术保护点】
【技术特征摘要】
1.一种推荐模型的训练方法,其特征在于,包括:获取训练样本数据;所述训练样本数据包括样本账户的样本账户特征,样本推荐信息的样本信息特征,以及所述样本账户针对于所述样本推荐信息的实际访问结果;将所述样本账户特征以及所述样本信息特征输入待训练的推荐模型,得到所述样本账户针对于所述样本推荐信息的预测访问结果;其中,所述推荐模型具有门控结构,所述门控结构对应的门控参数的实际值用于指示将输入至所述推荐模型的样本账户特征以及所述样本信息特征跳跃输入至所述推荐模型中的至少一个指定隐藏层;基于所述预测访问结果和所述实际访问结果,确定第一损失函数的值,以及,基于所述门控参数的实际值和所述门控参数的期望值,确定第二损失函数的值;基于所述第一损失函数的值和所述第二损失函数的值,确定总损失值;基于所述总损失值,更新所述推荐模型和所述门控参数,以得到训练完成的推荐模型。2.根据权利要求1所述的方法,其特征在于,所述样本账户特征以及所述样本信息特征的数量为多个;所述获取训练样本数据之后,还包括:从所述样本账户特征或者所述样本信息特征中,获取当前样本特征,以及获取所述当前样本特征对应的第一子参数;所述第一子参数用于表征所述当前样本特征的重要程度;确定所述当前样本特征针对所述推荐模型中指定隐藏层的第二子参数;所述第二子参数用于表征所述当前样本特征跳跃输入至所述推荐模型中指定隐藏层的重要程度;根据所述第一子参数,以及所述第二子参数,得到所述当前样本特征针对所述推荐模型中指定隐藏层的门控结构对应的门控参数的实际值。3.根据权利要求2所述的方法,其特征在于,所述将所述样本账户特征以及所述样本信息特征输入待训练的推荐模型,得到所述样本账户针对于所述样本推荐信息的预测访问结果,包括:根据所述当前样本特征针对所述推荐模型中指定隐藏层的门控结构对应的门控参数的实际值,确定所述当前样本特征针对所述推荐模型中指定隐藏层的输入幅度;将所述当前样本特征输入至所述推荐模型的输入层,以及按照所述输入幅度对所述当前样本特征进行加权处理,并将加权后的当前样本特征跳跃输入至所述推荐模型中指定隐藏层,得到所述预测访问结果。4.根据权利要求2所述的方法,其特征在于,所述基于所述总损失值,更新所述推荐模型和所述门控参数,包括:基于所述总损失值,更新所述当前样本特征对应的第一子参数,以及所述当前样本特征针对所述推荐模型中指定隐藏层的第二子参数,以更新所述当前样本特征针对所述推荐模型中指定隐藏层的门控结构对应的门控参数的实际值。5.根据权利要求1所述的方法,其特征在于,所述基于所述第一损失函数的值和所述第二损失函数的值,确定总损失值,包括:获取针对于所述推荐模型的模型训练信息;根据所述模型训练信息,调整所述第二损失函数的值对所述总损失值的影响比重。6.根据权利要求5所述的方法,其特征在于,所述模型训练信息包括所述推荐模型的训练步数;所述根据所述模型训练信息,调整所述第二损失函数的值对所述总损失值的影响比
重,包括:获取与所述第一损失函数对应的第一权重,以及根据所述训练步数,确定所述第二损失函数对应的第二权重;按照所述第一权重以及所述第二权重,对所述第一损失函数的值和所述第二损失函数的值进行加权求和,得到所述总损失值。7.根据权利要求6所述的方法,其特征在于,所述根据所述训练步数,确定所述第二损失函数对应的第二权重,包括:随着所述训练步数的增加,控制所述第二权重的值由初始值逐渐增加,直至所述第二权重的值到达预设阈值;所述初始值为首次对所述推荐模型进行训练时所述第二权重的值。8.根据权利要求7所述的方法,其特征在于,所述根据所述训练步数,确定所述第二损失函数对应的第二权重,包括:在所述第二权重的值到达所述预设阈值后,当检测到所述总损失值大于或者等于预设的损失值阈值,或者,检测到所述推荐模型的推荐准确率小于或者等于预设的准确率阈值时,将所述第二权重的值重新置为所述初始值;在将所述第二权重的值保持为所述初始值,并对所述推荐模型进行预设训练步数的训练后,随着所述训练步数的增加,控制所述第二权重的值由所述初始值逐渐增大,直至所述第二权重的值重新到达所述预设阈值。9.一种推荐方法,其特征在于,包括:响应于信息推荐请求,获取与所述信息推荐请求对应的目标账户的账户特征,以及各候选推荐信息的信息特征;将所述账户特征以及所述信息特征输入至所述训练完成的推荐模型,得到所述目标账户针对所述各候选推荐信息的预测访问结果;其中,所述推荐模型通过如权利要求1至8中任一项所述的推荐模型的训练方法得到;根据所述预测访问结果,从所述各候选推荐信息中筛选出针对所述目标账户的目标推荐信息,并将所述目标推荐信息推荐至所述目标账户。10.一种推荐模型的训练装置,其特征在于,包括:训练样本获取单元,被配置为执行获取训练样本数据;所述训练样本数据包括样本账户的样本账户特征,样本推荐信息的样本信息特征,以及所述样本账户针对于所述样本推荐信息的实际访问结果;预测结...
【专利技术属性】
技术研发人员:贾纪元,李吉祥,廖超,杨森,
申请(专利权)人:北京达佳互联信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。