一种模型训练和信息推荐的方法、装置、存储介质及设备制造方法及图纸

技术编号:38049628 阅读:11 留言:0更新日期:2023-06-30 11:15
本说明书公开了一种模型训练和信息推荐的方法、装置、存储介质及设备。该模型训练的方法包括:获取样本数据,将第一独有数据、第二独有数据以及共享数据分别输入预测模型中的对应的特征提取层中,将得到的第一独有特征与共享特征输入目标业务场景对应的决策层中,得到第一预测结果,将第二独有特征与共享特征输入其他业务场景对应的决策层中,得到第二预测结果,以及,将共享特征输入预测模型中的共享决策层中,得到第三预测结果,根据第一预测结果、第二预测结果和第三预测结果,以及第一标签、第二标签和共享标签,对预测模型进行训练。对预测模型进行训练。对预测模型进行训练。

【技术实现步骤摘要】
一种模型训练和信息推荐的方法、装置、存储介质及设备


[0001]本说明书涉及计算机
,尤其涉及一种模型训练和信息推荐的方法、装置、存储介质及设备。

技术介绍

[0002]为了向用户提供更多便利,业务应用的客户端通常会包含有多个业务场景,从而为用户提供不同业务场景下的服务,如搜索场景、列表推荐场景以及折扣推荐场景等,这些不同的业务场景能够满足用户不同的浏览需求,从而提高用户体验。
[0003]由于为不同业务场景部署单独的预测模型并进行训练的方法会耗费大量资源,在目前的方法中,输入数据的数据结构相同或相近且优化目标相同的业务场景通常会使用一个共同的预测模型并进行训练,但是对于输入数据的数据结构差异较大的或是训练目标不同的业务场景并不能共用一个模型,仍然需要部署单独的模型进行训练,这就无法有效的降低模型的训练成本以及后续的维护成本。例如,对于输入的数据为搜索词的业务场景和输入数据为商品属性信息的业务场景来说,由于文本数据与属性数据为不同维度下的两种数据,所以这两个业务场景无法共用一个模型。
[0004]因此,如何使客户端中所需数据的数据结构不同的各业务场景公用一个模型并进行训练,有效降低模型训练成本以及维护成本,是一个亟待解决的问题。

技术实现思路

[0005]本说明书提供一种模型训练和信息推荐的方法、装置、存储介质及设备,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:
[0007]本说明书提供了一种模型训练的方法,包括:
[0008]获取样本数据,所述样本数据包含第一独有数据、第二独有数据以及共享数据,所述第一独有数据为目标业务场景下的特有业务数据,所述第二独有数据为其他业务场景下的特有业务数据,所述共享数据为在所述目标业务场景和所述其他业务场景中共有的业务数据;
[0009]将所述第一独有数据输入到预测模型中与所述目标业务场景对应的特征提取层中,得到第一独有特征,将所述第二独有数据输入所述预测模型中与其他业务场景对应的特征提取层中,得到第二独有特征,以及,将所述共享数据输入所述预测模型中的共享特征提取层中,得到共享特征;
[0010]将所述第一独有特征与所述共享特征输入所述目标业务场景对应的决策层中,得到第一预测结果,将所述第二独有特征与所述共享特征输入所述其他业务场景对应的决策层中,得到第二预测结果,以及,将所述共享特征输入所述预测模型中的共享决策层中,得到第三预测结果;
[0011]根据所述第一预测结果、所述第二预测结果和所述第三预测结果,以及所述第一
独有数据对应的第一标签、所述第二独有数据对应的第二标签以及所述共享数据对应的共享标签,对所述预测模型进行训练。
[0012]可选地,所述共享特征提取层包括:所述目标业务场景对应的第一子网络、所述其他业务场景对应的第二子网络以及共享子网络;
[0013]将所述共享数据输入所述预测模型中的共享特征提取层中,得到共享特征,具体包括:
[0014]将所述共享数据分别输入所述第一子网络、所述第二子网络以及所述共享子网络,得到所述第一子网络输出的特征向量、所述第二子网络输出的特征向量以及所述共享子网络输出的特征向量;
[0015]根据所述第一子网络输出的特征向量、所述第二子网络输出的特征向量以及所述共享子网络输出的特征向量,确定所述共享特征。
[0016]可选地,根据所述第一子网络输出的特征向量、所述第二子网络输出的特征向量以及所述共享子网络输出的特征向量,确定所述共享特征,具体包括:
[0017]根据所述第一子网络输出的特征向量、所述共享子网络输出的特征向量和所述目标业务场景对应的场景权重,确定第一子共享特征,以及,根据所述第二子网络输出的特征向量、所述共享子网络输出的特征向量和所述其他业务场景对应的场景权重,确定第二子共享特征;
[0018]根据所述第一子共享特征以及所述第二子共享特征,确定所述共享特征。
[0019]可选地,所述预测模型中还包括:关联特征提取层;
[0020]所述方法还包括:
[0021]获取用户在各业务场景下的历史行为信息;
[0022]根据所述历史行为信息,构建所述用户的历史行为序列;
[0023]将所述历史行为序列,以及所述历史行为序列中各历史行为对应业务场景的场景标识输入所述关联特征提取层,确定各业务场景之间的关联特征。
[0024]可选地,根据所述第一子共享特征以及所述第二子共享特征,确定所述共享特征,具体包括:
[0025]根据所述第一子共享特征、所述第二子共享特征以及所述关联特征,确定所述共享特征。
[0026]可选地,根据所述第一预测结果、所述第二预测结果和所述第三预测结果,以及所述第一独有数据对应的第一标签、所述第二独有数据对应的第二标签以及所述共享数据对应的共享标签,对所述预测模型进行训练,具体包括:
[0027]根据所述第一预测结果与所述第一标签之间的偏差和所述第二预测结果与所述第二标签之间的偏差,确定所述预测模型的第一损失值,以及,根据所述第三预测结果与所述共享标签之间的偏差,确定所述预测模型的第二损失值;
[0028]根据所述第一损失值和所述第一损失值对应的权重,以及所述第二损失值和所述第二损失值对应的权重,确定综合损失值,其中,所述第一损失值对应的权重越大,所述第二损失值对应的权重越小;
[0029]以最小化所述综合损失值为优化目标,对所述预测模型进行训练。
[0030]本说明书提供了一种信息推荐的方法包括:
[0031]获取当前业务场景对应的业务数据;
[0032]将所述业务数据输入预先训练的预测模型中,以通过所述预测模型,预测用户针对所述当前业务场景中的各待推荐信息所产生的业务行为,作为预测结果,其中,所述预测模型是通过上述模型训练的方法训练得到的;
[0033]根据所述预测结果,在所述当前业务场景下向所述用户进行信息推荐。
[0034]本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法。
[0035]本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。
[0036]本说明书采用的上述至少一个技术方案能够达到以下有益效果:
[0037]在本说明书提供的模型训练的方法中,服务器获取样本数据,将第一独有数据、第二独有数据以及共享数据分别输入预测模型中的对应的特征提取层中,将得到的第一独有特征与共享特征输入目标业务场景对应的决策层中,得到第一预测结果,将第二独有特征与共享特征输入其他业务场景对应的决策层中,得到第二预测结果,以及,将共享特征输入预测模型中的共享决策层中,得到第三预测结果,根据第一预测结果、第二预测结果和第三预测结果,以及第一标签、第二标签和共享标签,对预测模型进行训本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型训练的方法,其特征在于,包括:获取样本数据,所述样本数据包含第一独有数据、第二独有数据以及共享数据,所述第一独有数据为目标业务场景下的特有业务数据,所述第二独有数据为其他业务场景下的特有业务数据,所述共享数据为在所述目标业务场景和所述其他业务场景中共有的业务数据;将所述第一独有数据输入到预测模型中与所述目标业务场景对应的特征提取层中,得到第一独有特征,将所述第二独有数据输入所述预测模型中与其他业务场景对应的特征提取层中,得到第二独有特征,以及,将所述共享数据输入所述预测模型中的共享特征提取层中,得到共享特征;将所述第一独有特征与所述共享特征输入所述目标业务场景对应的决策层中,得到第一预测结果,将所述第二独有特征与所述共享特征输入所述其他业务场景对应的决策层中,得到第二预测结果,以及,将所述共享特征输入所述预测模型中的共享决策层中,得到第三预测结果;根据所述第一预测结果、所述第二预测结果和所述第三预测结果,以及所述第一独有数据对应的第一标签、所述第二独有数据对应的第二标签以及所述共享数据对应的共享标签,对所述预测模型进行训练。2.如权利要求1所述的方法,其特征在于,所述共享特征提取层包括:所述目标业务场景对应的第一子网络、所述其他业务场景对应的第二子网络以及共享子网络;将所述共享数据输入所述预测模型中的共享特征提取层中,得到共享特征,具体包括:将所述共享数据分别输入所述第一子网络、所述第二子网络以及所述共享子网络,得到所述第一子网络输出的特征向量、所述第二子网络输出的特征向量以及所述共享子网络输出的特征向量;根据所述第一子网络输出的特征向量、所述第二子网络输出的特征向量以及所述共享子网络输出的特征向量,确定所述共享特征。3.如权利要求2所述的方法,其特征在于,根据所述第一子网络输出的特征向量、所述第二子网络输出的特征向量以及所述共享子网络输出的特征向量,确定所述共享特征,具体包括:根据所述第一子网络输出的特征向量、所述共享子网络输出的特征向量和所述目标业务场景对应的场景权重,确定第一子共享特征,以及,根据所述第二子网络输出的特征向量、所述共享子网络输出的特征向量和所述其他业务场景对应的场景权重,确定第二子共享特征;根据所述第一子共享特征以及所述第二子共享特征,确定所述共享特征。4.如权利要求3所述的方法,其特征在于,所述预测模型中还包括:关联特征提取层;所述方法还包括:获取用户在各业务场景下的历史行为信息;根据所述历史行为信息,构建所述用户的历史行为序列;将所述历史行为序列,以及所述历史行为序列中各历史行为对应业务场景的场景标识输入所述关联特征提取层,确定各业务场景之间的关联特征。5.如权利要求4所述的方法,其特征在于,根据所述第一子共享特征以及所述第二子共
享特征,确定所述共享特征,具体包括:根据所述第一子共享...

【专利技术属性】
技术研发人员:余永斌刘晓玮陈华杰何吉元冯涛刘铭
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1