一种物料推荐系统的优化方法及装置制造方法及图纸

技术编号：38567700 阅读：8 留言：0更新日期：2023-08-22 21:04

本发明专利技术实施例提供一种物料推荐系统的优化方法及装置，所述物料推荐系统包括用于物料召回阶段的召回模型、用于物料粗排阶段的粗排模型和用于物料精排阶段的精排模型，所述优化方法包括：构造初始优化模型；从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集；使用所述物料样本集对所述初始优化模型进行迭代训练，得到训练后的优化模型；使用训练后的优化模型更新在线使用的物料推荐系统的召回模型和粗排模型。本技术方案中，通过优化模型直接学习精排多个目标模型融合的输出结果，使得在优化后的推荐系统中，召回阶段模型与粗排阶段模型能够自适应对齐精排阶段模型，从而保证了全链路的一致性。从而保证了全链路的一致性。从而保证了全链路的一致性。

全部详细技术资料下载

【技术实现步骤摘要】
一种物料推荐系统的优化方法及装置

[0001]本专利技术涉及网络
，具体涉及一种物料推荐系统的优化方法及装置。

技术介绍

[0002]当前的广告推荐系统，为了达到算力和效果之间的平衡，如图1所示，通常是由包含召回、粗排、精排等各阶段组成的级联架构，由于整个链路低耗时的要求，每个阶段只会把自己排序的top N给到后续模块。召回阶段作为整个链路的入口，需要从百万、千万级别的物料库中筛选出万级别的物料，因此召回的时延压力最大，会使用一些简单的策略或者模型。粗排阶段作为承接召回阶段和精排阶段的中间过程，负责从召回的结果中选出符合精排需要的千级别的候选集，排序的压力相对于召回阶段小的多，通常会尝试更复杂的模型和目标。精排阶段从粗排阶段的结果中排序选出用户最可能感兴趣的内容，基于对精度的高要求以及时延压力相对较小，精排阶段采用整个链路中最复杂的模型。
[0003]由于算力和耗时的限制，现有技术在召回和粗排阶段，会使用较精排模型少得多的特征，基于用户的真实行为数据，训练基于较为简单的双塔(DSSM)模型来作为服务模型，双塔将用户与物料解耦成两部分，两部分的神经网络独立，双塔模型的结构如图2所示。双塔模型线上服务时，推荐引擎会实时进行特征工程形成用户侧特征，将用户侧特征id传给模型生成用户向量(embedding)，物料侧特征往往采用离线更新的方式，以<物料id，物料向量>方式离线存储起来，当用户请求过来时，分别取到用户向量和物料向量，两者通过点积过sigmoid函数算分进行排序。
...

【技术保护点】

【技术特征摘要】
1.一种物料推荐系统的优化方法，其特征在于，所述物料推荐系统包括用于物料召回阶段的召回模型、用于物料粗排阶段的粗排模型和用于物料精排阶段的精排模型，所述优化方法包括：基于在线使用的物料推荐系统的召回模型和粗排模型构造初始优化模型；从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集，所述物料样本的类型包括正样本和负样本，所述正样本为从所述在线使用的物料推荐系统的物料精排阶段输出结果中采集的物料样本，所述负样本非从所述物料精排阶段输出结果中采集的物料样本；使用所述物料样本集对所述初始优化模型进行迭代训练，在每次迭代训练过程中，将所述物料样本输入所述初始优化模型，得到输出的样本向量和样本预测值；基于所述样本向量、所述物料样本的类型标签、所述样本预测值以及损失函数对所述初始优化模型的模型参数进行调整，直至满足预设收敛条件得到训练后的优化模型；使用所述训练后的优化模型更新所述在线使用的物料推荐系统的召回模型和粗排模型。2.如权利要求1所述的物料推荐系统的优化方法，其特征在于，所述从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集，具体包括：采用如下方式中至少之一获取所述负样本：从所述物料库中随机采集第一预设数量的物料样本作为所述负样本，从所述在线使用的物料推荐系统的物料召回阶段输出结果中随机采集第二预设数量的物料样本作为所述负样本，从所述在线使用的物料推荐系统的物料粗排阶段输出结果中随机采集第三预设数量的物料样本作为所述负样本；从所述在线使用的物料推荐系统的物料精排阶段输出结果中，按排序自前向后的顺序采集第四预设数量的物料样本，作为所述正样本。3.如权利要求1所述的物料推荐系统的优化方法，其特征在于，所述使用所述训练后的优化模型更新所述在线使用的物料推荐系统的召回模型和粗排模型，包括：将所述训练后的优化模型与所述在线使用的物料推荐系统的召回模型和粗排模型相串联，或，使用所述训练后的优化模型替代所述在线使用的物料推荐系统中的召回模型和粗排模型。4.如权利要求1所述的物料推荐系统的优化方法，其特征在于，所述将所述物料样本输入所述初始优化模型，得到输出的样本向量和样本预测值，包括：从所述物料样本中提取用户特征和物料特征；将所述用户特征和所述物料特征输入所述初始优化模型，得到输出的样本向量和样本预测值，所述样本向量包括用户特征向量和物料特征向量，所述样本预测值用于表征所述初始优化模型对所述物料样本的类型预测结果；所述基于所述样本向量、所述物料样本的类型标签、所述样本预测值以及损失函数对所述初始优化模型的模型参数进行调整，直至满足预设收敛条件得到训练后的优化模型，包括：根据所述用户特征向量和所述物料特征向量计算向量内积；基于所述向量内积计算交叉熵损失函数的第一函数值；确定所述物料样本的权重，并根据物料样本的类型标签、物料样本的样本预测值、所述
第一函数值与所述权重计算模型损失函数的第二函数值，所述类型标签用于表征所述物料样本的类型；根据所述第二函数值调整所述初始优化模型的模型参数，以对所述初始优化模型进行更新，直至所述初始优化模型的模型评估指标满足收敛条件，得到所述训练后的优化模型。5.如权利要求4所述的物料推荐系统的优化方法，其特征在于，所述确定所述物料样本的权重，并根据物料样本的类型标签、物料样本的样本预测值、所述第一函数值与所述权重计算模型损失函数的第二函数值，采用以下公式进行：loss＝weight*original_loss；original_loss＝
‑
[y
label
*log y
predict
+(1
‑
y
label
)*log(1
‑
y
predict
)]；其中，loss为模型损失函数...

【专利技术属性】
技术研发人员：高峰，吴玥，高家华，
申请(专利权)人：微梦创科网络科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人