一种物料推荐系统的优化方法及装置制造方法及图纸

技术编号:38567700 阅读:8 留言:0更新日期:2023-08-22 21:04
本发明专利技术实施例提供一种物料推荐系统的优化方法及装置,所述物料推荐系统包括用于物料召回阶段的召回模型、用于物料粗排阶段的粗排模型和用于物料精排阶段的精排模型,所述优化方法包括:构造初始优化模型;从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集;使用所述物料样本集对所述初始优化模型进行迭代训练,得到训练后的优化模型;使用训练后的优化模型更新在线使用的物料推荐系统的召回模型和粗排模型。本技术方案中,通过优化模型直接学习精排多个目标模型融合的输出结果,使得在优化后的推荐系统中,召回阶段模型与粗排阶段模型能够自适应对齐精排阶段模型,从而保证了全链路的一致性。从而保证了全链路的一致性。从而保证了全链路的一致性。

【技术实现步骤摘要】
一种物料推荐系统的优化方法及装置


[0001]本专利技术涉及网络
,具体涉及一种物料推荐系统的优化方法及装置。

技术介绍

[0002]当前的广告推荐系统,为了达到算力和效果之间的平衡,如图1所示,通常是由包含召回、粗排、精排等各阶段组成的级联架构,由于整个链路低耗时的要求,每个阶段只会把自己排序的top N给到后续模块。召回阶段作为整个链路的入口,需要从百万、千万级别的物料库中筛选出万级别的物料,因此召回的时延压力最大,会使用一些简单的策略或者模型。粗排阶段作为承接召回阶段和精排阶段的中间过程,负责从召回的结果中选出符合精排需要的千级别的候选集,排序的压力相对于召回阶段小的多,通常会尝试更复杂的模型和目标。精排阶段从粗排阶段的结果中排序选出用户最可能感兴趣的内容,基于对精度的高要求以及时延压力相对较小,精排阶段采用整个链路中最复杂的模型。
[0003]由于算力和耗时的限制,现有技术在召回和粗排阶段,会使用较精排模型少得多的特征,基于用户的真实行为数据,训练基于较为简单的双塔(DSSM)模型来作为服务模型,双塔将用户与物料解耦成两部分,两部分的神经网络独立,双塔模型的结构如图2所示。双塔模型线上服务时,推荐引擎会实时进行特征工程形成用户侧特征,将用户侧特征id传给模型生成用户向量(embedding),物料侧特征往往采用离线更新的方式,以<物料id,物料向量>方式离线存储起来,当用户请求过来时,分别取到用户向量和物料向量,两者通过点积过sigmoid函数算分进行排序。
[0004]在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:
[0005]推荐系统通常会有点击、互动、时长等目标,精排阶段由于算力投入大,可以同时兼顾多个目标,训练多个模型进行服务,且新增目标模型代价低,但召回和粗排阶段,新增目标代价较大,由于算力的限制,在特征方面,只能使用较为简单的双塔模型,致使召回和粗排的模型表达能力会比精排差的多,通常会产生和精排阶段目标模型不一致的情况,从而导致整个链路的不一致性。最直接的表现就是,召回和粗排排序后,会把一些精排阶段模型排序靠前的内容排在了靠后的位置,由于整个链路低耗时的要求,召回和粗排阶段只会把自己排序靠前的结果输出给到精排模型进行排序,这就导致了一些本来能够在精排模型排序靠前的内容被过滤掉了,从而导致这部分优秀的内容无法展示给用户,降低了用户的使用体验。因此,如何优化推荐系统,从而提高推荐系统中整个链路的一致性,是需要解决的问题。

技术实现思路

[0006]本专利技术实施例提供一种物料推荐系统的优化方法及装置,用以解决现有推荐系统中存在的链路一致性差的问题。
[0007]为达上述目的,一方面,本专利技术实施例提供一种物料推荐系统的优化方法,所述物料推荐系统包括用于物料召回阶段的召回模型、用于物料粗排阶段的粗排模型和用于物料
精排阶段的精排模型,所述优化方法包括:基于在线使用的物料推荐系统的召回模型和粗排模型构造初始优化模型;从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集,所述物料样本的类型包括正样本和负样本,所述正样本为从所述在线使用的物料推荐系统的物料精排阶段输出结果中采集的物料样本,所述负样本非从所述物料精排阶段输出结果中采集的物料样本;使用所述物料样本集对所述初始优化模型进行迭代训练,在每次迭代训练过程中,将所述物料样本输入所述初始优化模型,得到输出的样本向量和样本预测值;基于所述样本向量、所述物料样本的类型标签、所述样本预测值以及损失函数对所述初始优化模型的模型参数进行调整,直至满足预设收敛条件得到训练后的优化模型;使用所述训练后的优化模型更新所述在线使用的物料推荐系统的召回模型和粗排模型。
[0008]另一方面,本专利技术实施例提供一种物料推荐系统的优化装置,包括:优化模型构建模块,用于基于在线使用的物料推荐系统的召回模型和粗排模型构造初始优化模型;其中,所述物料推荐系统包括用于物料召回阶段的召回模型、用于物料粗排阶段的粗排模型和用于物料精排阶段的精排模型;样本提取模块,用于从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集,所述物料样本的类型包括正样本和负样本,所述正样本为从所述在线使用的物料推荐系统的物料精排阶段输出结果中采集的物料样本,所述负样本非从所述物料精排阶段输出结果中采集的物料样本;模型训练模块,用于使用所述物料样本集对所述初始优化模型进行迭代训练,在每次迭代训练过程中,将所述物料样本输入所述初始优化模型,得到输出的样本向量和样本预测值;基于所述样本向量、所述物料样本的类型标签、所述样本预测值以及损失函数对所述初始优化模型的模型参数进行调整,直至满足预设收敛条件得到训练后的优化模型;模型更新模块,用于使用所述训练后的优化模型更新所述在线使用的物料推荐系统的召回模型和粗排模型。
[0009]同时,本专利技术实施例还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述的物料推荐系统的优化方法。
[0010]此外,本专利技术实施例还提供一种计算机设备,其包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现前述的物料推荐系统的优化方法。
[0011]上述技术方案具有如下有益效果:
[0012]本技术方案中的优化模型,采用与现有召回、粗排阶段相同结构的级联模型,该优化模型的引入,首先从样本上进行了创新,因为特征和模型结构的不足,没法具有和精排模型一样的能力,那优化模型就不去学习用户的行为特点(用户的行为特点通常变化莫测,不易学习),而是直接学习精排多个目标模型融合的输出结果,降低了模型的学习难度,有效解决了和精排模型不一致的问题。其次对优化模型训练中的损失函数计算方式进行了创新,进一步增强了级联模型的头部排序能力。因为优化模型只需要学习精排所有目标最终的融合排序结果,使其能够自适应对齐精排模型目标变化、节省训练和服务资源以及增加预估空间与问题建模空间一致性,改善样本选择偏差问题,从而增强了整个链路的一致性。
附图说明
[0013]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0014]图1是本专利技术实施例一种物料推荐系统的优化方法的流程图;
[0015]图2是本专利技术实施例一种物料推荐系统的优化装置的构成框架图;
[0016]图3是现有技术中推荐系统的架构示意图;
[0017]图4是现有技术中的双塔模型的结构示意图;
[0018]图5是本专利技术实施例中对待训练优化模型进行模型训练时的工作原理示意图。
具体实施方式
[0019]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种物料推荐系统的优化方法,其特征在于,所述物料推荐系统包括用于物料召回阶段的召回模型、用于物料粗排阶段的粗排模型和用于物料精排阶段的精排模型,所述优化方法包括:基于在线使用的物料推荐系统的召回模型和粗排模型构造初始优化模型;从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集,所述物料样本的类型包括正样本和负样本,所述正样本为从所述在线使用的物料推荐系统的物料精排阶段输出结果中采集的物料样本,所述负样本非从所述物料精排阶段输出结果中采集的物料样本;使用所述物料样本集对所述初始优化模型进行迭代训练,在每次迭代训练过程中,将所述物料样本输入所述初始优化模型,得到输出的样本向量和样本预测值;基于所述样本向量、所述物料样本的类型标签、所述样本预测值以及损失函数对所述初始优化模型的模型参数进行调整,直至满足预设收敛条件得到训练后的优化模型;使用所述训练后的优化模型更新所述在线使用的物料推荐系统的召回模型和粗排模型。2.如权利要求1所述的物料推荐系统的优化方法,其特征在于,所述从物料库和所述在线使用的物料推荐系统中获取预设数量的物料样本形成物料样本集,具体包括:采用如下方式中至少之一获取所述负样本:从所述物料库中随机采集第一预设数量的物料样本作为所述负样本,从所述在线使用的物料推荐系统的物料召回阶段输出结果中随机采集第二预设数量的物料样本作为所述负样本,从所述在线使用的物料推荐系统的物料粗排阶段输出结果中随机采集第三预设数量的物料样本作为所述负样本;从所述在线使用的物料推荐系统的物料精排阶段输出结果中,按排序自前向后的顺序采集第四预设数量的物料样本,作为所述正样本。3.如权利要求1所述的物料推荐系统的优化方法,其特征在于,所述使用所述训练后的优化模型更新所述在线使用的物料推荐系统的召回模型和粗排模型,包括:将所述训练后的优化模型与所述在线使用的物料推荐系统的召回模型和粗排模型相串联,或,使用所述训练后的优化模型替代所述在线使用的物料推荐系统中的召回模型和粗排模型。4.如权利要求1所述的物料推荐系统的优化方法,其特征在于,所述将所述物料样本输入所述初始优化模型,得到输出的样本向量和样本预测值,包括:从所述物料样本中提取用户特征和物料特征;将所述用户特征和所述物料特征输入所述初始优化模型,得到输出的样本向量和样本预测值,所述样本向量包括用户特征向量和物料特征向量,所述样本预测值用于表征所述初始优化模型对所述物料样本的类型预测结果;所述基于所述样本向量、所述物料样本的类型标签、所述样本预测值以及损失函数对所述初始优化模型的模型参数进行调整,直至满足预设收敛条件得到训练后的优化模型,包括:根据所述用户特征向量和所述物料特征向量计算向量内积;基于所述向量内积计算交叉熵损失函数的第一函数值;确定所述物料样本的权重,并根据物料样本的类型标签、物料样本的样本预测值、所述
第一函数值与所述权重计算模型损失函数的第二函数值,所述类型标签用于表征所述物料样本的类型;根据所述第二函数值调整所述初始优化模型的模型参数,以对所述初始优化模型进行更新,直至所述初始优化模型的模型评估指标满足收敛条件,得到所述训练后的优化模型。5.如权利要求4所述的物料推荐系统的优化方法,其特征在于,所述确定所述物料样本的权重,并根据物料样本的类型标签、物料样本的样本预测值、所述第一函数值与所述权重计算模型损失函数的第二函数值,采用以下公式进行:loss=weight*original_loss;original_loss=

[y
label
*log y
predict
+(1

y
label
)*log(1

y
predict
)];其中,loss为模型损失函数...

【专利技术属性】
技术研发人员:高峰吴玥高家华
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1