机器学习排名和预测校准制造技术

技术编号:38927739 阅读:21 留言:0更新日期:2023-09-25 09:34
方法、系统和装置,包括在计算机存储介质上编码的用于训练和使用机器学习(ML)模型的计算机程序。在一个方面,一种方法包括接收数字组件请求。第一ML模型可以输出指示数字组件的正结果的可能性的分数。输入数据可以被提供给第二ML模型,并且可以包括基于输出分数选择的数字组件子集的特征值。第二ML模型可以被训练以至少部分地基于将作为推荐一起提供的数字组件的特征值来输出数字组件的参与预测和/或排名,并且可以产生包括数字组件子集中的数字组件的排名和参与预测的第二输出。可以基于第二输出提供至少一个数字组件。第二输出提供至少一个数字组件。第二输出提供至少一个数字组件。

【技术实现步骤摘要】
【国外来华专利技术】机器学习排名和预测校准


[0001]本说明书涉及用于推荐系统的机器学习排名和预测校准。

技术介绍

[0002]推荐或用户交互率(UIR)预测模型通常使用逻辑回归来训练,最小化预测的正结果或点击概率的对数损失。这样的技术可以被用于预测目标变量的概率,例如,推荐将具有正结果的概率。

技术实现思路

[0003]通常,本说明书描述了用于在推荐机器学习模型中使用机器学习校准来捕获由将与示例一起推荐的其他示例引起的对该示例的标签结果的影响的系统、方法和技术。这些技术可以被用于基于内容选择过程的推荐(CSPBR)系统和其他类型的推荐系统,特别是但不限于在推荐中存在两个或更多个要满足、改进或优化的目标的推荐系统。
[0004]提高排名的准确性在推荐系统中是重要的。推荐系统可以基于与项目、其预期用途、该用途中的过去表现、其用户和/或其他信息相关的一个或多个度量来预测一组项目中的每个项目的评级或其他分数,并使用这些评级/分数来提供推荐。例如,给定关于在制造过程中一起使用的组件的效率的适当数据,适当训练的推荐系统可以提供能够被用于完成该过程的一组排名的组件。注意,在这种情况下,选择要使用的组件可以是相互依赖的,即,一个组件的选择可以影响其他所选则的组件的效率。
[0005]使用逻辑回归来训练推荐机器学习模型可能不是最佳的。实际模型可能被错误指定,并且被优化以预测个人参与率的特征之间的信用属性可能会对排名产生负影响。因此,模型设计者无法访问的特征的影响被边缘化,导致在训练群体上被平均化的预测,即使该群体是异质的。
[0006]测量响应于相同请求而推荐的示例(例如,项目)之间的成对或逐列表关系的附加排名损失可以部分地解决该效果,具体地,仅将排名相关的梯度更新推送到区分共同推荐集合中的不同示例(即,一起推荐的示例)的模型特征,而不是一起推荐的所有示例共有的特征。该技术由于改进排名而不是改进每个单独示例预测准确度而平衡错误设定(misspecification)。
[0007]然而,这种方法仍然不能解决主要的错误设定问题:模型特征可能无法捕获一个项目对另一个项目的影响。另外,由于在推断时缺乏关于哪些项目在同一请求上被共同推荐的知识,因此该方法仍然不能帮助生成在存在与给定项目一起呈现的其他项目的情况下更好地对给定项目的行为进行建模的预测。在已经对推荐项目集合进行了预测之后,这些项目的知识通常是反事实的。
[0008]本文档中描述的排名和预测校准技术可以被用于改进与交互式内容相关的推荐。例如,当确定结合搜索结果或其他数字内容推荐哪些项目(例如,数字组件或搜索结果)以及在什么位置时,候选项目的排名可以比由用于预测项目的性能(例如,交互或参与率)的
机器学习模型产生的实际分数更重要(或同样重要)。排名最高的项目可以被推荐用于最突出的位置,并且排名依次更低的项目可以被推荐用于较不突出的位置。此外,项目的排名可能受到其他推荐项目的影响。
[0009]可以实现本说明书中描述的主题的特定实施例,以便实现以下优点中的一个或多个。本文档中描述的技术可以在推荐系统中使用,以通过允许校准以捕获在知晓共同推荐的项目之前未被初始推断捕获的信号来提高排名和评分项目准确性,导致更有效的推荐。此外,本文档中描述的技术不仅可以被用于改进排名,而且可以被用于改进一起推荐的一组组件的交互或参与概率的预测准确性。另外,当确定由第一资源更密集的机器学习模型初始选择的项目之间的排名时,在通过使用第二资源更不密集的校准模型来限制计算资源的情况下可以使用该技术。
[0010]另外,本说明书中描述的校准技术减少了不会导致用户参与的共同显示的内容的分布,从而减少了浪费的资源。所描述的技术减少了分发这样的内容所花费的资源量,并且更有效地跨网络提供内容。换句话说,计算资源(诸如网络带宽、处理器周期和/或分配的存储器)不通过使用这些资源来分发不应该被分发或将不被内容分发到的实体消耗的内容而被浪费。
[0011]此外,本说明书中描述的技术减少了产生预测所需的资源。具体地,使用比初级模型需要更少的计算资源(例如,更少的处理器周期和/或更少的存储器来存储模型和/或使用该模型计算的中间值)的第二校准模型来改善初级模型的预测。与运行初级模型两次相比,校准模型可以更快地执行并且使用更少的存储器。初级模型可以选择要推荐的一组项目而不对项目进行排名,并且第二更轻量级校准模型可以仅对所选择的项目运行,并且通过使用选择哪些项目的知识,产生比在知晓该组所选择的项目之前可以产生的更准确的预测,包括项目的排名。更准确的排名可以增加用户将参与所选择的项目的可能性和/或使得系统能够选择所选择的项目的子集,如果提供所选择的项目的子集,则用户更可能与所选择的项目进行交互。
[0012]一个方面的特征在于接收数字组件请求。包括数字组件集合中的每个数字组件的特征的特征值的第一输入数据可以作为输入被提供给第一机器学习模型。第一输入数据可以包括数字组件集合中的每个数字组件的特征的特征值。第一机器学习模型可以被训练以针对每个数字组件输出指示数字组件的正结果的可能性的分数,其中正结果可以指示当在设备上显示时用户与数字组件交互或可能与数字组件交互。可以使用第一机器学习模型来处理第一输入数据。第一机器学习模型的第一输出可以被接收,并且第一输出可以包括数字组件集合中的数字组件的相应分数。第二输入数据可以包括基于数字组件集合中的数字组件的相应分数选择的、数字组件子集中的每个数字组件的特征的特征值。第二输入数据可以作为输入被提供给第二机器学习模型。第二机器学习模型可以被训练以至少部分地基于将作为推荐一起提供的数字组件的特征的特征值来输出数字组件的排名。推荐可以是要在设备上显示的数字组件的推荐。可以使用第二机器学习模型来处理第二输入数据。第二机器学习模型的第二输出可以被接收,并且第二机器学习模型的第二输出包括数字组件子集中的数字组件的排名。可以基于第二排名来提供数字组件子集中的至少一个数字组件。
[0013]可以包括以下特征中的一个或多个。第二机器学习模型可以是与第一机器学习模型相同的机器学习模型。第二机器学习模型可以是与第一机器学习模型不同的机器学习模
型。第二机器学习模型可以与第一机器学习模型不同地被训练。当处理与第一机器学习模型相同的输入时,第二机器学习模型可以比第一机器学习模型执行更少的指令来处理相同的输入。第二机器学习模型可以在训练示例上被训练,训练示例包括已经作为推荐一起提供的共同推荐的数字组件集合的特征。
[0014]可以从包括共同推荐的数字组件的训练示例中选择第一多个训练示例。第一多个训练示例中的一个或多个特征可以被修改,并且修改一个或多个特征中的特征可以包括移除关于共同推荐项目的信息。第一多个训练示例可以被添加到训练示例。
[0015]第一机器学习模型可以产生梯度,并且梯度可以被传播到多个数字组件嵌入。数字组件嵌入可以表示共同推荐的数字组件的特征。第一机器学习模型可以处理包括边缘化嵌入的输入,边缘化嵌入表示第一特征相对于第二特征的贡献的边际贡献,并且本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现的方法,包括:接收数字组件请求;提供第一输入数据作为第一机器学习模型的输入,第一输入数据包括数字组件集合中的每个数字组件的特征的特征值,其中,第一机器学习模型被训练为针对每个数字组件输出指示所述数字组件的正结果的可能性的分数;使用第一机器学习模型处理第一输入数据;接收数字组件集合中的数字组件的相应分数作为第一机器学习模型的第一输出;提供第二输入数据作为第二机器学习模型的输入,第二输入数据包括基于所述数字组件集合中的数字组件的相应分数选择的数字组件子集中的每个数字组件的特征的特征值,其中,第二机器学习模型被训练为至少部分地基于将作为推荐一起提供的数字组件的特征的特征值来输出数字组件的排名;使用第二机器学习模型处理第二输入数据;接收数字组件子集中的数字组件的排名作为第二机器学习模型的第二输出;以及基于第二排名来提供所述数字组件子集中的至少一个数字组件。2.根据权利要求1所述的计算机实现的方法,其中,第二机器学习模型是与第一机器学习模型相同的机器学习模型。3.根据权利要求1所述的计算机实现的方法,其中,第二机器学习模型是与第一机器学习模型不同的机器学习模型,并且其中,第二机器学习模型已经与第一机器学习模型不同地被训练。4.根据权利要求3所述的方法,其中,当处理与所述第一机器学习模型相同的输入时,第二机器学习模型比第一机器学习模型执行更少的指令来处理所述相同的输入。5.根据任一前述权利要求所述的方法,其中,第二机器学习模型在训练示例上被训练,所述训练示例包括已经作为推荐被一起提供的共同推荐的数字组件集合的特征。6.根据权利要求5所述的方法,还包括:从包括共同推荐的数字组件的训练示例中选择第一多个训练示例;修改第一多个训练示例中的一个或多个特征...

【专利技术属性】
技术研发人员:G
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1