一种针对用户的干预执行方法、装置以及设备制造方法及图纸

技术编号:36978752 阅读:35 留言:0更新日期:2023-03-25 17:58
本说明书实施例公开了一种针对用户的干预执行方法、装置以及设备。方案包括:获取包含第一模型和第二模型的基础模型,所述第一模型用于预测对用户进行干预的情况下的转化率,所述第二模型用于预测未对用户进行干预的情况下的转化率;获取用户训练样本集合,并对所述用户训练样本集合中的各样本进行聚类,得到多个样本包;分别确定各所述样本包整体的期望干预增量和预测干预增量;根据所述期望干预增量和预测干预增量之间的一致性程度,为所述基础模型生成辅助损失;根据所述辅助损失,对所述基础模型进行训练;利用训练后的所述基础模型,对目标用户进行预测,并根据所述预测的结果,确定是否对所述目标用户进行干预。确定是否对所述目标用户进行干预。确定是否对所述目标用户进行干预。

【技术实现步骤摘要】
一种针对用户的干预执行方法、装置以及设备


[0001]本说明书涉及机器学习
,尤其涉及一种针对用户的干预执行方法、装置以及设备。

技术介绍

[0002]在线上业务中,为了提高用户转化率,往往要对用户主动进行干预,然而若是对全体用户都进行干预,则成本过高可能得不偿失,因此,往往会选择预期干预效果较好的小部分用户进行干预。那么如何精准地选择这小部分用户成了关键问题。
[0003]可以利用机器学习模型来预测是否适合对目标用户进行干预,但是,对于目前的一些机器学习模型,存在反事实标签问题,即对于同一个用户训练样本,无法同时观察到它在受干预的情况下的响应和未受干预的情况下的响应,在这种情况下,利用该用户训练样本训练机器学习模型,未必能够准确地学习到干预本身对该用户训练样本的响应的影响效应。
[0004]不仅如此,在实际应用中,相比于用户自身的特性和干预涉及的其他对象(比如,通过调整某商品的优惠,对某用户进行干预,则可以认为该商品属于该其他对象)本身的特征而言,这些特性集合起来能够带来的影响效应往往更强,而干预本身能够带来的影响效应往往是相对弱的,这种干预效应不显著的现象也阻碍了对这种相对弱的影响效应的充分学习。进而,导致了对用户选择的不准确性。
[0005]基于此,需要能够更准确的选择用户进行干预的方案。

技术实现思路

[0006]本说明书一个或多个实施例提供一种针对用户的干预执行方法、装置、设备以及存储介质,用以解决如下技术问题:需要能够更准确的选择用户进行干预的方案。
[0007]为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
[0008]本说明书一个或多个实施例提供的一种针对用户的干预执行方法,包括:
[0009]获取包含第一模型和第二模型的基础模型,所述第一模型用于预测对用户进行干预的情况下的转化率,所述第二模型用于预测未对用户进行干预的情况下的转化率;
[0010]获取用户训练样本集合,并对所述用户训练样本集合中的各样本进行聚类,得到多个样本包;
[0011]分别确定各所述样本包整体的期望干预增量和预测干预增量;
[0012]根据所述期望干预增量和预测干预增量之间的一致性程度,为所述基础模型生成辅助损失;
[0013]根据所述辅助损失,对所述基础模型进行训练;
[0014]利用训练后的所述基础模型,对目标用户进行预测,并根据所述预测的结果,确定是否对所述目标用户进行干预。
[0015]本说明书一个或多个实施例提供的一种针对用户的干预执行装置,包括:
[0016]基础模型获取模块,获取包含第一模型和第二模型的基础模型,所述第一模型用于预测对用户进行干预的情况下的转化率,所述第二模型用于预测未对用户进行干预的情况下的转化率;
[0017]训练样本聚类模块,获取用户训练样本集合,并对所述用户训练样本集合中的各样本进行聚类,得到多个样本包;
[0018]包级增量确定模块,分别确定各所述样本包整体的期望干预增量和预测干预增量;
[0019]辅助损失生成模块,根据所述期望干预增量和预测干预增量之间的一致性程度,为所述基础模型生成辅助损失;
[0020]基础模型训练模块,根据所述辅助损失,对所述基础模型进行训练;
[0021]用户干预决策模块,利用训练后的所述基础模型,对目标用户进行预测,并根据所述预测的结果,确定是否对所述目标用户进行干预。
[0022]本说明书一个或多个实施例提供的一种针对用户的干预执行设备,包括:
[0023]至少一个处理器;以及,
[0024]与所述至少一个处理器通信连接的存储器;其中,
[0025]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
[0026]获取包含第一模型和第二模型的基础模型,所述第一模型用于预测对用户进行干预的情况下的转化率,所述第二模型用于预测未对用户进行干预的情况下的转化率;
[0027]获取用户训练样本集合,并对所述用户训练样本集合中的各样本进行聚类,得到多个样本包;
[0028]分别确定各所述样本包整体的期望干预增量和预测干预增量;
[0029]根据所述期望干预增量和预测干预增量之间的一致性程度,为所述基础模型生成辅助损失;
[0030]根据所述辅助损失,对所述基础模型进行训练;
[0031]利用训练后的所述基础模型,对目标用户进行预测,并根据所述预测的结果,确定是否对所述目标用户进行干预。
[0032]本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
[0033]获取包含第一模型和第二模型的基础模型,所述第一模型用于预测对用户进行干预的情况下的转化率,所述第二模型用于预测未对用户进行干预的情况下的转化率;
[0034]获取用户训练样本集合,并对所述用户训练样本集合中的各样本进行聚类,得到多个样本包;
[0035]分别确定各所述样本包整体的期望干预增量和预测干预增量;
[0036]根据所述期望干预增量和预测干预增量之间的一致性程度,为所述基础模型生成辅助损失;
[0037]根据所述辅助损失,对所述基础模型进行训练;
[0038]利用训练后的所述基础模型,对目标用户进行预测,并根据所述预测的结果,确定是否对所述目标用户进行干预。
[0039]本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:基于包含第一模型和第二模型的双模型形式的基础模型,能够更为准确地度量干预本身带来的转化率增量(即影响效应),对基础模型的训练过程进行改进,通过将样本聚类形成样本包,基于样本包整体的期望干预增量和预测干预增量,来度量基础模型的损失,实现样本包级的训练,一方面,使得相似的多个样本中一部分样本在受干预的情况下表现,另一部分样本在未受干预的情况下表现,则可以近似地认为同时观察到了同一对象(样本包整体)在两种相斥情况下的表现,因此有助于解决反事实标签问题,另一方面,通过样本包将多个单样本对应的在干预下的影响效应积累起来了,从而相当于放大了干预下的影响效应,从而有助于充分学习;基于以上理由,由此训练后的基础模型能够更准确地选择用户进行干预。
附图说明
[0040]为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0041]图1为本说明书一个或多个实施例提供的一种针对用户的干预执行方法的流程示意图;
[0042]图2为本说明书一个或多个实施例提供的一种实际应用场景下,图1中的方法的一种具体实施方案的流程示意图;
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种针对用户的干预执行方法,包括:获取包含第一模型和第二模型的基础模型,所述第一模型用于预测对用户进行干预的情况下的转化率,所述第二模型用于预测未对用户进行干预的情况下的转化率;获取用户训练样本集合,并对所述用户训练样本集合中的各样本进行聚类,得到多个样本包;分别确定各所述样本包整体的期望干预增量和预测干预增量;根据所述期望干预增量和预测干预增量之间的一致性程度,为所述基础模型生成辅助损失;根据所述辅助损失,对所述基础模型进行训练;利用训练后的所述基础模型,对目标用户进行预测,并根据所述预测的结果,确定是否对所述目标用户进行干预。2.如权利要求1所述的方法,所述获取用户训练样本集合,并对所述用户训练样本集合中的各样本进行聚类,得到多个样本包,具体包括:利用所述基础模型,分别预测所述用户训练样本集合中的各样本在受干预的情况下,相比于未受干预的情况下的转化率增量;根据所述转化率增量,对所述用户训练样本集合中的各样本进行聚类,得到多个样本包。3.如权利要求2所述的方法,所述根据所述转化率增量,对所述用户训练样本集合中的各样本进行聚类,得到多个样本包,具体包括:根据所述转化率增量,对所述用户训练样本集合中的各样本进行排序,得到样本排序队列;将所述样本排序队列划分为多段,分别将每段对应的全部样本作为聚类出的一个样本包。4.如权利要求1所述的方法,所述确定所述样本包整体的期望干预增量,具体包括:确定所述样本包中或所述用户训练样本集合中的受干预样本的比例;根据所述受干预样本的比例、所述样本包中的受干预样本和未受干预样本分别的转化数量,确定所述样本包整体的期望干预增量。5.如权利要求1所述的方法,所述确定所述样本包整体的预测干预增量,具体包括:确定所述样本包中或所述用户训练样本集合中的受干预样本的比例;获取利用所述基础模型,分别预测的所述样本包中的各样本的转化率;根据所述转化率,分别计算所述样本包中的受干预样本的转化率之和以及未受干预样本的转化率之和;根据所述受干预样本的比例、所述受干预样本的转化率之和,以及所述未受干预样本的转化率之和,确定所述样本包整体的预测干预增量。6.如权利要求1所述的方法,所述根据所述期望干预增量和预测干预增量之间的一致性程度,为所述基础模型生成辅助损失,具体包括:计算所述期望干...

【专利技术属性】
技术研发人员:赵耀吕世伟
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1