构建纠偏树模型,用其评估干预效应的方法和装置制造方法及图纸

技术编号:36693172 阅读:10 留言:0更新日期:2023-02-27 20:02
本说明书实施例提供一种构建纠偏树模型,并利用该模型评估干预效应的方法和装置。构建树模型的方法包括:获取样本集,其中包括两组用户中的各个用户在m个时段的用户行为的指标值,m个时段包括m

【技术实现步骤摘要】
构建纠偏树模型,用其评估干预效应的方法和装置


[0001]本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习的方式,构建纠偏树模型,以及利用该树模型确定干预效果的方法和装置。

技术介绍

[0002]随着计算机技术的发展,机器学习已经应用到各种各样的
,用于分析、预测各种业务数据。在互联网环境中,用户行为是常见的分析来源。
[0003]用户行为是随时间线而发生的一系列用户动作,这些动作包括,例如,登录、搜索、点击、访问网页时购买某个商品、阅读某篇文章,与某个对象进行交互(例如,与好友交互,点击某个对象,收藏某个商品/物品),等等。为了给用户提供更好的服务,各种服务平台常常会制定一些激励政策和激励行为,以提高用户针对目标业务的响应积极性,提升用户在平台的活跃度。然而,如何衡量这些激励行为(或称干预行为)所发挥的效果,以及对用户产生的作用,是一项挑战和难题。
[0004]由此,希望能有改进的方案,可以更为有效地评估干预行为对用户行为的影响和作用,从而便于服务平台更好地针对用户施加激励,提供更好的服务。

技术实现思路

[0005]本说明书一个或多个实施例描述了一种构建纠偏树模型的方案,可以构建出减小混淆偏差的树模型;利用该纠偏树模型,可以更加有效地评估干预行为对用户行为的影响和作用。
[0006]根据第一方面,提供了一种构建纠偏树模型的方法,包括:
[0007]获取样本集,其中包括两组用户中的各个用户在m个时段的用户行为的指标值,所述m个时段包括m

1个前序时段以及目标时段;所述两组用户中的一组在所述目标时段被施加干预行为;
[0008]通过节点分裂过程构建第一回归树,所述节点分裂过程包括,以分裂损失最小化为目标,确定当前节点的目标分裂条件;所述分裂损失包括第一数据项,其包括分裂得到的两个子节点各自的混淆熵;任意节点的混淆熵为,落入该节点的各个用户对应于所述m

1个前序时段的交叉损失之和,其中任意用户在任意时段t的交叉损失表征,该用户在时段t的历史指标值,与落入该节点的异组用户在时刻t的指标值的第一均值之间的差异度;
[0009]基于所述第一回归树,确定所述纠偏树模型,其用于确定对用户施加干预行为的干预效应。
[0010]根据一种实施方式,节点分裂过程还包括:根据落入当前节点的用户的属性特征取值,确定多个备选分裂条件;相应的,确定当前节点的分裂条件,包括:确定所述多个备选分裂条件分别对应的分裂损失的损失值;将损失值最小的备选分裂条件,确定为所述目标分裂条件。
[0011]在一个实施例中,节点分裂过程还包括:判断是否满足预设的分裂停止条件,若满
足,根据当前的节点状态得到所述第一回归树;所述分裂停止条件包括以下之一:树的当前深度达到预设深度;所述当前节点没有备选分裂条件;按照所述目标分裂条件分裂得到的两个子节点的分裂损失值之和,大于所述当前节点的分裂损失值。
[0012]在一个具体例子中,前述交叉损失为,所述历史指标值与所述第一均值的差值平方。
[0013]根据一种实施方式,分裂损失还包括第二数据项,其包括两个子节点各自的预测损失;任意节点的预测损失为,落入该节点的各个用户的单用户损失之和,所述单用户损失表征,该用户在所述目标时刻的目标指标值,与落入该节点的同组用户在所述目标时刻的指标值的第二均值之间的差异度。
[0014]在前述实施方式的一个例子中,单用户损失为,所述目标指标值与所述第二均值的差值平方。
[0015]根据一个实施例,分裂损失可以为第一数据项和第二数据项的加权和,其中,第一数据项的权重小于所述第二数据项的权重。
[0016]在不同实施场景中,用户行为的指标值可以包括以下之一:浏览时长,购买金额,交互对象数量,交互次数,对目标业务是否响应的标记值;干预行为可以包括以下之一:投放广告,发放用户权益,推送附加服务,提供折扣。
[0017]根据一种实施方式,构建纠偏树模型的过程还包括,构建第二回归树,其中节点分裂过程的分裂损失包括第三数据项,其包括分裂得到的两个子节点各自的残差混淆熵;任意节点的残差混淆熵为,落入该节点的各个用户对应于所述m

1个前序时段的残差损失之和,其中任意用户在任意时段t的残差损失表征,该用户在时段t的历史指标值,与落入该节点的异组用户在时刻t的拟合指标值的均值之间的差异度,所述拟合指标值是第二回归树之前的若干回归树的叶节点拟合得到的。
[0018]在上述实施方式的情况下,可以将所述第一回归树,第二回归树进行集成,形成所述纠偏树模型。
[0019]根据第二方面,提供了一种评估干预行为对用户的干预效应的方法,包括:
[0020]获取根据第一方面的方法构建的纠偏树模型;
[0021]获取目标用户,其具有目标用户特征;
[0022]根据所述目标用户特征,将目标用户划分到所述纠偏树的目标叶子节点;
[0023]获取目标叶子节点所拟合的目标干预值和目标对照值,其中,所述目标干预值为落入目标叶子节点的测试组用户在施加干预行为的目标时段下的指标值均值,所述目标对照值为,落入目标叶子节点的对照组用户在所述目标时段下的指标值均值;
[0024]根据所述目标干预值和目标对照值之差,估计针对所述目标用户的干预效应大小。
[0025]在一个实施例中,纠偏树包括K个回归树;所述目标叶子节点包括K个叶子节点;在这样的情况下,获取目标叶子节点所拟合的目标干预值和目标对照值,包括:将K个叶子节点各自拟合的干预值之和,确定为所述目标干预值;将K个叶子节点各自拟合的对照值之和,确定为所述目标对照值。
[0026]根据第三方面,提供了一种构建纠偏树模型的装置,包括:
[0027]样本获取单元,配置为获取样本集,其中包括两组用户中的各个用户在m个时段的
用户行为的指标值,所述m个时段包括m

1个前序时段以及目标时段;所述两组用户中的一组在所述目标时段被施加干预行为;
[0028]节点分裂单元,配置为通过节点分裂过程构建第一回归树,所述节点分裂过程包括,以分裂损失最小化为目标,确定当前节点的目标分裂条件;所述分裂损失包括第一数据项,其包括分裂得到的两个子节点各自的混淆熵;任意节点的混淆熵为,落入该节点的各个用户对应于所述m

1个前序时段的交叉损失之和,其中任意用户在任意时段t的交叉损失表征,该用户在时段t的历史指标值,与落入该节点的异组用户在时刻t的指标值的第一均值之间的差异度;
[0029]模型确定单元,配置为基于所述第一回归树,确定所述纠偏树模型,其用于确定对用户施加干预行为的干预效应。
[0030]根据第四方面,提供了一种评估干预行为对用户的干预效应的装置,包括:
[0031]模型获取单元,配置为获取利用第三方面的装置构建的纠偏树模型;
[0032]用户获取单元,配置为获取目标用户,其具有本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种构建纠偏树模型的方法,包括:获取样本集,其中包括两组用户中的各个用户在m个时段的用户行为的指标值,所述m个时段包括m

1个前序时段以及目标时段;所述两组用户中的一组在所述目标时段被施加干预行为;通过节点分裂过程构建第一回归树,所述节点分裂过程包括,以分裂损失最小化为目标,确定当前节点的目标分裂条件;所述分裂损失包括第一数据项,其包括分裂得到的两个子节点各自的混淆熵;任意节点的混淆熵为,落入该节点的各个用户对应于所述m

1个前序时段的交叉损失之和,其中任意用户在任意时段t的交叉损失表征,该用户在时段t的历史指标值,与落入该节点的异组用户在时刻t的指标值的第一均值之间的差异度;基于所述第一回归树,确定所述纠偏树模型,其用于确定对用户施加干预行为的干预效应。2.根据权利要求1所述的方法,其中,所述节点分裂过程还包括:根据落入当前节点的用户的属性特征取值,确定多个备选分裂条件;确定当前节点的分裂条件,包括:确定所述多个备选分裂条件分别对应的分裂损失的损失值;将损失值最小的备选分裂条件,确定为所述目标分裂条件。3.根据权利要求1所述的方法,其中,所述节点分裂过程还包括:判断是否满足预设的分裂停止条件,若满足,根据当前的节点状态得到所述第一回归树;所述分裂停止条件包括以下之一:树的当前深度达到预设深度;所述当前节点没有备选分裂条件;按照所述目标分裂条件分裂得到的两个子节点的分裂损失值之和,大于所述当前节点的分裂损失值。4.根据权利要求1所述的方法,其中,所述交叉损失为,所述历史指标值与所述第一均值的差值平方。5.根据权利要求1所述的方法,其中,所述分裂损失还包括第二数据项,其包括两个子节点各自的预测损失;任意节点的预测损失为,落入该节点的各个用户的单用户损失之和,所述单用户损失表征,该用户在所述目标时刻的目标指标值,与落入该节点的同组用户在所述目标时刻的指标值的第二均值之间的差异度。6.根据权利要求5所述的方法,其中,所述单用户损失为,所述目标指标值与所述第二均值的差值平方。7.根据权利要求5所述的方法,其中,所述分裂损失为第一数据项和第二数据项的加权和,其中,第一数据项的权重小于所述第二数据项的权重。8.根据权利要求1所述的方法,其中,所述用户行为的指标值包括以下之一:浏览时长,购买金额,交互对象数量,交互次数,对目标业务是否响应的标记值;所述干预行为包括以下之一:投放广告,发放用户权益,推送附加服务,提供折扣。9.根据权利要求1所述的方法,还包括,构建第二回归树,其中节点分裂过程的分裂损失包括第三数据项,其包括分裂得到的两个子节点各自的残差混淆熵;任意节点的残差混淆熵为,落入该节点的各个用户对应于所述m

1个前序时段的残差损失之和,其中任意用户
在任意时段t的残差损失表征,该用户在时段t的历史指标值,与落入该节点的异组用户在时刻t的拟合指标值的均值之间的差异度,所述拟...

【专利技术属性】
技术研发人员:唐才智
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1