【技术实现步骤摘要】
构建纠偏树模型,用其评估干预效应的方法和装置
[0001]本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习的方式,构建纠偏树模型,以及利用该树模型确定干预效果的方法和装置。
技术介绍
[0002]随着计算机技术的发展,机器学习已经应用到各种各样的
,用于分析、预测各种业务数据。在互联网环境中,用户行为是常见的分析来源。
[0003]用户行为是随时间线而发生的一系列用户动作,这些动作包括,例如,登录、搜索、点击、访问网页时购买某个商品、阅读某篇文章,与某个对象进行交互(例如,与好友交互,点击某个对象,收藏某个商品/物品),等等。为了给用户提供更好的服务,各种服务平台常常会制定一些激励政策和激励行为,以提高用户针对目标业务的响应积极性,提升用户在平台的活跃度。然而,如何衡量这些激励行为(或称干预行为)所发挥的效果,以及对用户产生的作用,是一项挑战和难题。
[0004]由此,希望能有改进的方案,可以更为有效地评估干预行为对用户行为的影响和作用,从而便于服务平台更好地针对用户施加激励,提供更好的服务。
技术实现思路
[0005]本说明书一个或多个实施例描述了一种构建纠偏树模型的方案,可以构建出减小混淆偏差的树模型;利用该纠偏树模型,可以更加有效地评估干预行为对用户行为的影响和作用。
[0006]根据第一方面,提供了一种构建纠偏树模型的方法,包括:
[0007]获取样本集,其中包括两组用户中的各个用户在m个时段的用户行为的指标值,所述m个时段包括m
‑ ...
【技术保护点】
【技术特征摘要】
1.一种构建纠偏树模型的方法,包括:获取样本集,其中包括两组用户中的各个用户在m个时段的用户行为的指标值,所述m个时段包括m
‑
1个前序时段以及目标时段;所述两组用户中的一组在所述目标时段被施加干预行为;通过节点分裂过程构建第一回归树,所述节点分裂过程包括,以分裂损失最小化为目标,确定当前节点的目标分裂条件;所述分裂损失包括第一数据项,其包括分裂得到的两个子节点各自的混淆熵;任意节点的混淆熵为,落入该节点的各个用户对应于所述m
‑
1个前序时段的交叉损失之和,其中任意用户在任意时段t的交叉损失表征,该用户在时段t的历史指标值,与落入该节点的异组用户在时刻t的指标值的第一均值之间的差异度;基于所述第一回归树,确定所述纠偏树模型,其用于确定对用户施加干预行为的干预效应。2.根据权利要求1所述的方法,其中,所述节点分裂过程还包括:根据落入当前节点的用户的属性特征取值,确定多个备选分裂条件;确定当前节点的分裂条件,包括:确定所述多个备选分裂条件分别对应的分裂损失的损失值;将损失值最小的备选分裂条件,确定为所述目标分裂条件。3.根据权利要求1所述的方法,其中,所述节点分裂过程还包括:判断是否满足预设的分裂停止条件,若满足,根据当前的节点状态得到所述第一回归树;所述分裂停止条件包括以下之一:树的当前深度达到预设深度;所述当前节点没有备选分裂条件;按照所述目标分裂条件分裂得到的两个子节点的分裂损失值之和,大于所述当前节点的分裂损失值。4.根据权利要求1所述的方法,其中,所述交叉损失为,所述历史指标值与所述第一均值的差值平方。5.根据权利要求1所述的方法,其中,所述分裂损失还包括第二数据项,其包括两个子节点各自的预测损失;任意节点的预测损失为,落入该节点的各个用户的单用户损失之和,所述单用户损失表征,该用户在所述目标时刻的目标指标值,与落入该节点的同组用户在所述目标时刻的指标值的第二均值之间的差异度。6.根据权利要求5所述的方法,其中,所述单用户损失为,所述目标指标值与所述第二均值的差值平方。7.根据权利要求5所述的方法,其中,所述分裂损失为第一数据项和第二数据项的加权和,其中,第一数据项的权重小于所述第二数据项的权重。8.根据权利要求1所述的方法,其中,所述用户行为的指标值包括以下之一:浏览时长,购买金额,交互对象数量,交互次数,对目标业务是否响应的标记值;所述干预行为包括以下之一:投放广告,发放用户权益,推送附加服务,提供折扣。9.根据权利要求1所述的方法,还包括,构建第二回归树,其中节点分裂过程的分裂损失包括第三数据项,其包括分裂得到的两个子节点各自的残差混淆熵;任意节点的残差混淆熵为,落入该节点的各个用户对应于所述m
‑
1个前序时段的残差损失之和,其中任意用户
在任意时段t的残差损失表征,该用户在时段t的历史指标值,与落入该节点的异组用户在时刻t的拟合指标值的均值之间的差异度,所述拟...
【专利技术属性】
技术研发人员:唐才智,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。