System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于因果效应估计的增益预测方法、模型训练方法和装置制造方法及图纸_技高网

基于因果效应估计的增益预测方法、模型训练方法和装置制造方法及图纸

技术编号:40102717 阅读:15 留言:0更新日期:2024-01-23 17:56
本说明书的实施例提供了一种基于因果效应估计的增益预测方法和装置。在该基于因果效应估计的增益预测方法中,对所获取的待预测样本的初始特征表示和对应的关联样本的初始特征表示分别进行解耦,得到对应的调整变量特征表示和混淆变量特征表示;再根据所得到的关联样本对应的调整变量特征表示和混淆变量特征表示进行聚合,得到对应的、融合有关联样本的对应信息的聚合调整变量特征表示和聚合混淆变量特征表示;进而基于待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合混淆变量特征表示的融合确定对应的聚合预测特征表示;并据此确定待预测样本对应的增益大小。

【技术实现步骤摘要】

本说明书实施例通常涉及计算机,尤其涉及基于因果效应估计的增益预测方法、因果效应估计模型的训练方法和装置。


技术介绍

1、因果推断(causal inference)是通过分析事件之间的关系来确定一种事件是另一种事件的原因的过程。在因果推断中,我们考虑了变量之间的相互作用,以确定一个变量的变化是否导致了另一个变量的变化。这通常涉及到控制其他变量的影响,以确定要测试的变量对结果的影响。

2、因果效应估计是指在控制其他可能影响结果的因素后,通过对比干预组(接受干预)与对照组基于因果效应估计的增益预测(未接受干预)的差异来评估某个特定因素对结果的影响大小,其广泛应用于社会科学、医学、金融等领域。因此,如何更准确地刻画数据之间的因果关系以及基于因果效应估计进行增益(uplift)预测成为需要解决的问题。


技术实现思路

1、鉴于上述,本说明书实施例提供了一种基于因果效应估计的增益预测方法和装置、因果效应估计模型的训练方法和装置。利用该方法、装置,可以实现更准确地刻画数据之间的因果关系以及基于因果效应估计进行增益(uplift)预测。

2、根据本说明书的实施例的一个方面,提供一种基于因果效应估计的增益预测方法,包括:对所获取的待预测样本的初始特征表示和对应的关联样本的初始特征表示分别进行解耦,得到对应的调整变量特征表示和混淆变量特征表示;根据所得到的关联样本对应的调整变量特征表示和混淆变量特征表示进行聚合,得到所述待预测样本对应的、融合有关联样本的对应信息的聚合调整变量特征表示和聚合混淆变量特征表示;基于所述待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合混淆变量特征表示的融合,得到对应的聚合预测特征表示;以及根据所述聚合预测特征表示,确定所述待预测样本对应的增益大小。

3、根据本说明书的实施例的另一个方面,提供一种因果效应估计模型的训练方法,其中,所述因果效应估计模型包括特征解耦模型、调整变量聚合模型、混淆变量聚合模型和预测模型,所述训练方法包括:利用训练样本集循环执行下述模型训练过程,直到满足训练结束条件,所述训练样本集包括具有关联关系的各个训练样本对应的样本初始特征表示、表征是否受到干预的干预标签和输出真值:将当前训练样本集中的各个当前训练样本对应的样本初始特征表示提供给当前特征解耦模型,得到与各个当前训练样本对应的调整变量特征表示和混淆变量特征表示;针对各个当前训练样本,将各个关联的当前训练样本对应的调整变量特征表示提供给当前调整变量聚合模型,得到该当前训练样本对应的聚合调整变量特征表示;根据各个当前训练样本对应的干预标签与该当前训练样本的干预标签是否一致,将相应的当前训练样本对应的混淆变量特征表示提供给当前混淆变量聚合模型,得到该当前训练样本对应的聚合混淆变量特征表示;基于该当前训练样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合混淆变量特征表示的融合,得到对应的聚合预测特征表示;将所得到的聚合预测特征表示提供给当前预测模型,得到对应的预测值;根据所得到的不同干预标签的当前训练样本对应的聚合调整变量特征表示之间的差异,确定调整变量一致性损失值;根据所得到的各个预测值和对应的输出真值之间的差异,确定预测损失值;以及响应于不满足训练结束条件,根据所述调整变量一致性损失值和所述预测损失值调整当前特征解耦模型、当前调整变量聚合模型、当前混淆变量聚合模型和当前预测模型的模型参数。

4、根据本说明书的实施例的又一个方面,提供一种基于因果效应估计的增益预测装置,包括:解耦单元,被配置为对所获取的待预测样本的初始特征表示和对应的关联样本的初始特征表示分别进行解耦,得到对应的调整变量特征表示和混淆变量特征表示;聚合单元,被配置为根据所得到的关联样本对应的调整变量特征表示和混淆变量特征表示进行聚合,得到所述待预测样本对应的、融合有关联样本的对应信息的聚合调整变量特征表示和聚合混淆变量特征表示;融合单元,被配置为基于所述待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合混淆变量特征表示的融合,得到对应的聚合预测特征表示;以及预测单元,被配置为根据所述聚合预测特征表示,确定所述待预测样本对应的增益大小。

5、根据本说明书的实施例的再一个方面,提供一种因果效应估计模型的训练装置,其中,所述因果效应估计模型包括特征解耦模型、调整变量聚合模型、混淆变量聚合模型和预测模型,所述训练装置被配置为由训练单元利用训练样本集循环执行模型训练过程,直到满足训练结束条件,所述训练样本集包括具有关联关系的各个训练样本对应的样本初始特征表示、表征是否受到干预的干预标签和输出真值,所述训练单元包括:解耦模块,被配置为将当前训练样本集中的各个当前训练样本对应的样本初始特征表示提供给当前特征解耦模型,得到与各个当前训练样本对应的调整变量特征表示和混淆变量特征表示;预测模块,被配置为针对各个当前训练样本,将各个关联的当前训练样本对应的调整变量特征表示提供给当前调整变量聚合模型,得到该当前训练样本对应的聚合调整变量特征表示;根据各个当前训练样本对应的干预标签与该当前训练样本的干预标签是否一致,将相应的当前训练样本对应的混淆变量特征表示提供给当前混淆变量聚合模型,得到该当前训练样本对应的聚合混淆变量特征表示;基于该当前训练样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合混淆变量特征表示的融合,得到对应的聚合预测特征表示;将所得到的聚合预测特征表示提供给当前预测模型,得到对应的预测值;损失值确定模块,被配置为根据所得到的不同干预标签的当前训练样本对应的聚合调整变量特征表示之间的差异,确定调整变量一致性损失值;根据所得到的各个预测值和对应的输出真值之间的差异,确定预测损失值;以及所述训练装置还包括:参数调整单元,被配置为响应于不满足训练结束条件,根据所述调整变量一致性损失值和所述预测损失值调整当前特征解耦模型、当前调整变量聚合模型、当前混淆变量聚合模型和当前预测模型的模型参数。

6、根据本说明书的实施例的另一方面,提供一种基于因果效应估计的增益预测装置,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的基于因果效应估计的增益预测方法。

7、根据本说明书的实施例的另一方面,提供一种因果效应估计模型的训练装置,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的因果效应估计模型的训练方法。

8、根据本说明书的实施例的另一方面,提供一种计算机可读存储介质,其存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的基于因果效应估计的增益预测方法和/或因果效应估计模型的训练方法。

9、根据本说明书的实施例的另一方面,提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行来实现如上所述的基于因果效应估计的增益预测方本文档来自技高网...

【技术保护点】

1.一种基于因果效应估计的增益预测方法,包括:

2.如权利要求1所述的增益预测方法,其中,所述聚合混淆变量特征表示包括聚合正事实混淆变量特征表示,

3.如权利要求1或2所述的增益预测方法,其中,所述聚合混淆变量特征表示包括聚合反事实混淆变量特征表示,

4.如权利要求1或2所述的增益预测方法,其中,所述聚合混淆变量特征表示包括聚合反事实混淆变量特征表示,

5.如权利要求2所述的增益预测方法,其中,所述聚合预测特征表示包括聚合正事实预测特征表示,所述聚合正事实预测特征表示根据所述待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合正事实混淆变量特征表示融合得到,

6.如权利要求5所述的增益预测方法,其中,所述聚合预测特征表示包括聚合反事实预测特征表示,所述聚合反事实预测特征表示根据所述待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合反事实混淆变量特征表示融合得到,

7.一种因果效应估计模型的训练方法,其中,所述因果效应估计模型包括特征解耦模型、调整变量聚合模型、混淆变量聚合模型和预测模型,所述训练方法包括:

8.如权利要求7所述的方法,其中,所述当前混淆变量聚合模型包括当前正事实混淆变量聚合模型,

9.如权利要求7或8所述的方法,其中,所述当前混淆变量聚合模型包括当前反事实混淆变量聚合模型,

10.一种基于因果效应估计的增益预测装置,包括:

11.一种因果效应估计模型的训练装置,其中,所述因果效应估计模型包括特征解耦模型、调整变量聚合模型、混淆变量聚合模型和预测模型,所述训练装置被配置为由训练单元利用训练样本集循环执行模型训练过程,直到满足训练结束条件,所述训练样本集包括具有关联关系的各个训练样本对应的样本初始特征表示、表征是否受到干预的干预标签和输出真值,所述训练单元包括:

12.一种基于因果效应估计的增益预测装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求1至6中任一所述的增益预测方法。

13.一种因果效应估计模型的训练装置,包括:至少一个处理器,与所述至少一个处理器耦合的存储器,以及存储在所述存储器上的计算机程序,所述至少一个处理器执行所述计算机程序来实现如权利要求7至9中任一所述的训练方法。

...

【技术特征摘要】

1.一种基于因果效应估计的增益预测方法,包括:

2.如权利要求1所述的增益预测方法,其中,所述聚合混淆变量特征表示包括聚合正事实混淆变量特征表示,

3.如权利要求1或2所述的增益预测方法,其中,所述聚合混淆变量特征表示包括聚合反事实混淆变量特征表示,

4.如权利要求1或2所述的增益预测方法,其中,所述聚合混淆变量特征表示包括聚合反事实混淆变量特征表示,

5.如权利要求2所述的增益预测方法,其中,所述聚合预测特征表示包括聚合正事实预测特征表示,所述聚合正事实预测特征表示根据所述待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合正事实混淆变量特征表示融合得到,

6.如权利要求5所述的增益预测方法,其中,所述聚合预测特征表示包括聚合反事实预测特征表示,所述聚合反事实预测特征表示根据所述待预测样本的混淆变量特征表示以及对应的聚合调整变量特征表示和聚合反事实混淆变量特征表示融合得到,

7.一种因果效应估计模型的训练方法,其中,所述因果效应估计模型包括特征解耦模型、调整变量聚合模型、混淆变量聚合模型和预测模型,所述训练方法包括:

8.如权利要求7所述...

【专利技术属性】
技术研发人员:安志成涂珂吴郑伟张志强周俊
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1