面向混杂和对撞复杂偏差的因果推断方法及系统技术方案

技术编号：43850863 阅读：22 留言：0更新日期：2024-12-31 18:43

本发明专利技术公开了一种面向混杂和对撞复杂偏差的因果推断方法及系统，本发明专利技术的方法包括如下步骤：获取人群特征与行为数据并进行标记；联合训练解耦表征生成器和处理变量估计器，各自训练解耦表征生成器、处理变量估计器、R<subgt;1</subgt;估计器、R<subgt;0</subgt;估计器以及第一结果变量估计器，然后训练第二结果变量估计器；最终将想要进行因果效应估计的人群特征与行为数据输入到因果效应估计模型中，预测施加干预对比不施加干预带来的人群行为变化。相较于只能去除混淆偏差的传统的工具变量回归方法，本发明专利技术充分考虑了现实复杂场景中可能同时存在选择偏差和混淆偏差，并实现了在复杂偏差场景下的因果效应无偏估计。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于因果推断领域，尤其涉及一种面向混杂和对撞复杂偏差的因果推断方法及系统。

技术介绍

1、因果推断是一个强大的解释性工具，在多个不同的领域的决策制定过程中都起着重要的作用，比如说，精准医疗，政策决策，精准推荐，教学策略改良等。为了识别条件因果效应，即不同人群的异质因果效应，因果领域的一个黄金标准是随机对照实验，但因为由于耗时花费巨大以及涉及道德伦理问题。我们往往只能基于观测数据进行因果分析。但在观测数据集中存在复杂偏差的普遍情况下，我们只能够观察到部分协变量以及部分样本的结果变量值，仅仅利用这些观察到的协变量以及观察到结果变量值的子样本进行因果效应推断，得到的结果往往是存在偏差的。

2、然而，传统的因果推断方法，比如用来解决未观测到协变量带来的混淆偏差的工具变量方法和用来解决未观测到部分结果变量值带来的选择偏差的影子变量方法，往往只能解决单一偏差的简单场景，在面对多种偏差同时存在的复杂场景时无法适用。

技术实现思路

1、本专利技术的目的在于解决现有技术无法适用的复杂偏...

【技术保护点】

1.一种面向混杂和对撞复杂偏差的因果推断方法，其特征在于，包括以下步骤：

2.如权利要求1所述的一种面向混杂和对撞复杂偏差的因果推断方法，其特征在于，所述人群特征与行为数据将女性及其所在家庭的基本信息作为协变量、将女性接受七年及以上教育作为处理变量、将女性是否在上半年出生作为工具变量以及将家庭在世子女数量作为结果变量，因果效应估计模型输出的预测结果具体为女性接受七年及以上教育对比未接受七年及以上教育带来的家庭在世子女数量变化；

3.如权利要求1所述的一种面向混杂和对撞复杂偏差的因果推断方法，其特征在于，步骤S2中，解耦表征生成器以及处理变量估计器的具体训练过程如下...

【技术特征摘要】

1.一种面向混杂和对撞复杂偏差的因果推断方法，其特征在于，包括以下步骤：

3.如权利要求1所述的一种面向混杂和对撞复杂偏差的因果推断方法，其特征在于，步骤s2中，解耦表征生成器以及处理变量估计器的具体训练过程如下：

4.如权利要求1所述的一种面向混杂和对撞复杂偏差的因果推断方法，其特征在于，步骤s3中，第一结果变量估计器、r0估计器、r1估计器以及样本选择概率估计器的...

【专利技术属性】
技术研发人员：况琨，李保宏，蒋宁，吴飞，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人