一种基于半分离式表征的因果效应估计方法与系统技术方案

技术编号：40181598 阅读：8 留言：0更新日期：2024-01-26 23:47

本发明专利技术公开了一种基于半分离式表征的因果效应估计方法与系统，一方面，通过深度神经网络对数据进行回归分析，能够捕捉到数据中复杂的关系，而且，基于深度神经网络，能够处理大量观察数据信息，相对而言这种方式需要的人力更少，数据源的选择更加丰富；另一方面，通过学习半分离式的表征计算用于缓解选择偏差的权重；总体而言，本发明专利技术提供的方案可以提高因果效应估计结果的准确性，提升应用的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及因果效应估计，尤其涉及一种基于半分离式表征的因果效应估计方法与系统。

技术介绍

1、长期以来，人们一方面好奇地追问因和果的关系，一方面又苦于这些概念的模糊性。于是，这些话题在很长一段时间内仅仅局限在哲学和文学的范围内。精确地描述因果关系，尤其是用数学的语言来描述因果关系，则是非常近代的事情了。这一项思想飞跃，得益于现代统计学的发展。统计学家称之为“因果推断”(causal inference)。具体来说，因果推断研究的是某个干预变量t对于输出y的影响，一般称之为因果效应。

2、因果推理的重点在于识别系统中多个变量之间的一个变量对另一个变量的因果效应。通过识别因果关系来促进决策过程，因果推理的重要性在各个学科中越来越被认识到，包括医学、经济学、广告和公共政策。在医学领域为例，研究人员致力于推断特定治疗对患者的效果。将机器学习方法应用于观察数据以估计治疗效果是可行的，前提是假设治疗分配机制在观察变量给定的情况下，与潜在结果无关。在观察数据中，治疗通常不是随机分配的，导致接受不同治疗的子人群的协变量不平衡，这通常也被称为选择偏差(selectionbias)。例如，治疗心脏病时，医生通常倾向于为年轻患者开刀，为年老患者开药。这导致接受不同治疗的患者的协变量分布存在显著差异。选择偏差对因果推断构成了重大挑战。如果直接将机器学习应用于每种治疗方法，那么学习得到的机器学习模型可能无法有效地推广到整个人群。

3、目前，人们对于因果效应估计展开了部分相关工作，例如：公布号为cn114997761a的中国专利

4、1)目前的因果效应估计算法往往使用传统方法，例如逻辑回归。随着大数据时代的不断深入，面临的数据往往是海量的，这种场景下传统机器学习算法难以捕捉到数据中的复杂关系。

5、2)一些利用深度神经网络进行因果效应估计的方法往往利用整个协变量集合进行缓解选择偏差问题，忽略了选择偏差是由部分协变量引起的。

6、由于现有在数据处理层面存在的问题，导致因果效应估计的准确性不佳。

7、有鉴于此，特提出本专利技术。

技术实现思路

1、本专利技术的目的是提供一种基于半分离式表征的因果效应估计方法与系统，可以更好的捕捉到数据中的复杂关系，能够提升因果效应估计结果的准确性，提升应用的效果。

2、本专利技术的目的是通过以下技术方案实现的：

3、一种基于半分离式表征的因果效应估计方法，包括：

4、收集观察数据并构建因果效应估计模型，所述观察数据包括：观察对象的信息、作用于观察对象的事物类型、以及事物类型作用于观察对象后的结果；所述因果效应估计模型包括：两个表征网络、权重计算模块、以及推理网络，两个表征网络均为深度神经网络，分别记为ψ与φ；

5、将观察数据输入至因果效应估计模型，通过两个表征网络ψ与φ分别对观察数据中的观察对象的信息进行表征，获得的表征对应的表示为ψ(xi)与φ(xi)，xi表示观察对象的信息；利用表征ψ(xi)计算观察数据的权重；将表征φ(xi)输入至推理网络，获得预测结果；利用表征ψ(xi)构建预测干预损失，利用预测结果构建预测输出损失并使用观察数据的权重进行加权，结合预测干预损失与加权的预测输出损失构建目标函数，利用目标函数训练所述因果效应估计模型；

6、训练完毕后，将观察数据输入至训练后的因果效应估计模型，通过表征网络φ与推理网络获得每一作用于观察对象的事物类型对应的预测结果，利用所有预测结果实现因果效应估计。

7、一种基于半分离式表征的因果效应估计系统，包括：

8、数据收集与模型构建单元，用于收集观察数据并构建因果效应估计模型，所述观察数据包括：观察对象的信息、作用于观察对象的事物类型、以及事物类型作用于观察对象后的结果；所述因果效应估计模型包括：两个表征网络、权重计算模块、以及推理网络，两个表征网络均为深度神经网络，分别记为ψ与φ；

9、模型训练单元，用于将观察数据输入至因果效应估计模型，通过两个表征网络ψ与φ分别对观察数据中的观察对象的信息进行表征，获得的表征对应的表示为ψ(xi)与φ(xi)，xi表示观察对象的信息；利用表征ψ(xi)计算观察数据的权重；将表征φ(xi)输入至推理网络，获得预测结果；利用表征ψ(xi)构建预测干预损失，利用预测结果构建预测输出损失并使用观察数据的权重进行加权，结合预测干预损失与加权的预测输出损失构建目标函数，利用目标函数训练所述因果效应估计模型；

10、因果效应估计单元，用于训练完毕后，将观察数据输入至训练后的因果效应估计模型，通过表征网络φ与推理网络获得每一作用于观察对象的事物类型对应的预测结果，利用所有预测结果实现因果效应估计。

11、一种处理设备，包括：一个或多个处理器；存储器，用于存储一个或多个程序；

12、其中，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现前述的方法。

13、一种可读存储介质，存储有计算机程序，当计算机程序被处理器执行时实现前述的方法。

14、由上述本专利技术提供的技术方案可以看出，一方面，通过深度神经网络对数据进行回归分析，能够捕捉到数据中复杂的关系，而且，基于深度神经网络，能够处理大量观察数据信息，相对而言这种方式需要的人力更少，数据源的选择更加丰富；另一方面，通过学习半分离式的表征计算用于缓解选择偏差的权重；总体而言，本专利技术提供的方案可以提高因果效应估计结果的准确性，提升应用的效果。

本文档来自技高网...

【技术保护点】

1.一种基于半分离式表征的因果效应估计方法，其特征在于，包括：

2.根据权利要求1所述的一种基于半分离式表征的因果效应估计方法，其特征在于，两个表征网络均包含：输入层、多个隐藏层与输出层；其中，表征网络内部隐藏层数量不同；

3.根据权利要求2所述的一种基于半分离式表征的因果效应估计方法，其特征在于，所述隐藏层的网络类型根据观察对象的信息Xi的类型进行设置；当观察对象的信息Xi为图像数据时，隐藏层为卷积神经网络；当观察对象的信息Xi为文本数据时，隐藏层为循环神经网络；当观察对象的信息Xi为图像时数值型数据，隐藏层为多层感知神经网络。

4.根据权利要求1所述的一种基于半分离式表征的因果效应估计方法，其特征在于，所述利用表征Ψ(Xi)计算观察数据的权重包括：

5.根据权利要求1所述的一种基于半分离式表征的因果效应估计方法，其特征在于，所述结合预测干预损失与加权的预测输出损失构建目标函数表示为：

6.根据权利要求1或5所述的一种基于半分离式表征的因果效应估计方法，其特征在于，预测干预损失为利用Ψ(Xi)预测干预的平方误差，表示为：

7.根据权利要求1所述的一种基于半分离式表征的因果效应估计方法，其特征在于，所述通过表征网络Φ与推理网络获得预测结果，利用预测结果实现因果效应估计为：

8.一种基于半分离式表征的因果效应估计系统，其特征在于，包括：

9.一种处理设备，其特征在于，包括：一个或多个处理器；存储器，用于存储一个或多个程序；

10.一种可读存储介质，存储有计算机程序，其特征在于，当计算机程序被处理器执行时实现如权利要求1～7任一项所述的方法。

...

【技术特征摘要】

1.一种基于半分离式表征的因果效应估计方法，其特征在于，包括：

3.根据权利要求2所述的一种基于半分离式表征的因果效应估计方法，其特征在于，所述隐藏层的网络类型根据观察对象的信息xi的类型进行设置；当观察对象的信息xi为图像数据时，隐藏层为卷积神经网络；当观察对象的信息xi为文本数据时，隐藏层为循环神经网络；当观察对象的信息xi为图像时数值型数据，隐藏层为多层感知神经网络。

4.根据权利要求1所述的一种基于半分离式表征的因果效应估计方法，其特征在于，所述利用表征ψ(xi)计算观察数据的权重包括：

5.根据权利要求1所述的...

【专利技术属性】
技术研发人员：陈欢欢，王新，吕胜飞，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人