一种基于可调系数M矩阵逆的因果发现方法及系统技术方案

技术编号:39313482 阅读:8 留言:0更新日期:2023-11-12 15:58
本发明专利技术提出一种基于可调系数M矩阵逆的因果发现方法及系统,涉及机器学习及数据挖掘技术领域,方法包括:构建数据矩阵;采用线性结构方程表示变量间的因果关系并确定评分函数和无环性约束函数;利用增广拉格朗日框架得到无约束优化问题;设定算法所需参数;计算无环性约束参数;已知加权邻接矩阵解出拉格朗日乘子;已知拉格朗日乘子解出加权邻接矩阵;判断加权邻接矩阵是否小于算法精度,若符合则向下执行,否则重新执行上述步骤“计算无环性约束参数”;对加权邻接矩阵进行阈值处理;输出因果图;本发明专利技术解决了当前基于连续优化的因果发现方法在优化过程中存在的数值爆炸或梯度消失问题,提高了因果发现的准确率和效率。提高了因果发现的准确率和效率。提高了因果发现的准确率和效率。

【技术实现步骤摘要】
一种基于可调系数M矩阵逆的因果发现方法及系统


[0001]本专利技术涉及机器学习及数据挖掘
,特别地涉及一种基于可调系数M矩阵逆的因果发现方法及系统。

技术介绍

[0002]随着数据获取手段的多样化和数据的日益丰富,社会学、生物医学、经济学等领域积累了海量的观测数据,这些数据是对事实或现象直接观测的结果,其中蕴含了数据背后真实的分布规律。近年来,如何直接从一组变量的观测数据中发现变量间的因果关系已成为统计学和人工智能等领域的研究热点之一。有向无环图(DAG)被用于描述多个变量之间的因果关系,其中节点表示随机变量,有向边表示变量间的因果关系。因果结构发现的目标即为从观测的样本数据中学习一个能准确刻画变量间因果关系的DAG,通常被称为DAG结构学习或贝叶斯网络结构学习问题。
[0003]基于评分函数从观测数据中学习变量间因果结构的算法大致可归为以下两类:基于组合优化的评分函数算法和基于连续优化的评分函数算法,前者是一个NP

难问题,只适用于节点数较小的图;后者提出一个刻画DAG结构特征的连续函数作为无环性约束,进而利用连续优化求解真实DAG结构。基于连续优化的评分函数算法虽然具有优美的数学形式和性质,但关于无环性约束中高阶项的系数分配出现了两种不同的观点:一方认为高阶项需要“小”系数以避免数值爆炸,另一方认为高阶项需要“大”系数以避免梯度消失。双方观点皆有依据,因此,给高阶项分配固定的系数(“小”系数或“大”系数)不可能同时解决数值爆炸和梯度消失这两个问题,进而导致对应的因果发现算法的准确率和效率较低。

技术实现思路

[0004]为了解决现有技术的不足,本专利技术通过引入M矩阵推导出一个新的无环性约束连续函数,该函数能自适应调整高阶项的系数,并在此无环性约束函数基础上,基于增广拉格朗日框架提出了一种新的基于连续优化的因果发现算法。具体来说,在优化的初始阶段,候选图与目标DAG之间差异较大(即候选图的谱半径较大而目标DAG的谱半径为零),此时给高阶项分配较“小”的系数,以避免数值爆炸问题。随着优化的进行,候选图逐渐趋近于目标图,即谱半径逐渐趋近于零,此时给高阶项分配较“大”的系数,以避免高阶项的环路信息和梯度信息消失问题。基于上述分析,本专利技术同时避免了优化过程中可能存在的数值爆炸和梯度消失问题,使得算法能更好地学习真实DAG结构,进而提升因果发现的准确率和效率。
[0005]为了实现上述目的,本专利技术采用如下技术方案:
[0006]一种基于可调系数M矩阵逆的因果发现方法,所述方法至少包括:
[0007]S1.获取观测数据样本并进行数据预处理,构建数据矩阵;
[0008]S2.初始化噪声变量矩阵,基于加权邻接矩阵并采用线性结构方程表示变量间的因果关系,确定优化的评分函数,并结合M矩阵的特性提出一个可调系数的无环性约束函数;
[0009]S3.利用增广拉格朗日框架将原带约束的优化问题转化为无约束优化问题;
[0010]S4.初始化加权邻接矩阵、拉格朗日乘子、二次惩罚项系数、无环性约束的参数,设定L1正则项系数、算法精度、权重阈值;
[0011]S5.计算加权邻接矩阵与其自身哈达玛积的谱半径及无环性约束的系数;
[0012]S6.将二次惩罚项系数增大十倍,并把加权邻接矩阵代入无约束优化问题,解出对应的拉格朗日乘子;
[0013]S7.将S6步骤解出的拉格朗日乘子代入无约束优化问题,解出对应的加权邻接矩阵;
[0014]S8.判断加权邻接矩阵是否符合算法精度要求,若符合则继续向下执行;否则重新执行步骤S5;
[0015]S9.对加权邻接矩阵进行阈值处理;
[0016]S10.输出最优的加权邻接矩阵对应的因果图。
[0017]本专利技术还提供一种基于可调系数M矩阵逆的因果发现系统,所述系统用于所述的基于可调系数M矩阵逆的因果发现方法,所属系统包括:
[0018]数据集预处理模块,用于获取观测数据样本并进行数据预处理,构建数据矩阵;
[0019]参数设定模块,用于设定噪声变量矩阵、加权邻接矩阵、评分函数、无环性约束函数、拉格朗日乘子、二次惩罚项系数、无环性约束的系数、L1正则项系数、算法精度、权重阈值;
[0020]迭代优化求解模块,用于求解将原带约束的优化问题利用增广拉格朗日框架转化后的无约束优化问题;
[0021]阈值处理模块,用于对加权邻接矩阵进行阈值处理,即将加权邻接矩阵中所有绝对值小于权重阈值的元素设为零;
[0022]可视化输出模块,用于输出最优的加权邻接矩阵对应的因果图。
[0023]与现有技术相比,本专利技术技术方案的有益效果是:
[0024]本专利技术在步骤S2中通过引入M矩阵并利用其特性提出了一个新的可调系数的无环性约束函数,将新无环性约束应用于因果发现算法可有效解决以往工作中存在的数值爆炸和梯度消失等问题,使算法可以更快地收敛且趋近真实DAG结构,进而提升算法的准确率和效率。
附图说明
[0025]图1表示本专利技术实施例中提出的基于可调系数M矩阵逆的因果发现方法的流程图;
[0026]图2表示本专利技术实施例中提出的基于可调系数M矩阵逆的因果发现系统的结构图。
具体实施方式
[0027]附图仅用于示例性说明,不能理解为对本专利的限制;
[0028]对于本领域技术人员来说,附图中某些公知内容说明可能省略是可以理解的;
[0029]附图中描述的位置关系仅用于示例性说明,不能理解为对本专利的限制;
[0030]下面结合附图和实施例对本专利技术的技术方案做进一步的说明。
[0031]实施例:
[0032]注意:本实施例中用小写斜体表示标量,小写加粗斜体表示向量,大写加粗斜体表示矩阵。
[0033]如图1所示的基于可调系数M矩阵逆的因果发现方法的流程图,参见图1,所述方法包括:
[0034]S1.获取观测数据样本并进行数据预处理,构建数据矩阵;
[0035]在本实施例中,设初始数据集为d维随机变量的n次观测数据样本,进行数据预处理后得到数据矩阵其中x
i
=(x1,x2,

,x
d
)
T
,i=1,2,

,n。
[0036]S2.初始化噪声变量矩阵,基于加权邻接矩阵并采用线性结构方程表示变量间的因果关系,确定优化的评分函数,并结合M矩阵的特性提出一个可调系数的无环性约束函数;
[0037]具体过程为:
[0038](1)噪声变量矩阵表示为其中e
i
=(e1,e2,

,e
d
)
T
,并且设定随机变量x
i
对应的噪声变量e
i
服从高斯分布、指数分布和耿贝尔分布之一;
[0039](2)加权邻接矩阵为其中w
i
=(w
1i
...

【技术保护点】

【技术特征摘要】
1.一种基于可调系数M矩阵逆的因果发现方法,其特征在于,所述方法至少包括:S1.获取观测数据样本并进行数据预处理,构建数据矩阵;S2.初始化噪声变量矩阵,基于加权邻接矩阵并采用线性结构方程表示变量间的因果关系,确定优化的评分函数,并结合M矩阵的特性提出一个可调系数的无环性约束函数;S3.利用增广拉格朗日框架将原带约束的优化问题转化为无约束优化问题;S4.初始化加权邻接矩阵、拉格朗日乘子、二次惩罚项系数、无环性约束的参数,设定L1正则项系数、算法精度、权重阈值;S5.计算加权邻接矩阵与其自身哈达玛积的谱半径及无环性约束的系数;S6.将二次惩罚项系数增大十倍,并把加权邻接矩阵代入无约束优化问题,解出对应的拉格朗日乘子;S7.将S6步骤解出的拉格朗日乘子代入无约束优化问题,解出对应的加权邻接矩阵;S8.判断加权邻接矩阵是否符合算法精度要求,若符合则继续向下执行;否则重新执行步骤S5;S9.对加权邻接矩阵进行阈值处理;S10.输出最优的加权邻接矩阵对应的因果图。2.根据权利要求1所述的一种基于可调系数M矩阵逆的因果发现方法,其特征在于,步骤S2中,无环性约束函数是结合...

【专利技术属性】
技术研发人员:张永昌蔡青松
申请(专利权)人:北京工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1