【技术实现步骤摘要】
本专利技术涉及数据挖掘领域,尤其涉及一种快速且适用于高维网络的因果骨架构建方法。
技术介绍
因果网络是不确定性推断的一种重要工具,因果网络结构学习是机器学习的研究热点之一。对于可观察数据集来说,因果网络可以有效地描述事物之间的因果关系,而不仅仅是事物之间的关联。在因果网络的推断问题上,由数据节点集构建因果网络结构,再通过节点之间的关系推断出因果网络图。不过,传统的方法用在高维数据中,其运算时间复杂度偏高,严重影响了算法的推广。传统的因果网络推断方法一般分两大类,基于估计马尔可夫等价类的贝叶斯网络结构学习算法和基于加性噪声模型(Additive noise model,ANM)或信息几何的因果方向推断算法。其中,贝叶斯网络结构学习算法主要有两种,即基于评分-搜索的结构学习和基于依赖分析的结构学习,都无法识别数据集中存在的马尔可夫等价类,如X->Z->Y与X<-Z<-Y这2种结构。然而,高维网络结构常常存在于马尔可夫等价类中,无法准确推断因果关系。贝叶斯网络结构学习算法采用穷举法搜索达到精准解,但是随着网络结构维度增长,其时间复杂度呈指数增长,很难使用于超过较大的(如超过100维)网络。基于估计马尔可夫等价类的贝叶斯网络结构学习算法只能用于因果结构无向图的环境,而无法准确完成模型的方向推断。基于加性噪声模型或信息几何的因果方向推断算法能够从数据结点集中构建出有效的因果网络。Shimizu等人提出了一种基于线性加噪声模型的因果推断算法(Linear non-Gaussian acyclic model,LINGAM),此方法对因果网络结 ...
【技术保护点】
一种快速且适用于高维网络的因果骨架构建方法,其特征在于,包括基于最大相关性和最小冗余度的父亲特征选择方法、基于条件独立性测试的因果关系剔除及方向推断方法;所述基于最大相关性和最小冗余度的父亲特征选择方法包括以下步骤:步骤S11,输入关于因果关系无向图G的n维数据集X={x1,x2,…,xn},并初始化y的候选父亲节点集Sy={};步骤S12,找出X中与y有最大相关性的节点xk,Sy=Sy∪xk;步骤S13,根据最大依赖性、最小冗余度原则,通过Sy′=argmaxxi∈X\Sk-1[I(y;xi)-1k-1Σxj∈Sk-1I(xi;xj)]]]>求出后面的特征父亲节点,并按顺序加入候选父亲节点集Sy,其中y为目标变量,Sy′为候选特征集,任意变量xi,xj属于Sy′,I是互信息;步骤S14,给定1个值m,直接取S中的前m个作为y的候选父亲节点,设定m=n(1/2)+1;步骤S15,以x为目标节点,重复步骤S11‑S14求出x的候选父亲节点集Sx;步骤S16,通过S11‑S15得到的Sx与Sy,则x,y候选父亲节点 ...
【技术特征摘要】
1.一种快速且适用于高维网络的因果骨架构建方法,其特征在于,包括基于最大相关性和最小冗余度的父亲特征选择方法、基于条件独立性测试的因果关系剔除及方...
【专利技术属性】
技术研发人员:洪英汉,郭才,林浩岳,陈洪财,
申请(专利权)人:韩山师范学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。