【技术实现步骤摘要】
一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法
[0001]本专利技术涉及一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,属于数据挖掘
,利用变分方法和加性噪声模型实现司法数据中的因果关系学习,通过建模司法案件中事件的因果贝叶斯网络,辅助刑期预测,为司法量刑提供决策支持。
技术介绍
[0002]贝叶斯网络是一种用于建模概率推理的图模型,近年来在司法数据分析中得到了广泛应用。因果贝叶斯网络是贝叶斯网络的一种,它专注于表示和推断因果关系。因果贝叶斯网络假设变量之间存在因果关系,并通过概率模型描述变量之间的条件概率依赖关系和因果关系,可以用来推断某个变量的变化如何影响其他变量的概率分布。因果贝叶斯网络可以用于预测未来的结果或改变变量以获得期望的结果。通过因果贝叶斯网络,可以将不同的变量及其之间的因果关系用图形化的方式表示出来,图中的节点是变量,节点之间的边表示它们之间具有的因果关系。在司法数据分析中,因果贝叶斯网络可以用来建模不同的变量之间的关系,比如证据、罪犯的特征、犯罪类型等,从而预测可能的罪犯身份或犯罪类型 ...
【技术保护点】
【技术特征摘要】
1.一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:该方法的步骤包括:第一步,利用预处理的司法数据进行因果贝叶斯网络骨架学习,得到司法数据样本间的因果无向结构图;第二步,以遍历的变量为中心,遍历第一步得到的因果无向结构图,提取与遍历的变量有直接依赖关系的所有变量,将司法数据样本间的因果无向结构图分解为多个子图;第三步,将第二步得到的多个子图中非中心节点泛化为中间变量,学习各个子图中变量间的因果方向,将子图恢复至因果无向结构图得到司法因果贝叶斯网络。2.根据权利要求1所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:所述第一步中,预处理的司法数据是指修改司法数据格式、去除重复数据、筛选并提取司法数据中要素形成司法数据变量。3.根据权利要求1或2所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:所述第一步中,因果无向结构图的生成方法,步骤包括:(1)生成司法数据变量完全图,完全图指该图中各个变量之间都存在着一条边,然后计算变量之间的相关系数,利用预先设定的阈值判断变量之间的相关性,通过对司法数据进行置换,检查变量是否仍然存在相关性,从而判断它们之间是否存在条件独立关系,如果存在条件独立关系,则表示两个变量不存在依赖关系,因此在完全图中删去这两个变量之间的边;如果不存在条件独立关系,则不做改变;(2)去除不必要的边,不必要的边是指去除后变量间的条件独立关系仍然能够保持不变,得到因果无向结构图。4.根据权利要求1所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:所述第三步中,利用变分自编码器框架将第二步得到的多个子图中非中心节点泛化为中间变量,然后采用层次加性噪声模型的正反向因果识别框架学习各个子图中变量间的因果方向,最后将子图恢复至因果无向结构图得到因果贝叶斯网络。5.根据权利要求4所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:利用变分自编码器框架泛化子图中非中心节点的方法为:对于所提出的子图,通过变分自编码器框架将多对一因果关系泛化为近似一对一关系,对因果关系进行识别,该过程称之为层次的加性噪声模型,其中中心节点在此表示为Y,非中心节点表示为X,泛化所得的变量为Z,其中构造的变分自编码器负责正向将多个非中心变量X
i
转化为中间变量Z来将一组多对一关系转化为近似一对一关系;然后将多对一关系反向,构造反向的一对一关系,最终,利用加性噪声模型,通过计算噪声与原因间的独立性,利用不对称性来获得因果关系方向。6.根据权利要求5所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:设非中心变量X
i
(i=1,2,
…
n)为导致中心变量Y的多个原因(X
i
→
Y),n为非中心变量的
个数,假设数据生成遵循非线性加性噪声,那么在基于层次加性噪声模型中多对一因果关系定义为:Y=f(X1,X2,
…
,X
n
)+ε
x
在已知联合分布P(X1,X2,
…
,X
n
,Y)的情况下,每个X
i
遵循相同的分布且与残差ε
x
独立。7.根据权利要求6所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:转换为中间变量的方法为:借助变分自编码器,使用q
λ
(Z|X)来近似后验分布,λ为参数,将后验分布定义为正态分布,引入KL散度来衡量使用的q
λ
(Z|X)和真实的后验分布p(Z|X)之间的相似程度,如下KL(q
λ
(Z|X)||p(Z|X))=E
q
[logq
λ
(Z|X)]
‑
E
q
[logp(X,Z)]+logp(X)由于logp(X)是一个定值,KL散度大于等于0,最小化KL散度的问题等价于最大化ELBO:对于L(λ;X)进一步进行分解:对于最大化的ELBO,即最小化L1并最大化L2。8.根据权利要求7所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方法,其特征在于:通过多层感知机来构建一个编码器来学习λ使得q
λ
(Z|X)和真实的后验分布p(Z|X)尽可能相似,其中L1通过损失函数获得最佳结果,而L2则使用重参数化使得获得的参数可导从而参与到多层感知机的优化过程中,通过将正则项与重构误差结合的损失函数,使用变分自编码器框架获得一个加码器Encoder q
λ
(Z|X),和一个解码器Decoderp
θ
(X|Z)。9.根据权利要求8所述的一种基于层次加性噪声模型的司法因果贝叶斯网络构建方...
【专利技术属性】
技术研发人员:耿晶,赵柏翔,徐斌,王树良,郭新刚,刘雨娜,党迎旭,
申请(专利权)人:中国司法大数据研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。