【技术实现步骤摘要】
诉讼文件分析方法、模型训练方法、装置、设备及介质
[0001]本申请涉及人工智能
,尤其是一种诉讼文件分析方法
、
训练方法
、
装置
、
设备及介质
。
技术介绍
[0002]司法机构面临各种类型案件的诉讼文件时,由于诉讼文件的内容较为冗长且用词较为晦涩难懂,很难快速从诉讼文件中准确提取诉讼文件中各种法律信息之间的关联和依赖关系
。
因此,对法律信息的优化处理和管理对于提高司法效率及公正性具有重要的意义
。
[0003]目前,对于诉讼文件的法律信息的处理和分析方法依赖人工操作,通过摘取主要信息段落或者句子,然后进行实体标注和句法分析
。
然而,句法分析需要分析整个段落或者句子的语义和结构,分析的效率和准确率低下
。
技术实现思路
[0004]本申请的目的是提供一种诉讼文件分析方法
、
训练方法
、
装置
、
设备及介质,旨在提升提取诉讼文件中各种法律信息之间的关联和依赖关系的效率和准确率
。
[0005]本申请实施例提供一种诉讼文件分析方法,包括:以诉讼文件和诉讼文件中的目标实体作为顶点,基于顶点之间的关联性构建超边,使用顶点和超边构建诉讼超图;所述目标实体为诉讼文件中与诉讼案件相关的实体;使用训练好的超图卷积网络模型对诉讼超图进行信息传播和特征学习,得到顶点特征向量;基于贝叶斯推断,计算顶点特征向量属于预设的法律属性标 ...
【技术保护点】
【技术特征摘要】
1.
一种诉讼文件分析方法,其特征在于,包括:以诉讼文件和诉讼文件中的目标实体作为顶点,基于顶点之间的关联性构建超边,使用顶点和超边构建诉讼超图;所述目标实体为诉讼文件中与诉讼案件相关的实体;使用训练好的超图卷积网络模型对诉讼超图进行信息传播和特征学习,得到顶点特征向量;基于贝叶斯推断,计算顶点特征向量属于预设的法律属性标签的后验概率,使用最大后验概率对顶点特征向量进行法律属性推断,以预测顶点特征向量对应的法律属性标签,得到预测标签;根据预测标签的法律属性确定预测标签之间的关联信息,使用预测标签和预测标签之间的关联信息构建关系信息链
。2.
根据权利要求1所述的诉讼文件分析方法,其特征在于,所述以诉讼文件和诉讼文件中的目标实体作为顶点,基于顶点之间的关联性构建超边,使用顶点和超边构建诉讼超图,包括:识别诉讼文件中的目标实体,以构建顶点集和超边集;对诉讼文件的文本内容进行信息提取,将提取得到的关键信息对应分配至顶点和超边,分别作为顶点的特征向量和超边的特征向量;利用超图嵌入方法将顶点映射至嵌入空间,利用训练好的嵌入向量替代原先顶点的特征向量,得到顶点的嵌入向量;计算超边的特征向量和对应顶点的嵌入向量的点积,得到超边的权重;使用顶点的嵌入向量更新顶点集,使用超边的权重更新超边集,使用更新后的顶点集和超边集构建诉讼超图
。3.
根据权利要求1所述的诉讼文件分析方法,其特征在于,所述使用训练好的超图卷积网络模型对诉讼超图进行信息传播和特征学习,得到顶点特征向量,包括:将诉讼超图的邻接矩阵和度矩阵输入预先训练好的超图卷积网络模型,进行逐层图卷积操作,对最后一次图卷积操作的输出结果进行法律属性分类,得到每个顶点的顶点特征向量;所述超图卷积网络模型由多个超图卷积层以及位于最后一个全连接层堆叠而成;所述超图卷积层的计算公式为:,其中,
H
(l+1)
为第
l+1
个超图卷积层的输出结果,
σ
为非线性激活函数,
D
为度矩阵,
A
为邻接矩阵,
H
(l)
为第
l
个超图卷积层的输出结果,
W
(l)
为第
l
个超图卷积层的权重参数矩阵,
l=1,2,3,...,L
,
L
为超图卷积层的数量;所述顶点特征向量的计算公式为:,其中,
F
为顶点特征向量,
H
(L)
为第
L
个超图卷积层的输出结果,
W
(L)
为全连接层的权重矩阵
。4.
根据权利要求1所述的诉讼文件分析方法,其特征在于,所述基于贝叶斯推断,计算
顶点特征向量属于预设的法律属性标签的后验概率,使用最大后验概率对顶点特征向量进行法律属性推断,以预测顶点特征向量对应的法律属性标签,得到预测标签,包括:根据法律属性标签的历史概率确定顶点特征向量属于对应法律属性标签的先验概率;设定顶点特征向量关于法律属性标签的条件概率分布;使用先验概率
、
条件概率分布和顶点特征向量的边缘概率计算顶点特征向量属于对应法律属性标签的后验概率,以最大后验概率对应的法律属性标签作为顶点特征向量的预测标签
...
【专利技术属性】
技术研发人员:胡为民,郑喜,谢丽慧,谭梁,
申请(专利权)人:深圳市迪博企业风险管理技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。