案事件知识图谱构建方法及相关设备技术

技术编号:28035431 阅读:11 留言:0更新日期:2021-04-09 23:17
本说明书一个或多个实施例提供一种案事件知识图谱构建方法及其相关设备,所述构建方法包括:通过对收集到的司法案事件相关数据进行数据处理,总结构建案事件表示体系,基于案事件表示体系进行案事件的信息抽取,最终以抽取到的信息作为点和边,形成结构化的案事件图谱。本发明专利技术基于深度学习的事件抽取方法,提出了一套司法案事件图谱的构建方法。该案事件知识图谱通过信息抽取,将以自由文本形式存在的司法案事件信息结构化,为其下游任务例如相似案例检索、类案精准推送、裁判文书自动生成等一系列司法领域的应用提供了基础保障。

【技术实现步骤摘要】
案事件知识图谱构建方法及相关设备
本说明书一个或多个实施例涉及知识图谱
,尤其涉及一种案事件知识图谱构建方法及相关设备。
技术介绍
知识图谱(KnowledgeGraph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。具体来说,知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制而显示出来,揭示知识领域的动态发展规律,为学科研究提供切实的、有价值的参考。迄今为止,其实际应用在发达国家已经逐步拓展并取得了较好的效果,但它在我国仍属研究的起步阶段。目前,面向垂直领域的图谱构建在医学、经济等多个领域都取得了成功的运用,而对于司法领域案事件信息抽取及图谱构建的研究本文档来自技高网...

【技术保护点】
1.一种案事件知识图谱构建方法,其特征在于,包括:/n采集司法案事件相关数据;/n对所述司法案事件相关数据进行数据处理得到案事件;/n基于现有法律法规定义案事件类型,基于所述案事件类型对所述案事件进行分类,通过对所述案事件进行角色挖掘建立每个所述案事件类型对应的案事件角色,基于所述案事件类型和所述案事件角色构建事件表示体系;/n采用联合抽取算法从所述案事件中提取事件信息,基于所述事件表示体系对所述事件信息进行分类,基于经过分类的所述事件信息构建案事件知识图谱。/n

【技术特征摘要】
1.一种案事件知识图谱构建方法,其特征在于,包括:
采集司法案事件相关数据;
对所述司法案事件相关数据进行数据处理得到案事件;
基于现有法律法规定义案事件类型,基于所述案事件类型对所述案事件进行分类,通过对所述案事件进行角色挖掘建立每个所述案事件类型对应的案事件角色,基于所述案事件类型和所述案事件角色构建事件表示体系;
采用联合抽取算法从所述案事件中提取事件信息,基于所述事件表示体系对所述事件信息进行分类,基于经过分类的所述事件信息构建案事件知识图谱。


2.根据权利要求1所述的构建方法,其特征在于,所述司法案事件相关数据包括:法律裁判文书、民事/刑事判决书和用户应用日志。


3.根据权利要求1或2所述的构建方法,其特征在于,所述对所述司法案事件相关数据进行数据处理,包括:
去除所述司法案事件相关数据中的非案事件内容,保留相关案事件文本;
提取所述司法案事件相关数据中的案事件名称;
对所述司法案事件相关数据中的相同案事件进行归一化处理;
对每一个案事件的所有所述非案事件内容进行融合得到案事件相关资讯,将所述案事件相关资讯与该案事件进行关联。


4.根据权利要求1或2所述的构建方法,其特征在于,所述基于所述案事件类型对所述案事件进行分类,包括:
通过预训练的来自变换器的双向编码器表示BERT模型对所述案事件的案事件名称进行编码,得到所述案事件名称的向量表示,通过前馈神经网络计算得到所述向量表示对应于所述案事件类型的得分向量,基于所述得分向量通过softmax函数计算得到概率最高的所述案事件类型作为所述案事件名称对应的案事件类型。


5.根据权利要求1或2所述的构建方法,其特征在于,所述采用联合抽取算法从所述案事件中提取事件信息,基于所述事件表示体系对所述事件信息进行分类,包括:
通过BERT模型对所述案事件语句进行编码,得到所述案事件语句中每个字的向量表示;
采用BIO序列标注方法对所述每个字的向量表示进行标注,识别出所述案事件中...

【专利技术属性】
技术研发人员:朵思惟余梓飞于锋杰薛晨云
申请(专利权)人:天津汇智星源信息技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1