【技术实现步骤摘要】
一种依存句法分析关系抽取模型的司法案件知识图谱构建方法
本专利技术属于人工智能领域的自然语言处理
,主要研究信息抽取和知识图谱技术问题,特别是涉及实体关系抽取的依存句法分析关系抽取模型的司法案件知识图谱构建方法。
技术介绍
司法领域是一个比较庞大的知识体系,领域知识也比较复杂,随着司法案件数据量的不断增大,数据之间的关系也越来越复杂,只能处理简单数据关系的传统关系型数据库已无法胜任,知识图谱的兴起便是为了解决该难题。知识图谱是用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。近年来,知识图谱获得迅猛的发展,目前已成为分析学科领域热点和前沿的有力工具。2012年5月份Google公司就首先提出了“知识图谱”的概念,旨在提升其搜索引擎性能而建立的知识库。Zhang等人认为知识图谱可以应用于展示领域知识整体结构、可视化分析检索结果;CiteSpaceⅡ软件是一款针对所采集到的数据进行知识图谱分析,专门用于在科学文献中识别并显示科学发展新趋势和新动态的软件;Wang等人借助 ...
【技术保护点】
1.一种依存句法分析关系抽取模型的司法案件知识图谱构建方法,其特征在于,包括如下步骤:/n步骤1,数据预处理,利用ProcessOn软件把司法案件整理为两大类,第一类是在司法案件中出现的涉案人身份,第二类是司法案件中的涉案种类,形成司法案件知识导图;/n步骤2,采用依存句法分析关系抽取模型对司法案件实体关系的抽取;/n步骤3,司法案件中实体关系三元组构建,主要包括四个过程,分别是判断、抽取、筛选和整理;/n步骤4,司法案件知识图谱的构建与可视化,抽取出来的实体关系三元组形成完整严谨的知识语言逻辑体系,成为司法案件知识图谱的理论基础,通过定义实体与实体之间的关系,能够定义涉案 ...
【技术特征摘要】
1.一种依存句法分析关系抽取模型的司法案件知识图谱构建方法,其特征在于,包括如下步骤:
步骤1,数据预处理,利用ProcessOn软件把司法案件整理为两大类,第一类是在司法案件中出现的涉案人身份,第二类是司法案件中的涉案种类,形成司法案件知识导图;
步骤2,采用依存句法分析关系抽取模型对司法案件实体关系的抽取;
步骤3,司法案件中实体关系三元组构建,主要包括四个过程,分别是判断、抽取、筛选和整理;
步骤4,司法案件知识图谱的构建与可视化,抽取出来的实体关系三元组形成完整严谨的知识语言逻辑体系,成为司法案件知识图谱的理论基础,通过定义实体与实体之间的关系,能够定义涉案、种类、受理多种关系,凭借着各种关系,多个不同实体间的关系就能够构成一套容纳司法案件中的实体与实体间关系的知识库。
2.根据权利要求1所述的依存句法分析关系抽取模型的司法案件知识图谱构建方法,其特征在于,所述步骤2中对司法案件实体关系的抽取,包括:预处理和依存句法分析关系抽取模型,步骤2进一步包括:
步骤2.1,首先要对司法案件文本进行预处理,预处理包括三方面内容,分别是:分词、词性标注和命名实体识别;
步骤2.2,采用全局特征和聚类特征的依存句法分析关系抽取模型,找出句子中主要成分的依存关系。
3.根据权利要求2所述的依存句法分析关系抽取模型的司法案件知识图谱构建方法,其特征在于,所述步骤2.2中依存句法分析关系抽取模型,包括:特征向量输入、类型转换和循环,步骤2.2进一步包括:
步骤2.2.1,输入特征向量,其中包括:当前移位操作时栈和buffer中的部分词汇以及栈中部分单词的依赖单词;上述单词的词性和上述依赖单词的依赖关系;
步骤2.2.2,预测出对应的转换类型,进行相应的转换操作,更新配置信息,然后得到新的特征向量;
步骤2.2.3,将新的特征向量再输入模型中预测,如此循环,最后就能得到依存弧集合找出句子中主要成分的依存关系。
4.根据权利要求1所述的依存句法分析关系抽取模型的司法案件知识图谱构建方法,其特征在于,所述步骤3中对司法案件构建实体关系三元组,包括四个过程,分别是判断、抽取、筛选和整理,步骤3进一步包括:
步骤3.1,判断,判断句子中是否有两个实体,并且判断以两个实体为基础的依存句法分析的内容集合是否具有实体之间的关系;
步骤3.2,抽取,将已判定为实体间的关系和两个实体抽取出来,并且以实体,关系,实体的三元组形式保存;
步骤3.3,筛选,抽取出来的实体关系三元组并不是一定有效的,所以需要去除不必要的三元组,筛选出高质量的有效三元组;
步骤3.4,整理,筛选之后的三元组具有重复性,虽然都是有效三元组,但是都表达一个意思的三元组只需要存在一个,同时,三元组也需要分类,三元组有部分描述人物关系,也有部分描述机...
【专利技术属性】
技术研发人员:陈建峡,张伟,黄煜俊,马忠宝,张杰,
申请(专利权)人:湖北工业大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。