基于法律数据的知识图谱构建方法及系统技术方案

技术编号：17705025 阅读：414 留言：0更新日期：2018-04-14 17:58

本发明专利技术提供了基于法律数据的知识图谱构建方法及系统，方法包括：构建法律词典步骤，提取法律短语步骤，预处理法律文本步骤，初步构建法律知识步骤，识别法律实体步骤，识别法律关系步骤，构造法律知识链步骤；系统包括法律基础词典构建模块、法律基础知识库构建模块、法律实体自动识别模块、法律关系自动识别模块、法律知识链自动生成模块。本发明专利技术实现了针对法律数据构建知识图谱，能够在多个法律案由，如离婚纠纷、合同纠纷和机动车交通事故责任纠纷等案由数据构建知识图谱，为法律行业的上层应用提供了走向智能化的数据。

全部详细技术资料下载

【技术实现步骤摘要】
基于法律数据的知识图谱构建方法及系统
本专利技术属于数据处理
，涉及一种法律数据的知识图谱构建方法及能够实现该方法的系统。
技术介绍
人工智能正在我们人类的生活中发挥越来越重要的价值——它们正在接管我们的工作、帮助我们更高效更安全地生产、甚至改变我们生存与存在的方式。2010年以来，人工智能技术陆续在谷歌、Facebook、百度等顶尖互联网公司获得广泛应用；2016年，谷歌的战略重心从“移动先行”全面转向“人工智能先行”；根据埃森哲预测，到2035年时，人工智能可将12个发达经济体的年经济增长率提升一倍；2016年下半年，美国白宫科技政策办公室连续发布人工智能战略规划和研究报告，呼吁美国政府关注人工智能相关的科研、教育、产业发展及可能引发的就业和经济问题。2017年3月，人工智能首次写入我国的政府工作报告。人工智能技术将走出实验室，与相关产业进行更紧密衔接。而法律行业是人工智能应用的最热门领域之一。人工智能和法律的结合是法律行业发展的必然方向，重点是根据相关技术方法建立基于法律知识和案例的推理模型或知识系统等应用。法律人工智能的核心难点在于如何让计算机表示和...
基于法律数据的知识图谱构建方法及系统

【技术保护点】
基于法律数据的知识图谱构建方法，其特征在于，包括如下步骤：步骤1，构建法律词典首先下载以及人工标注法律种子词库，同时训练法律文本语料得到法律词向量；然后计算与词向量相似的候选法律词，计算相似度公式为：

【技术特征摘要】
1.基于法律数据的知识图谱构建方法，其特征在于，包括如下步骤：步骤1，构建法律词典首先下载以及人工标注法律种子词库，同时训练法律文本语料得到法律词向量；然后计算与词向量相似的候选法律词，计算相似度公式为：其中W1，W2为法律词汇的词向量；最后筛选有效的候选法律词；步骤2，提取法律短语通过互信息和信息熵分别提取组合词语，综合这两种方式计算的分数，使用加权平均的方式做排序筛序出短语候选组；其中，互信息计算公式为：X和Y为两个法律词，P(X,Y)为X和Y的联合概率，P(X)、P(Y)为X和Y的概率；信息熵具体计算公式如下：步骤3，预处理法律文本将步骤1、步骤2中构建的法律词典、法律短语作为分词工具的扩展词，对原始法律文本数据进行分词、词性标注、句法分析，完成法律语料文本的预处理；步骤4，初步构建法律知识定义法律知识图谱中法律实体、法律关系、三元组、概念层次图及其他相关概念，标注相关的法律数据语料；步骤5，识别法律实体对已标注的法律文本数据，进行实体特征的抽取，并将抽取的特征通过模型计算，实现法律实体自动识别，模型计算过程如下：句子沿着标签的路径，计算出概率转移矩阵和网络的分数表示为：

【专利技术属性】
技术研发人员：杜向阳，梁雁圆，
申请(专利权)人：南京擎盾信息科技有限公司，杜向阳，梁雁圆，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人