【技术实现步骤摘要】
一种基于法律专家知识库的上下文推理方法
本专利技术涉及法律文本分析
,具体是一种基于法律专家知识库的上下文推理方法。
技术介绍
法律领域中存在大量的自然语言文本,智能化需要做好自然语言理解的工作,而上下文推理是NLU中一个至关重要的领域,上下文推理可以直观地理解为解决基于上下文的推理机制的理解问题。处理好法律文本的上下文推理才能真正意义上实现人工智能在法律文本领域的各项应用,如智能问答、智能摘要等。目前在法律领域,并没有实质意义上的法律文本上下文推理的技术方案。中国专利CN105808568A和CN105677671A分别从效率和不确定性两个方法介绍了两种通用的上下文推理方法,通过分布式提高上下文推理效率,针对不确定性问题采用独特的推理方法提高准确率。但是,现有技术中的这些推理方法具有以下缺点,即目前法律文本领域未有完善易用的上下文推理方法,法律领域是一个专业领域,通用的方法在该领域并不可行。究其原因,一是法律领域的文本存在一个文本里有多法律意图(要素)的可能性,一个法律事实可能对应多个诉讼请求,不是简单的一对一推理;二是,法律文本中的多个法律意图(要素)存在递进关系,可以形成一个有向的概念图;三是,法律文本中存在多个法律主体,多个法律事件的复杂关系。因此,本专利技术提供了一种基于法律专家知识库的上下文推理方法,以解决上述
技术介绍
中提出的问题。
技术实现思路
本专利技术的目的在于提供一种基于法律专家知识库的上下文推理方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于法律专家知识库的上下文推理方法,其特征在于,其包括 ...
【技术保护点】
1.一种基于法律专家知识库的上下文推理方法,其特征在于,其包括以下步骤:(1)构建语义向量空间,分为语义向量空间构建和语义向量空间映射,其包括语义向量空间构建和语义空间映射;(2)法律实体识别;(3)法律文本语义分析;(4)隐含语义推理,其包括获取候选知识点、树构建法构建知识路径、获取候选隐含语义和推理结果评估分析;(5)专家知识库更新;其中,在所述步骤(4)中,获取候选知识点采用语义空间向量获取候选节点、树构建法构建知识路径这两个步骤获取候选的知识路径;且获取候选隐含语义是针对候选知识点,结合专家知识库中的已有知识决策路径和语义分析结果,采用多种推理方法进行候选隐含语义推理;其多种推理方法至少包括基于PMI的节点评分方法、一阶谓词逻辑推理方法、贝叶斯推理方法、神经网络推理方法。
【技术特征摘要】
1.一种基于法律专家知识库的上下文推理方法,其特征在于,其包括以下步骤:(1)构建语义向量空间,分为语义向量空间构建和语义向量空间映射,其包括语义向量空间构建和语义空间映射;(2)法律实体识别;(3)法律文本语义分析;(4)隐含语义推理,其包括获取候选知识点、树构建法构建知识路径、获取候选隐含语义和推理结果评估分析;(5)专家知识库更新;其中,在所述步骤(4)中,获取候选知识点采用语义空间向量获取候选节点、树构建法构建知识路径这两个步骤获取候选的知识路径;且获取候选隐含语义是针对候选知识点,结合专家知识库中的已有知识决策路径和语义分析结果,采用多种推理方法进行候选隐含语义推理;其多种推理方法至少包括基于PMI的节点评分方法、一阶谓词逻辑推理方法、贝叶斯推理方法、神经网络推理方法。2.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(1)中,所述语义向量空间构建是通过基于法律文本语料库构建一个法律语义向量库,将文本单元映射到语义空间上的向量,文本单元之间的语义相似度是根据对应向量在语义空间中的距离进行比较,语义接近的词;构建语义向量的训练数据的选择原则是法律相关文本,如裁判文书、法律法规、相关普法文章,作为用Word2Vec方法训练语义向量的语料库,并用训练结果构建语义向量库,以供其它模块在语义映射时使用。3.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(1)中,语义空间映射是将专家知识库中表示专家知识的文本映射为语义空间中的向量,具体步骤如下:(i)对专家知识库的知识图谱中的边/节点(这里的边是指知识图谱中实体节点与实体节点之间的关系及其自身的属性,节点是指知识图谱中的实体及其自身的相关属性中的词语进行过滤处理,去除其中无语义的停用词;(ii)对经步骤(i)操作处理后保留的每一个词语,从已经构建好的语义向量库中获取其在语义向量空间中的映射向量,然后将这些词语对应的语义向量进行累加,进而得到表征该边/节点的总体语义向量。4.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(2)的法律实体识别中,是针对待处理的法律文本进行分词处理,去除停用词后使用实体识别模型进行实体标注识别;同时,该模型还具有未知实体发现的作用,针对模型中不存在的实体,通过总结实体特征,发现具有相同特征的新法律实体;其中,所述实体识别模型是构建法律文本及其标注的法律实体语料,通过相关算法进行机器学习训练,得到用于实体标注识别和新实体发现的模型。5.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(3)的法律文本语义分析中,使用语义分析工具进行语义分析,语义分析的结果包括词性结果、句法分析结果、依存关系分析结果,上述语义分析结果将作为后续候选知识路径构建的辅助判断信息,这里的知识点和知识路径是等同的。6.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(4)中,语义空间向量获取候选节点是将实体识别的结果映射到语义向量空间中,同专家知识库中的语义向量进行比较,结合语义分析结果,取相似度最高的多个专家知识库知识实体节点,通过树构建法构建知识路径,作为候选知识点。7.根据权利要求6所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(4)中的树构建法构建知识路径中,构建方法如下:①选择法律实体e1–工作为树根,其中,e1是上述多个专家知识库实体节点的一个;②第一过程为直接关联,首先在专家知识库中选择关系r1可以一步跳到e1的法律实体e2,其中e2的约束条件为:一步跳到e1,并且同时在法律文本和专家知识中出现;③第二过程为多跳关联,其中,多跳关联是指在专家知识中选择关系r2可以链接e2和e3;④第三个过程外部关联,这步...
【专利技术属性】
技术研发人员:郑茂盛,杜向阳,储昭辉,
申请(专利权)人:南京擎盾信息科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。