一种基于法律专家知识库的上下文推理方法技术

技术编号:21686269 阅读:27 留言:0更新日期:2019-07-24 14:42
本发明专利技术公开了一种基于法律专家知识库的上下文推理方法,本发明专利技术基于专家知识库,通过实体识别、语义分析,根据上下文推理理解法律文本中的隐含语义内容,并将推理过程中产生的新实体和不包含在专家知识库的推理结果经过人工审核整理后加入专家知识库,并从相应的语料库中得到每一条专家知识、每一个法律实体的权重,本发明专利技术的上下文推理方法为多推理引擎综合的推理方法,包括基于PMI的打分推理、一阶谓词逻辑推理、贝叶斯推理、神经网络推理等,该方法针对法律文本领域的上下文推理,能够有效解决法律文本语言理解中的部分上下文推理问题;本发明专利技术采用的基于法律专家知识库的推理方法,在法律领域具有天然的专业优势。

A Context Reasoning Method Based on Legal Expert Knowledge Base

【技术实现步骤摘要】
一种基于法律专家知识库的上下文推理方法
本专利技术涉及法律文本分析
,具体是一种基于法律专家知识库的上下文推理方法。
技术介绍
法律领域中存在大量的自然语言文本,智能化需要做好自然语言理解的工作,而上下文推理是NLU中一个至关重要的领域,上下文推理可以直观地理解为解决基于上下文的推理机制的理解问题。处理好法律文本的上下文推理才能真正意义上实现人工智能在法律文本领域的各项应用,如智能问答、智能摘要等。目前在法律领域,并没有实质意义上的法律文本上下文推理的技术方案。中国专利CN105808568A和CN105677671A分别从效率和不确定性两个方法介绍了两种通用的上下文推理方法,通过分布式提高上下文推理效率,针对不确定性问题采用独特的推理方法提高准确率。但是,现有技术中的这些推理方法具有以下缺点,即目前法律文本领域未有完善易用的上下文推理方法,法律领域是一个专业领域,通用的方法在该领域并不可行。究其原因,一是法律领域的文本存在一个文本里有多法律意图(要素)的可能性,一个法律事实可能对应多个诉讼请求,不是简单的一对一推理;二是,法律文本中的多个法律意图(要素)存在递进关系,可以形成一个有向的概念图;三是,法律文本中存在多个法律主体,多个法律事件的复杂关系。因此,本专利技术提供了一种基于法律专家知识库的上下文推理方法,以解决上述
技术介绍
中提出的问题。
技术实现思路
本专利技术的目的在于提供一种基于法律专家知识库的上下文推理方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种基于法律专家知识库的上下文推理方法,其特征在于,其包括以下步骤:(1)构建语义向量空间,分为语义向量空间构建和语义向量空间映射,其包括语义向量空间构建和语义空间映射;(2)法律实体识别;(3)法律文本语义分析;(4)隐含语义推理,其包括获取候选知识点、树构建法构建知识路径、获取候选隐含语义和推理结果评估分析;(5)专家知识库更新;其中,在所述步骤(4)中,获取候选知识点采用语义空间向量获取候选节点、树构建法构建知识路径这两个步骤获取候选的知识路径;且获取候选隐含语义是针对候选知识点,结合专家知识库中的已有知识决策路径和语义分析结果,采用多种推理方法进行候选隐含语义推理;其多种推理方法至少包括基于PMI的节点评分方法、一阶谓词逻辑推理方法、贝叶斯推理方法、神经网络推理方法。进一步,作为优选,在所述步骤(1)中,所述语义向量空间构建是通过基于法律文本语料库构建一个法律语义向量库,将文本单元映射到语义空间上的向量,文本单元之间的语义相似度是根据对应向量在语义空间中的距离进行比较,语义接近的词;构建语义向量的训练数据的选择原则是法律相关文本,如裁判文书、法律法规、相关普法文章,作为用Word2Vec方法训练语义向量的语料库,并用训练结果构建语义向量库,以供其它模块在语义映射时使用。进一步,作为优选,在所述步骤(1)中,语义空间映射是将专家知识库中表示专家知识的文本映射为语义空间中的向量,具体步骤如下:(i)对专家知识库的知识图谱中的边/节点(这里的边是指知识图谱中实体节点与实体节点之间的关系及其自身的属性,节点是指知识图谱中的实体及其自身的相关属性中的词语进行过滤处理,去除其中无语义的停用词;(ii)对经步骤(i)操作处理后保留的每一个词语,从已经构建好的语义向量库中获取其在语义向量空间中的映射向量,然后将这些词语对应的语义向量进行累加,进而得到表征该边/节点的总体语义向量。进一步,作为优选,在所述步骤(2)的法律实体识别中,是针对待处理的法律文本进行分词处理,去除停用词后使用实体识别模型进行实体标注识别;同时,该模型还具有未知实体发现的作用,针对模型中不存在的实体,通过总结实体特征,发现具有相同特征的新法律实体;其中,所述实体识别模型是构建法律文本及其标注的法律实体语料,通过相关算法进行机器学习训练,得到用于实体标注识别和新实体发现的模型。进一步,作为优选,在所述步骤(3)的法律文本语义分析中,使用语义分析工具进行语义分析,语义分析的结果包括词性结果、句法分析结果、依存关系分析结果,上述语义分析结果将作为后续候选知识路径构建的辅助判断信息,这里的知识点和知识路径是等同的。进一步,作为优选,在所述步骤(4)中,语义空间向量获取候选节点是将实体识别的结果映射到语义向量空间中,同专家知识库中的语义向量进行比较,结合语义分析结果,取相似度最高的多个专家知识库知识实体节点,通过树构建法构建知识路径,作为候选知识点。进一步,作为优选,在所述步骤(4)中的树构建法构建知识路径中,构建方法如下:①选择法律实体e1–工作为树根,其中,e1是上述多个专家知识库实体节点的一个;②第一过程为直接关联,首先在专家知识库中选择关系r1可以一步跳到e1的法律实体e2,其中e2的约束条件为:一步跳到e1,并且同时在法律文本和专家知识中出现;③第二过程为多跳关联,其中,多跳关联是指在专家知识中选择关系r2可以链接e2和e3;④第三个过程外部关联,这步扩大的链接知识库的范围,这个过程的e4仅在专家知识中,并且是e3的邻居,e3的邻居就是可以一步跳到e3,这个过程通过有用的外部信息的收集来完善上下文中的路径;⑤第四个过程上下文关联,上一个过程发散了知识库的范围,将范围收敛来确保外部知识确实对任务有用,具体实现是在专家知识中选择关系r4可以通过e3或e4链接e3或e4和e5,e5同时属于专家知识和上下文。进一步,作为优选,在所述步骤(4)中,获取候选隐含语义是针对候选知识点,结合专家知识库中的已有知识决策路径和语义分析结果,采用多种推理方法进行候选隐含语义推理;具体的推理方法包括:(a)、基于PMI的节点评分方法基于上述树构建产生的对于在法律文本上下文中的节点打分函数计算为:|C|是上下文的长度,count(c)函数是法律实体在法律文本中的次数;对于不在文中的节点,通过逻辑一致路径更为频繁出现的启发,评分函数使用的是计算点互信息PMI,通过e4和e{1-3}的点信息:其中路径指专家知识库和语义知识库中的知识路径,并对计算的PMI做归一化--NPMI:又因为不同分支、不同层级的节点不存在竞争,对同层的兄弟节点进行标准化:获取节点的初始分数后,采用一种启发式的累计节点打分方法,累计节点打分方法是一种自底向上的迭代,从叶子节点开始,叶子节点不需要更新,更新公式为:其中e为非叶子节点,f(e)是节点的函数,计算方法为选择该节点e的孩子节点中c-score最高的两个,取两者的平均值;最后计算知识路径的得分,采用知识路径的各个节点c-score的累加值:设定一个阈值,认为score(p)小于该阈值的知识路径为无效路径;(aa)、一阶谓词逻辑推理方法是基于专家知识库和语义知识库,将与候选知识点关联的知识转化为谓词公式,转化方法如下:定义谓词及个体,确定每个谓词及个体的确切含义;根据所要表达的事物或概念,为每个谓词中的变元赋以特定的值;根据所要表达的知识的语义,用适当的连接符号将各个谓词连接起来,形成谓词公式;根据知识库对上述方法产生的谓词公式求真值,保留真值为True的知识,过滤真值为False的知识;(aaa)、贝叶斯推理方法,是对条件概率公式进行变形,可以得到本文档来自技高网...

【技术保护点】
1.一种基于法律专家知识库的上下文推理方法,其特征在于,其包括以下步骤:(1)构建语义向量空间,分为语义向量空间构建和语义向量空间映射,其包括语义向量空间构建和语义空间映射;(2)法律实体识别;(3)法律文本语义分析;(4)隐含语义推理,其包括获取候选知识点、树构建法构建知识路径、获取候选隐含语义和推理结果评估分析;(5)专家知识库更新;其中,在所述步骤(4)中,获取候选知识点采用语义空间向量获取候选节点、树构建法构建知识路径这两个步骤获取候选的知识路径;且获取候选隐含语义是针对候选知识点,结合专家知识库中的已有知识决策路径和语义分析结果,采用多种推理方法进行候选隐含语义推理;其多种推理方法至少包括基于PMI的节点评分方法、一阶谓词逻辑推理方法、贝叶斯推理方法、神经网络推理方法。

【技术特征摘要】
1.一种基于法律专家知识库的上下文推理方法,其特征在于,其包括以下步骤:(1)构建语义向量空间,分为语义向量空间构建和语义向量空间映射,其包括语义向量空间构建和语义空间映射;(2)法律实体识别;(3)法律文本语义分析;(4)隐含语义推理,其包括获取候选知识点、树构建法构建知识路径、获取候选隐含语义和推理结果评估分析;(5)专家知识库更新;其中,在所述步骤(4)中,获取候选知识点采用语义空间向量获取候选节点、树构建法构建知识路径这两个步骤获取候选的知识路径;且获取候选隐含语义是针对候选知识点,结合专家知识库中的已有知识决策路径和语义分析结果,采用多种推理方法进行候选隐含语义推理;其多种推理方法至少包括基于PMI的节点评分方法、一阶谓词逻辑推理方法、贝叶斯推理方法、神经网络推理方法。2.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(1)中,所述语义向量空间构建是通过基于法律文本语料库构建一个法律语义向量库,将文本单元映射到语义空间上的向量,文本单元之间的语义相似度是根据对应向量在语义空间中的距离进行比较,语义接近的词;构建语义向量的训练数据的选择原则是法律相关文本,如裁判文书、法律法规、相关普法文章,作为用Word2Vec方法训练语义向量的语料库,并用训练结果构建语义向量库,以供其它模块在语义映射时使用。3.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(1)中,语义空间映射是将专家知识库中表示专家知识的文本映射为语义空间中的向量,具体步骤如下:(i)对专家知识库的知识图谱中的边/节点(这里的边是指知识图谱中实体节点与实体节点之间的关系及其自身的属性,节点是指知识图谱中的实体及其自身的相关属性中的词语进行过滤处理,去除其中无语义的停用词;(ii)对经步骤(i)操作处理后保留的每一个词语,从已经构建好的语义向量库中获取其在语义向量空间中的映射向量,然后将这些词语对应的语义向量进行累加,进而得到表征该边/节点的总体语义向量。4.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(2)的法律实体识别中,是针对待处理的法律文本进行分词处理,去除停用词后使用实体识别模型进行实体标注识别;同时,该模型还具有未知实体发现的作用,针对模型中不存在的实体,通过总结实体特征,发现具有相同特征的新法律实体;其中,所述实体识别模型是构建法律文本及其标注的法律实体语料,通过相关算法进行机器学习训练,得到用于实体标注识别和新实体发现的模型。5.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(3)的法律文本语义分析中,使用语义分析工具进行语义分析,语义分析的结果包括词性结果、句法分析结果、依存关系分析结果,上述语义分析结果将作为后续候选知识路径构建的辅助判断信息,这里的知识点和知识路径是等同的。6.根据权利要求1所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(4)中,语义空间向量获取候选节点是将实体识别的结果映射到语义向量空间中,同专家知识库中的语义向量进行比较,结合语义分析结果,取相似度最高的多个专家知识库知识实体节点,通过树构建法构建知识路径,作为候选知识点。7.根据权利要求6所述的一种基于法律专家知识库的上下文推理方法,其特征在于,在所述步骤(4)中的树构建法构建知识路径中,构建方法如下:①选择法律实体e1–工作为树根,其中,e1是上述多个专家知识库实体节点的一个;②第一过程为直接关联,首先在专家知识库中选择关系r1可以一步跳到e1的法律实体e2,其中e2的约束条件为:一步跳到e1,并且同时在法律文本和专家知识中出现;③第二过程为多跳关联,其中,多跳关联是指在专家知识中选择关系r2可以链接e2和e3;④第三个过程外部关联,这步...

【专利技术属性】
技术研发人员:郑茂盛杜向阳储昭辉
申请(专利权)人:南京擎盾信息科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1