【技术实现步骤摘要】
法律文本解析方法、装置、设备和存储介质
本申请涉及计算机
,具体而言,涉及一种法律文本解析方法、装置、设备和存储介质。
技术介绍
法律文本泛指一种法律领域的文本,其具有规范性、准确性、严谨性和权威性。法律文本解析就是从法律文本自身和用户需求两个方面对法律领域非结构化或半结构化的法律文本进行结构化的过程。一方面,由于法律文本自身具有规范性、准确性、严谨性和权威性等特点,需要对其进行基础的结构化解析,比如裁判文书的基础信息包括案号、审理程序、案由、裁判日期等,这些基础信息需要进行解析;另一方面,用户往往根据自己的具体业务场景,如非常规司法统计、类案推荐、量刑预测等,提出一些定制的解析需求,从而需要对法律文本进行深度解析。申请号为201510457976.6的中国专利公开了一种基于知识库和规则库的履历信息抽取与特征标识分析系统及方法,利用正则表达式提取履历信息,而由于履历信息属于简单文本,用于提取履历信息的正则表达式规则库数量不大,且不需要专业领域知识,但是对于法律文本的解析,需要法律领域专业知识,使用正则表达式很难 ...
【技术保护点】
1.一种法律文本解析方法,其特征在于,包括:/n获取待解析法律文本;/n对所述待解析法律文本中的目标字段进行梳理,得到目标字段分类体系;/n根据所述目标字段分类体系,构建目标字段解析图;/n根据预设规则,针对所述目标字段构建目标字段规则表达式;/n利用所述目标字段规则表达式对所述目标字段解析图进行遍历解析,得到解析结果。/n
【技术特征摘要】
1.一种法律文本解析方法,其特征在于,包括:
获取待解析法律文本;
对所述待解析法律文本中的目标字段进行梳理,得到目标字段分类体系;
根据所述目标字段分类体系,构建目标字段解析图;
根据预设规则,针对所述目标字段构建目标字段规则表达式;
利用所述目标字段规则表达式对所述目标字段解析图进行遍历解析,得到解析结果。
2.如权利要求1所述的方法,其特征在于,所述根据所述目标字段分类体系,构建目标字段解析图,包括:
根据所述目标字段分类体系,将所述目标字段拆分为至少两个子字段;
以所述各子字段间的依赖关系为依据,将所述各子字段分别设置为所述目标字段解析图的节点;
根据所述各节点的执行方向,对各节点进行有向连线,得到所述目标字段解析图。
3.如权利要求1所述的方法,其特征在于,所述预设规则为依据法律领域知识预设的多个简单规则,所述根据预设规则,针对所述目标字段构建目标字段规则表达式,包括:
根据所述目标字段的语义,引用符合所述目标字段语义的多个所述简单规则;
利用多个所述简单规则构成所述目标字段规则表达式的多个子规则表达式;
对所述多个子规则表达式按照所述目标字段语义进行连接,得到所述目标字段规则表达式。
4.如权利要求3所述的方法,其特征在于,所述利用多个所述简单规则构成所述目标字段规则表达式的多个子规则表达式;对所述多个子规则表达式按照所述目标字段语义进行连接,得到所述目标字段规则表达式,包括:
利用多个所述简单规则构成所述目标字段规则表达式的多个子规则表达式,对所述每一个子规则表达式进行解析测试;
若测试结果为解析错误,则调整对应的子规则表达式,进行所述解析测试;
若测试结果为解析正确,则根据所述目标字段语义判断是否完成所述子规则表达式的选择;若否,则根据所述目标字段语义,引用符合所述目标字段语义的所述简单规则,对所述简单规则构成的所述子规则表达式进行解析测试,若是,则得到所述目标字段规则表达式。
5.如权利要求2所述的方法,其特征在于,所述利用所述目标字段规则表达式对所述目标字段解析图进行遍历解析,得到解析结果,包括:
依据广度优先...
【专利技术属性】
技术研发人员:倪有发,杜向阳,
申请(专利权)人:南京擎盾信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。