法律裁判文书的解析方法及装置制造方法及图纸

技术编号:15616682 阅读:58 留言:0更新日期:2017-06-14 03:31
本申请公开了一种法律裁判文书的解析方法及装置。其中,该方法包括:获取待解析法律裁判文书的文本,其中,待解析法律裁判文书的文本包括多个自然段落;将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及分别对至少一个段落集合的文本内容进行解析。本申请解决了相关技术中法律裁判文书的解析准确性较差的技术问题。

【技术实现步骤摘要】
法律裁判文书的解析方法及装置
本申请涉及法律裁判文书处理领域,具体而言,涉及一种法律裁判文书的解析方法及装置。
技术介绍
通常,对于法律裁判文书,往往需要去解析裁判文书的类型、每个段落以及提取每个段落的维度信息等参数。对人民法院下发的裁判文书进行解析,可以帮助用户获取更多有效的法律参考信息。但是,目前,对法律裁判文书的解析仍然采用人工解析的方式来实现。一般是由人工去区分文书的不同类型、文书的各个段落以及提取每段文书的维度信息。由于人民法院下发的法律裁判文书类型丰富,包含的信息量也比较大,信息维度也比较多(例如,原告、被告、上诉人、被上诉人、证据、判决结果和费用等),因此,依靠人工去区分不同文书的各个段落以及提取每段文书的维度信息,工作量非常大。借助法律裁判文书检索系统,可对法律裁判文书进行简单地搜索归纳。但是,由于当前的法律裁判文书检索系统通常只是对法律裁判文书的全文内容进行解析,因此,导致检索结果参差不齐,一般仅对包含某些固定关键词的相关内容进行罗列,或者只进行简单地信息分类。可见,通过当前的法律文书检索系统获取的法律裁判文书的解析结果的准确性较差。针对相关技术中法律裁判文书的解析准确性较差的技术问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种法律裁判文书的解析方法及装置,以至少解决相关技术中法律裁判文书的解析准确性较差的技术问题。根据本申请实施例的一个方面,提供了一种法律裁判文书的解析方法,该方法包括:获取待解析法律裁判文书的文本,其中,待解析法律裁判文书的文本包括多个自然段落;将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及分别对至少一个段落集合的文本内容进行解析。进一步地,将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合包括:将多个预设匹配规则集合中的每个预设匹配规则集合依次与每个自然段落执行匹配处理;以及将每个自然段落划分至第一个匹配出的预设匹配规则集合所对应的段落集合。进一步地,将多个预设匹配规则集合中的每个预设匹配规则集合依次与每个自然段落执行匹配处理包括:依次获取自然段落与多个预设匹配规则集合的匹配度;以及将第一个获取到的匹配度达到预设匹配度阈值的预设匹配规则集合,作为该自然段落第一个匹配出的预设匹配规则集合。进一步地,依次获取自然段落与多个预设匹配规则集合的匹配度包括:依次确定每个预设匹配规则集合中包括的与自然段落相匹配的预设匹配规则;以及根据与该自然段落相匹配的预设匹配规则的优先级获取该自然段落与每个预设匹配规则集合的匹配度。进一步地,多个预设匹配规则集合包括第一预设匹配规则集合,依次确定每个预设匹配规则集合中包括的与自然段落相匹配的预设匹配规则包括:按照预设匹配规则的优先级由大到小的次序,依次检测第一预设匹配规则集合中的预设匹配规则是否与自然段落相匹配,其中,每检测到第一预设匹配规则集合中的一个预设匹配规则与该自然段落相匹配,则记录该预设匹配规则的优先级,根据与自然段落相匹配的预设匹配规则的优先级获取该自然段落与每个预设匹配规则集合的匹配度包括:依次获取第一预设匹配规则集合中与该自然段落相匹配的预设匹配规则的优先级,并计算已经获取到的优先级的平均值,直到优先级的平均值达到预设匹配度阈值,或者直到获取到第一预设匹配规则集合中与该自然段落相匹配的最后一个预设匹配规则的优先级;以及根据已经获取到的优先级的平均值计算该自然段落与第一预设匹配规则集合的匹配度。进一步地,在一个自然段落匹配出对应的预设匹配规则集合之后,将多个预设匹配规则集合中的每个预设匹配规则集合依次与每个自然段落执行匹配处理包括:对于一个自然段落的下一个自然段落,将该一个自然段落所对应的预设匹配规则集合与下一个自然段落执行匹配处理,并检测是否匹配成功;如果检测出未匹配成功,则将下一个自然段落与多个预设匹配规则集合中的其他预设匹配规则集合依次执行匹配处理,直到匹配到一个预设匹配规则集合或者直到与其他预设匹配规则集合均执行了匹配但都未匹配成功。进一步地,在获取待解析法律裁判文书的文本包括的多个自然段落之前,该方法还包括:检测待解析法律裁判文书的文本中是否包括预设标识,其中,预设标识为解析法律裁判文书的文本中与文本内容无关的标识;以及如果检测出待解析法律裁判文书的文本中包括预设标识,则清除预设标识。根据本申请实施例的另一方面,还提供了一种法律裁判文书的解析装置,该装置包括:获取单元,用于获取待解析法律裁判文书的文本,其中,待解析法律裁判文书的文本包括多个自然段落;匹配执行单元,用于将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;划分单元,用于将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及解析单元,用于分别对至少一个段落集合的文本内容进行解析。进一步地,匹配执行单元包括:匹配执行模块,用于将多个预设匹配规则集合中的每个预设匹配规则集合依次与每个自然段落执行匹配处理;以及划分模块,用于将每个自然段落划分至第一个匹配出的预设匹配规则集合所对应的段落集合。进一步地,匹配执行模块包括:获取子模块,用于依次获取自然段落与多个预设匹配规则集合的匹配度;以及确定子模块,用于将第一个获取到的匹配度达到预设匹配度阈值的预设匹配规则集合,作为该自然段落第一个匹配出的预设匹配规则集合。在本申请实施例中,采用以下方法:获取待解析法律裁判文书的文本,其中,待解析法律裁判文书的文本包括多个自然段落;将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及分别对至少一个段落集合的文本内容进行解析,解决了相关技术中文本解析准确性较差的技术问题,进而通过将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,并分别对段落集合的文本内容进行解析,达到了提高文本解析准确性的技术效果。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请第一实施例的法律裁判文书的解析方法的流程图;图2是根据本申请第二实施例的法律裁判文书的解析方法的流程图;以及图3是根据本申请实施例的法律裁判文书的解析装置的示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下本文档来自技高网
...
法律裁判文书的解析方法及装置

【技术保护点】
一种法律裁判文书的解析方法,其特征在于,包括:获取待解析法律裁判文书的文本,其中,所述待解析法律裁判文书的文本包括多个自然段落;将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及分别对所述至少一个段落集合的文本内容进行解析。

【技术特征摘要】
1.一种法律裁判文书的解析方法,其特征在于,包括:获取待解析法律裁判文书的文本,其中,所述待解析法律裁判文书的文本包括多个自然段落;将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合,其中,每个预设匹配规则集合包括一个或多个预设匹配规则;将对应相同的预设匹配规则集合的自然段落划分至同一个段落集合,得到至少一个段落集合;以及分别对所述至少一个段落集合的文本内容进行解析。2.根据权利要求1所述的方法,其特征在于,将每个自然段落依次与多个预设匹配规则集合执行匹配处理,得到每个自然段落对应的预设匹配规则集合包括:将所述多个预设匹配规则集合中的每个预设匹配规则集合依次与所述每个自然段落执行匹配处理;以及将所述每个自然段落划分至第一个匹配出的预设匹配规则集合所对应的段落集合。3.根据权利要求2所述的方法,其特征在于,将所述多个预设匹配规则集合中的每个预设匹配规则集合依次与所述每个自然段落执行匹配处理包括:依次获取所述自然段落与所述多个预设匹配规则集合的匹配度;以及将第一个获取到的匹配度达到预设匹配度阈值的预设匹配规则集合,作为所述自然段落第一个匹配出的预设匹配规则集合。4.根据权利要求3所述的方法,其特征在于,依次获取所述自然段落与所述多个预设匹配规则集合的匹配度包括:依次确定每个预设匹配规则集合中包括的与所述自然段落相匹配的预设匹配规则;以及根据与所述自然段落相匹配的预设匹配规则的优先级获取所述自然段落与所述每个预设匹配规则集合的匹配度。5.根据权利要求4所述的方法,其特征在于,所述多个预设匹配规则集合包括第一预设匹配规则集合,依次确定每个预设匹配规则集合中包括的与所述自然段落相匹配的预设匹配规则包括:按照预设匹配规则的优先级由大到小的次序,依次检测所述第一预设匹配规则集合中的预设匹配规则是否与所述自然段落相匹配,其中,每检测到所述第一预设匹配规则集合中的一个预设匹配规则与所述自然段落相匹配,则记录该预设匹配规则的优先级,根据与所述自然段落相匹配的预设匹配规则的优先级获取所述自然段落与所述每个预设匹配规则集合的匹配度包括:依次获取所述第一预设匹配规则集合中与所述自然段落相匹配的预设匹配规则的优先级,并计算已经获取到的优先级的平均值,直到所述优先级的平均值达到所述预设匹配度阈值,或者直到获取到所述第一预设匹配规则集合...

【专利技术属性】
技术研发人员:李轶崔维福
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1