法律文书处理方法及装置制造方法及图纸

技术编号:23765873 阅读:59 留言:0更新日期:2020-04-11 19:48
本申请公开了一种法律文书处理方法及装置,可以获得待处理的法律文书中的多个自然段落;通过机器学习方法确定获得的各所述自然段落归属的文书部分;对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组。由于本申请可以通过机器学习方法确定各自然段落归属的文书部分并进一步根据自然段落归属的文书部分将自然段落划分为段落组。因此本申请可以自动将法律文书划分为对应文书部分的多个段落组。当用户需要查找某文书部分的文字时,可以直接从该文书部分的段落组中找到相关文字,简单方便,节省了用户的时间。

Legal document processing methods and devices

【技术实现步骤摘要】
法律文书处理方法及装置
本申请涉及文本处理
,尤其涉及法律文书处理方法及装置。
技术介绍
随着我国科学技术水平的提高,用户对办公自动化的要求也越来越高。在司法领域,用户常需要从大量的法律文书中获得某个或某些文书部分的文字,例如:从大量的裁定书中获得判决部分的文字。由于法律文书的数量巨大,因此用户需要花费较长的时间才能分别从各法律文书中获得所需要的文书部分的文字。如何帮助用户快速从法律文书中获得所需要的文书部分的文字仍是本领域一个亟待解决的技术难题。
技术实现思路
鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的法律文书处理方法及装置,方案如下:一种法律文书处理方法,包括:获得待处理的法律文书中的多个自然段落;通过机器学习方法确定获得的各所述自然段落归属的文书部分;对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组,其中,同一段落组中各自然段落归属的文书部分相同,位于不同段落组中的自然段落归属的文书部分不同。可选的,在所述对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组之后,所述方法还包括:对任一段落组:确定该段落组中各自然段落的段号中的最小段号和最大段号,将段号位于所述最小段号和所述最大段号以内的各自然段落确定为该段落组对应的待分析段落;确定该段落组对应的待分析段落否均归属同一文书部分,如果是,则确定该段落组对应的各待分析段落归属的文书部分正确;否则,确定该段落组对应的待分析段落中存在至少一个自然段落需要校正。可选的,在所述确定该段落组对应的待分析段落中存在至少一个自然段落需要校正之后,所述方法还包括:为该段落组对应的各待分析段落添加待人工校正标识;或者,根据第一统计结果及该段落组对应的各待分析段落在法律文书中的排列顺序,确定该段落组对应的待分析段落中的待校正段落,对所述待校正段落进行校正处理,其中,所述第一统计结果为该段落组对应的各待分析段落归属的文书部分的统计结果。可选的,所述根据第一统计结果及该段落组对应的各待分析段落在法律文书中的排列顺序,确定该段落组对应的待分析段落中的待校正段落,包括:确定第一段落子组中自然段落的数量为第一数量,确定第二段落子组中自然段落的数量为第二数量,其中,所述第一段落子组中各自然段落依次相邻且均归属于该段落组对应的文书部分,所述第二段落子组中各自然段落依次相邻且均归属于该段落组对应的文书部分,所述第一段落子组中包括所述最小段号的自然段落,所述第二段落子组中包括所述最大段号的自然段落;将该段落组对应的各待分析段落归属的各文书部分中除该段落组对应的文书部分外的其他文书部分确定为待分析部分Li,其中,该段落组对应的文书部分为该段落组中各自然段落归属的文书部分;对任一待分析部分Li:确定第i段落子组中自然段落的数量为第i数量,其中,所述第i段落子组中各自然段落依次相邻且均归属于Li,i为待分析部分的序号,i为自然数且i大于2;在所述第一数量和所述第二数量均大于所述第i数量时,将归属于该Li的各待分析段落确定为待校正段落。可选的,所述对所述待校正段落进行校正处理,包括:将各待校正段落归属的文书部分校正为:该段落组对应的文书部分。可选的,所述方法还包括:对至少一个段落组:将该段落组中各自然段落的文本格式设置为与该段落组对应的文书部分匹配的文本格式。可选的,所述通过机器学习方法确定获得的各所述自然段落归属的文书部分,包括:将获得的各所述自然段落输入预设的机器学习模型中,获得所述机器学习模型输出的各所述自然段落归属的文书部分,其中,所述机器学习模型是对预设训练数据进行机器学习得到的,所述预设训练数据为:已确定各自然段落所归属的文书部分的法律文书。一种法律文书处理装置,包括:第一获得模块、第一确定模块和文书划分模块,所述第一获得模块,用于获得待处理的法律文书中的多个自然段落;所述第一确定模块,用于通过机器学习方法确定获得的各所述自然段落归属的文书部分;所述文书划分模块,用于对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组,其中,同一段落组中各自然段落归属的文书部分相同,位于不同段落组中的自然段落归属的文书部分不同。一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在的设备执行上述的任一种法律文书处理方法。一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述的任一种法律文书处理方法。借由上述技术方案,本申请提供的一种法律文书处理方法及装置,可以获得待处理的法律文书中的多个自然段落;通过机器学习方法确定获得的各所述自然段落归属的文书部分;对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组。由于本申请可以通过机器学习方法确定各自然段落归属的文书部分并进一步根据自然段落归属的文书部分将自然段落划分为段落组。因此本申请可以自动将法律文书划分为对应文书部分的多个段落组。当用户需要查找某文书部分的文字时,可以直接从该文书部分的段落组中找到相关文字,简单方便,节省了用户的时间。上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本申请实施例提供的一种法律文书处理方法的流程图;图2示出了本申请实施例提供的另一种法律文书处理方法的流程图;图3示出了本申请实施例提供的另一种法律文书处理方法中校正处理的流程图;图4示出了本申请实施例提供的一种法律文书处理装置的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。如图1所示,本申请实施例提供的一种法律文书处理方法,可以包括:S100、获得待处理的法律文书中的多个自然段落;其中,本申请实施例中的法律文书可以有多种不同的类型,例如:判决书、裁定书本文档来自技高网...

【技术保护点】
1.一种法律文书处理方法,其特征在于,包括:/n获得待处理的法律文书中的多个自然段落;/n通过机器学习方法确定获得的各所述自然段落归属的文书部分;/n对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组,其中,同一段落组中各自然段落归属的文书部分相同,位于不同段落组中的自然段落归属的文书部分不同。/n

【技术特征摘要】
1.一种法律文书处理方法,其特征在于,包括:
获得待处理的法律文书中的多个自然段落;
通过机器学习方法确定获得的各所述自然段落归属的文书部分;
对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组,其中,同一段落组中各自然段落归属的文书部分相同,位于不同段落组中的自然段落归属的文书部分不同。


2.根据权利要求1所述的方法,其特征在于,在所述对任一待处理的法律文书:根据该待处理的法律文书中的多个自然段落归属的文书部分,将该待处理的法律文书中的多个自然段落划分为至少一个段落组之后,所述方法还包括:
对任一段落组:确定该段落组中各自然段落的段号中的最小段号和最大段号,将段号位于所述最小段号和所述最大段号以内的各自然段落确定为该段落组对应的待分析段落;
确定该段落组对应的待分析段落否均归属同一文书部分,如果是,则确定该段落组对应的各待分析段落归属的文书部分正确;否则,确定该段落组对应的待分析段落中存在至少一个自然段落需要校正。


3.根据权利要求2所述的方法,其特征在于,在所述确定该段落组对应的待分析段落中存在至少一个自然段落需要校正之后,所述方法还包括:
为该段落组对应的各待分析段落添加待人工校正标识;
或者,根据第一统计结果及该段落组对应的各待分析段落在法律文书中的排列顺序,确定该段落组对应的待分析段落中的待校正段落,对所述待校正段落进行校正处理,其中,所述第一统计结果为该段落组对应的各待分析段落归属的文书部分的统计结果。


4.根据权利要求3所述的方法,其特征在于,所述根据第一统计结果及该段落组对应的各待分析段落在法律文书中的排列顺序,确定该段落组对应的待分析段落中的待校正段落,包括:
确定第一段落子组中自然段落的数量为第一数量,确定第二段落子组中自然段落的数量为第二数量,其中,所述第一段落子组中各自然段落依次相邻且均归属于该段落组对应的文书部分,所述第二段落子组中各自然段落依次相邻且均归属于该段落组对应的文书部分,所述第一段落子组中包括所述最小段号的自然段落,所述第二段落子组中包括所述最大段号的自然段落;
将该段落组对应的各待分析段落归属的各文书部分中除该段落组对应的...

【专利技术属性】
技术研发人员:石鹏王福伟
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1