一种裁判文书中的金额解析方法及装置制造方法及图纸

技术编号:15616672 阅读:59 留言:0更新日期:2017-06-14 03:31
本发明专利技术公开了一种裁判文书中的金额解析方法及装置,涉及金额解析领域,主要目的是节省人力,实现自动化裁判文书中的金额提取,并且提高了提取金额的正确度。所述方法包括:首先对裁判文书进行分段获取原告的诉请段落和法院的判决段落,然后对所述诉请段落和判决段落进行分句,按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取,分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到该所述裁判文书中原告的诉请金额和法院的支持金额。本发明专利技术主要用于裁判文书中金额的提取。

【技术实现步骤摘要】
一种裁判文书中的金额解析方法及装置
本专利技术涉及金额解析领域,尤其是一种裁判文书中的金额解析方法及装置。
技术介绍
裁判文书是人民法院行使国家审判权,在案件审理终结后,依据对当事人讼争事实的认定和法律、法规及有关司法解释的规定,对案件的诉讼程序问题和当事人的实体权利义务问题作出的具有法律约束力的司法文件。由于裁判文书中涉及金额的表述方法有多种多样,例如不同的字符形式包括中文大写、中文数据、阿拉伯数据,又如涉及到的语法结构包括:“对所造成的损害3000元,A应当承担70%“,即A应当承担2100元,因此,上述多种形式的数据表示形式会导致裁判文书中涉及金额的提取难度较大。目前通常使用人工提取的方式进行裁判文书中涉及金额的提取。然而,由于裁判文书中数据量庞大,若全部采用人工提取的方式,工作量太大,耗费时间长,而且容易出现错误提取。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种裁判文书中的金额解析方法及装置,能够节省人力,实现自动化裁判文书中的金额提取,并且提高了提取金额的正确度。一方面,本专利技术提供了一种裁判文书中的金额解析方法,包括:对裁判文书进行分段获取原告的诉请段落和法院的判决段落;对所述诉请段落和判决段落进行分句;按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取;分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到所述裁判文书中原告的诉请金额和法院的支持金额。另一方面,本专利技术提供一种裁判文书中的金额解析装置,包括:获取单元,用于对裁判文书进行分段获取原告的诉请段落和法院的判决段落;分句单元,用于对所述诉请段落和判决段落进行分句;提取单元,用于按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取;第一加总单元,用于分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到所述裁判文书中原告的诉请金额和法院的支持金额。借由上述技术方案,本专利技术提供的一种裁判文书中的金额解析方法及装置,首先对裁判文书进行分段获取原告的诉请段落和法院的判决段落,然后对所述诉请段落和判决段落进行分句,通过对裁判文书中各分句内出现的金额形式进行统一,方便后续进行金额计算,按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取,进一步在金额提取的过程中通过多层次逐次加剔除重复的金额,进一步验证金额提取的正确性,最后分别将所述诉请段落和判决段落中各分句解析出的金额进行加总,能够准确解析出裁判文书中的金额。与现有技术的裁判文书中金额解析方法相比,本专利技术通过对裁判文书中多种不同表述形式的金额先统一后再进行提取,能够节省人力,实现自动化裁判文书中的金额提取,并且提高了提取金额的正确度。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1示出了本专利技术实施例提供的一种裁判文书中的金额解析方法流程示意图;图2示出了本专利技术实施例提供的另一种裁判文书中的金额解析方法流程示意图;图3示出了本专利技术实施例提供的一种裁判文书中的金额解析装置结构示意图;图4示出了本专利技术实施例提供的另一种裁判文书中的金额解析装置结构示意图。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本专利技术实施例提供了一种裁判文书中的金额解析方法流程示意图,如图1所示,所述方法包括:101、对裁判文书进行分段获取原告的诉请段落和法院的判决段落。其中,裁判文书是记载人民法院审理过程和结果,它是诉讼结果的载体,也是人民法院确定和分配当事人实体权利义务的唯一凭证。本步骤中对裁判文书进行分段处理,本实施例中选取以标识一为首、标识二为尾截取原告的诉请段落,所述标识一为原告诉请或者原告诉请的变体,所述标识二为换行符号;选取以标识三为首、标识四为尾截取法院的判决段落,所述标识三为判决如下或者判决如下的变体,所述标识四为本案或者本案的变体。其中,所述原告的诉请段落中记录有关于原告的诉请金额,所述法院支持段落中记录有关于法院支持的金额。通过上述的分段过程能够得到裁判文书中的内容分为原告方和法院端的两部分内容,进一步对这两部分内容进行金额提取,获取这两部分中的相关金额。102、对所述诉请段落和判决段落进行分句。本步骤可以依次以换行符、句号或分号对所述诉请段落和判决段落进行分句。具体地,首先根据换行符对所述诉请段落和判决段落进行分句,若根据换行符分隔得到的段落中存在句号,则进一步根据句号对所述段落内的文字进行分句,若根据句号分隔得到的段落中存在分号,则根据分号继续对所述句号内的文字进行分句,直至将所述诉请段落和判决段落分为多个分句为止。103、按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取。本步骤具体为:首先按照预定规则对各个分句中的金额进行整理得到预设标准形式的金额,其中,本实施例对预设标准形式的金额不做限制,具体可根据需求自行设定,例如可将阿拉伯数字作为预设标准形式的金额,则最终得到的金额形式即为阿拉伯数字形式的金额,然后将各个分句中整理得到的预设标准形式的金额进行去重处理,提取去重后的金额。其中,所述将各个分句中整理得到的预设标准形式的金额进行去重处理,提取去重后的金额,具体为:对各个分句中整理出的金额中重复的金额进行剔除,例如对于分句中“应赔偿受害人张三医药费1000元,护工费2000元,总计赔偿3000元”,此时由于前两个金额1000元和2000元的加和为3000元,此时前两个金额为第三个金额的重复金额,需要将前两个金额剔除。104、分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到该所述裁判文书中原告的诉请金额和法院的支持金额。其中,分别将步骤103中提取出的诉请段落中的金额和判决段落中的金额进行加和,得到所述裁判文书中原告的诉请金额和法院的支持金额,并且做相应的金额记录。本专利技术实施例提供的一种裁判文书中的金额解析方法,首先对裁判文书进行分段获取原告的诉请段落和法院的判决段落,然后对所述诉请段落和判决段落进行分句,按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取,能够准确解析出裁判文书中的金额。与现有技术的裁判文书中金额解析方法相比,本专利技术通过对裁判文书中多种不同表述形式的金额先统一后再进行提取,能够节省人力,实现自动化裁判文书中的金额提取,并且提高了提取金额的正确度。本专利技术实施例提供了另一种裁判文书中的金额解析方法,如图2所示,所述方法包括:201、以标识一为首、标识二为尾截取原告的诉请段落,所述标识一为原告诉请或者原告诉请的变体,所述标识二为换行符号。本文档来自技高网...
一种裁判文书中的金额解析方法及装置

【技术保护点】
一种裁判文书中的金额解析方法,其特征在于,包括:对裁判文书进行分段获取原告的诉请段落和法院的判决段落;对所述诉请段落和判决段落进行分句;按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取;分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到所述裁判文书中原告的诉请金额和法院的支持金额。

【技术特征摘要】
1.一种裁判文书中的金额解析方法,其特征在于,包括:对裁判文书进行分段获取原告的诉请段落和法院的判决段落;对所述诉请段落和判决段落进行分句;按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取;分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到所述裁判文书中原告的诉请金额和法院的支持金额。2.根据权利要求1所述的方法,其特征在于,所述对裁判文书进行分段获取原告的诉请段落和法院的判决段落,包括:以标识一为首、标识二为尾截取原告的诉请段落,所述标识一为原告诉请或者原告诉请的变体,所述标识二为换行符号;以标识三为首、标识四为尾截取法院的判决段落,所述标识三为判决如下或者判决如下的变体,所述标识四为本案或者本案的变体。3.根据权利要求1所述的方法,其特征在于,所述对所述诉请段落和判决段落进行分句,包括:依次以换行符、句号或分号对所述诉请段落和判决段落进行分句。4.根据权利要求1所述的方法,其特征在于,所述按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取,包括:按照预定规则对各个分句中的金额进行整理得到预设标准形式的金额:将各个分句中整理得到的预设标准形式的金额进行去重处理,提取去重后的金额。5.根据权利要求4所述的方法,其特征在于,所述按照预定规则对各个分句中的金额进行整理得到预设标准形式的金额,包括:将所述各个分句中涉及中文大小写的金额整理为预设标准形式的金额;对所述各个分句中涉及的比例关系的金额整理为按比例分配后预设标准形式的金额;对所述各个分句中涉及抵扣关系中扣除的金额整理为预设标准形式的金额的负值。6.根据权利要求5所述的方法,其特征在于,所述将所述各个分句中涉及中文大小写的金额整理为预设标准形式的金额,包括:对各个分句进行分词处理,得到多个词语;将所述多个词语中涉及中文大小写金额的词语组合为金额字符串;按照金额单位词将所述金额字符串切分为多个金额切分词;根据每一个金额切分词的金额数值和金额单位计算出每一个金额切分词对应的阿拉伯数值;对所述每一个金额切分词对应的阿拉伯数值求...

【专利技术属性】
技术研发人员:胡斌崔维福
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1