【技术实现步骤摘要】
一种裁判文书中的金额解析方法及装置
本专利技术涉及金额解析领域,尤其是一种裁判文书中的金额解析方法及装置。
技术介绍
裁判文书是人民法院行使国家审判权,在案件审理终结后,依据对当事人讼争事实的认定和法律、法规及有关司法解释的规定,对案件的诉讼程序问题和当事人的实体权利义务问题作出的具有法律约束力的司法文件。由于裁判文书中涉及金额的表述方法有多种多样,例如不同的字符形式包括中文大写、中文数据、阿拉伯数据,又如涉及到的语法结构包括:“对所造成的损害3000元,A应当承担70%“,即A应当承担2100元,因此,上述多种形式的数据表示形式会导致裁判文书中涉及金额的提取难度较大。目前通常使用人工提取的方式进行裁判文书中涉及金额的提取。然而,由于裁判文书中数据量庞大,若全部采用人工提取的方式,工作量太大,耗费时间长,而且容易出现错误提取。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种裁判文书中的金额解析方法及装置,能够节省人力,实现自动化裁判文书中的金额提取,并且提高了提取金额的正确度。一方面,本专利技术提供了一种裁判文书中 ...
【技术保护点】
一种裁判文书中的金额解析方法,其特征在于,包括:对裁判文书进行分段获取原告的诉请段落和法院的判决段落;对所述诉请段落和判决段落进行分句;按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取;分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到所述裁判文书中原告的诉请金额和法院的支持金额。
【技术特征摘要】
1.一种裁判文书中的金额解析方法,其特征在于,包括:对裁判文书进行分段获取原告的诉请段落和法院的判决段落;对所述诉请段落和判决段落进行分句;按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取;分别将所述诉请段落和判决段落中各分句提取出的金额进行加总,得到所述裁判文书中原告的诉请金额和法院的支持金额。2.根据权利要求1所述的方法,其特征在于,所述对裁判文书进行分段获取原告的诉请段落和法院的判决段落,包括:以标识一为首、标识二为尾截取原告的诉请段落,所述标识一为原告诉请或者原告诉请的变体,所述标识二为换行符号;以标识三为首、标识四为尾截取法院的判决段落,所述标识三为判决如下或者判决如下的变体,所述标识四为本案或者本案的变体。3.根据权利要求1所述的方法,其特征在于,所述对所述诉请段落和判决段落进行分句,包括:依次以换行符、句号或分号对所述诉请段落和判决段落进行分句。4.根据权利要求1所述的方法,其特征在于,所述按照预定规则对所述诉请段落和判决段落的各个分句中的金额进行提取,包括:按照预定规则对各个分句中的金额进行整理得到预设标准形式的金额:将各个分句中整理得到的预设标准形式的金额进行去重处理,提取去重后的金额。5.根据权利要求4所述的方法,其特征在于,所述按照预定规则对各个分句中的金额进行整理得到预设标准形式的金额,包括:将所述各个分句中涉及中文大小写的金额整理为预设标准形式的金额;对所述各个分句中涉及的比例关系的金额整理为按比例分配后预设标准形式的金额;对所述各个分句中涉及抵扣关系中扣除的金额整理为预设标准形式的金额的负值。6.根据权利要求5所述的方法,其特征在于,所述将所述各个分句中涉及中文大小写的金额整理为预设标准形式的金额,包括:对各个分句进行分词处理,得到多个词语;将所述多个词语中涉及中文大小写金额的词语组合为金额字符串;按照金额单位词将所述金额字符串切分为多个金额切分词;根据每一个金额切分词的金额数值和金额单位计算出每一个金额切分词对应的阿拉伯数值;对所述每一个金额切分词对应的阿拉伯数值求...
【专利技术属性】
技术研发人员:胡斌,崔维福,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。