The invention discloses a method, device and electronic equipment for the amount of money in a referee's document. Among them, the method of extracting the amount of the amount in the referee's document includes the normalization of the text in the referee's document, the parsing of the paragraph group of the text after the normalization and the related paragraph group, and the extraction of the related segments. The amount information and its corresponding context information in the falling group; the credibility score of the amount of money is calculated; the amount information is sorted according to the credibility score, and the amount of information with the highest credibility score is output. The amount extraction method, device and electronic equipment in the referee documents of the present invention can improve the working efficiency, reduce the labor cost, and provide a reliable data base for the case analysis.
【技术实现步骤摘要】
裁判文书中金额的提取方法、装置和电子设备
本专利技术涉及信息处理
,尤其涉及一种裁判文书中金额的提取方法、装置和电子设备。
技术介绍
裁判文书是记载人民法院审理过程和结果,它是诉讼活动结果的载体,也是人民法院确定和分配当事人实体权利义务的惟一凭证。一份结构完整、要素齐全、逻辑严谨的裁判文书,既是当事人享有权利和负担义务的凭证,也是上级人民法院监督下级人民法院民事审判活动的重要依据。目前,主要通过人工的方式来提取出裁判文书中案件的相关金额,从而为人民法院的判决等提供数据基础。然而,随着信息化时代的来临,数据量越来越大。上述方法已无法满足快节奏的操作需求,效率低,人工成本高。
技术实现思路
本专利技术提供一种信息推荐方法、装置和电子设备,以解决上述技术问题中的至少一个。本专利技术实施例提供一种裁判文书中金额的提取方法,包括:对裁判文书中的文本进行归一化处理;对归一化处理后的文本进行段落意群解析,并获取相关段落意群;提取出所述相关段落意群中的金额信息及其对应的上下文信息;计算所述金额信息的可信度得分;根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息。可选的,对裁判文书中的文本进行归一化处理,包括:识别所述文本中的数字信息;对所述数字信息进行归一化。可选的,对所述数字信息进行归一化,包括:修正被标点符号分隔的数字信息;和/或将所述数字信息的表达格式归一化为预设表达格式。可选的,对归一化处理后的文本进行段落意群解析,并获取相关段落意群,包括:将归一化处理后的所述文本切分为多个段落意群;基于预设规则识别出所述相关段落意群和不相关段落意群; ...
【技术保护点】
1.一种裁判文书中金额的提取方法,其特征在于,包括:对裁判文书中的文本进行归一化处理;对归一化处理后的文本进行段落意群解析,并获取相关段落意群;提取出所述相关段落意群中的金额信息及其对应的上下文信息;计算所述金额信息的可信度得分;根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息。
【技术特征摘要】
1.一种裁判文书中金额的提取方法,其特征在于,包括:对裁判文书中的文本进行归一化处理;对归一化处理后的文本进行段落意群解析,并获取相关段落意群;提取出所述相关段落意群中的金额信息及其对应的上下文信息;计算所述金额信息的可信度得分;根据所述可信度得分对所述金额信息进行排序,并输出所述可信度得分最高的金额信息。2.如权利要求1所述的方法,其特征在于,对裁判文书中的文本进行归一化处理,包括:识别所述文本中的数字信息;对所述数字信息进行归一化。3.如权利要求2所述的方法,其特征在于,对所述数字信息进行归一化,包括:修正被标点符号分隔的数字信息;和/或将所述数字信息的表达格式归一化为预设表达格式。4.如权利要求1所述的方法,其特征在于,对归一化处理后的文本进行段落意群解析,并获取相关段落意群,包括:将归一化处理后的所述文本切分为多个段落意群;基于预设规则识别出所述相关段落意群和不相关段落意群;提取所述相关段落意群,并过滤所述不相关段落意群。5.如权利要求1所述的方法,其特征在于,提取出所述相关段落意群中的金额信息及其对应的上下文信息,包括:识别并提取所述金额信息,并将所述金额信息转换为数值形式;基于预设条件获取所述金额信息对应的上下文信息。6.如权利要求1所述的方法,其特征在于,计算所述金额信息的可信度得分,包括:对所述金额信息及其对应的上下文信息进行解析,获得所述金额信息的特征信息;根据所述特征信息,基于预设算法计算得到所述金额信息的可信度得分。7.一种裁判文书中金额的提取装置,其特征在于,包括:归一化模块,用于对裁判文书中的文本进行归一化处理;意群解析模块,用于对归一化处理后的文本进行段...
【专利技术属性】
技术研发人员:王兴让,彭松,秦锋剑,
申请(专利权)人:小草数语北京科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。