自动提取裁判文书涉案标的和裁判结果的方法及装置制造方法及图纸

技术编号:24206501 阅读:90 留言:0更新日期:2020-05-20 14:53
本发明专利技术公开了一种自动提取裁判文书涉案标的和裁判结果的方法及装置,包括:从裁判文书文本中提取当事人及当事人法律地位;从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;将提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将裁判结果段落分句后,对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;将每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;将每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到相关涉案标的。

The method and device of automatically extracting the object involved in the judgment document and the judgment result

【技术实现步骤摘要】
自动提取裁判文书涉案标的和裁判结果的方法及装置
本专利技术涉及一种自动提取裁判文书涉案标的和裁判结果的方法及装置。
技术介绍
在信息时代,特别在大数据风控的背景下,企业需要各个维度的信息帮助企业的经营投资等决策。司法涉诉一般作为评估目标主体信用风险的一个重要的维度,其中,裁判文书包含案件当事人、案由、裁判结果、涉案金额等内容,已被视为当事人信用及经营风险评估的重要数据来源,案件的裁判结果和涉案金额,更是成为主体风控模型中的重要维度。由于裁判文书内容是非结构化的文本,参与建模前还需要通过自然语言处理技术将文本结构化。但在目前的普遍应用中,对案件的裁判结果和涉案金额的解析并未结合当事人因素,笼统地将整个案件的涉案金额、裁判结果归到所有当事人身上,可能并不符合实际裁判情况,尤其是同一角色涉及多个当事人时,偏差尤为明显。
技术实现思路
针对上述现有技术的不足,本专利技术所要解决的技术问题是:提供一种在评估目标主体信用风险时,能够将裁判文书中所含的当事人、案由、裁判结果、涉案金额等内容提取出来以作为评估参考的自动提取裁判文书涉案标的和裁判结果的方法及装置。为解决上述技术问题,本专利技术采用的一个技术方案是:提供一种自动提取裁判文书涉案标的和裁判结果的方法,包括以下步骤:S101、根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;S102、根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;S103、将S101步骤提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将S102步骤中所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;S104、将S103步骤中每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;S105、将S103步骤中每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。进一步的,在S101步骤中,根据司法诉讼中当事人法律地位标识,全文本检索涉案当事人所在裁判文书文本中位置,提取该位置对应段落,对其分句并根据停止标识对句子进行清洗得到该案中所有涉案当事人和当事人法律地位。进一步的,在S102步骤中,根据“裁定如下”、“判决如下”或其变体作为第二标识的起始标识,“法官署名”段落或其变体作为第二标识的结束标识,提取起始标识和结束标识之间的内容作为裁判结果段落。进一步的,在S103步骤中,根据以下分类和规则识别带入参数:优先识别裁判结果是否提及具体当事人及其当事人法律地位,若有结果,则将具体当事人及其对应的法律地位带入到当事人项及对应的法律地位项中,若无结果,则识别是否裁判结果是否提及具体当事人,若有结果,则将具体当事人带入到当事人项中,若无结果,则识别裁判结果是否提及当事人法律地位,若有结果,则将具体当事人法律地位带入到法律地位项,若以上皆无结果,则当事人及法律地位项输入参数均为空。为解决上述技术问题,本专利技术采用的另一个技术方案是:提供一种自动提取裁判文书涉案标的和裁判结果的装置,包括:当事人及当事人法律地位提取模块,用于根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;裁判结果提取处理模块,用于根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;关联模块,用于将所述当事人及当事人法律地位提取模块提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将S102步骤中所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;裁判结果处理模块,用于将所述关联模块关联到的每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;以及涉案标的处理模块,用于将所述关联模块关联到每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。进一步的,所述当事人及当事人法律地位提取模块还用于根据司法诉讼中当事人法律地位标识,全文本检索涉案当事人所在裁判文书文本中位置,提取该位置对应段落,对其分句并根据停止标识对句子进行清洗得到该案中所有涉案当事人和当事人法律地位。进一步的,识的起始标识,“法官署名”段落或其变体作为第二标识的结束标识,提取起始标识和结束标识之间的内容作为裁判结果段落。进一步的,所述关联模块还用于根据以下分类和规则识别带入参数:优先识别裁判结果是否提及具体当事人及其当事人法律地位,若有结果,则将具体当事人及其对应的法律地位带入到当事人项及对应的法律地位项中,若无结果,则识别是否裁判结果是否提及具体当事人,若有结果,则将具体当事人带入到当事人项中,若无结果,则识别裁判结果是否提及当事人法律地位,若有结果,则将具体当事人法律地位带入到法律地位项,若以上皆无结果,则当事人及法律地位项输入参数均为空。通过本自动提取裁判文书涉案标的和裁判结果的方法及装置,在对海量裁判文书文本分析时,自动化和精确提取裁判结果中针对该当事人的裁判结果和法院支持涉案标的,解决人工提取判决结果效率低成本高等问题,节省人力,提高准确性,在金融科技、信用科技应用领域为目标主体信用风险的评估和控制的业务场景提供决策支持,并不限于上述领域风控场景。本专利技术的自动提取裁判文书涉案标的和裁判结果的方法及装置能够精确提取裁判文书中具体当事人的权利和义务、判决结果、法院支持标的。准确识别裁判结果段落中每个裁判事件与各当事人的相关性,把裁判结果按照当事人分类,精确提取裁判结果文本中各当事人的权利和义务、判决结果、法院支持标的;构建裁判文书体库和当事人裁判结果提取规则从裁判文书判决结果提取关键字,清洗、过滤后加入裁判文书体关键词库,将需要解析的裁判文书的当事人、当事人法律地位标识带入文书体关键词库构建裁判结果提取规则,基于这个提取规则文本解析可精确提取到各涉案当事人在该案中裁判结果和涉案标的。附图说明图1是本专利技术自动提取裁判文书涉案标的和裁判结果的方法一实施例的流程图。图2是本专利技术自动提取裁判文书涉案标的和裁判结果的方法一实施例中裁判文书体判词词库和提取规则构建图。图3是本专利技术自动提取裁判文书涉案标的和裁判结果的方法具体实例中涉案当事人及法律地位提取内容示意图。图4是本专利技术自动提取裁判文书涉案标的和裁判结果的方法具体实例中判决结果提取内容示意图。图5是提取结果关联图。图6是本专利技术自动提取裁判文书涉案标的和裁判结果的装置一实施例的方框图。具体实施方式下面将结合本专利技术实施例本文档来自技高网...

【技术保护点】
1.一种自动提取裁判文书涉案标的和裁判结果的方法,包括以下步骤:/nS101、根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;/nS102、根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;/nS103、将S101步骤提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将S102步骤中所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;/nS104、将S103步骤中每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;/nS105、将S103步骤中每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。/n

【技术特征摘要】
1.一种自动提取裁判文书涉案标的和裁判结果的方法,包括以下步骤:
S101、根据预设的第一标识和规则从裁判文书文本中提取当事人及当事人法律地位;
S102、根据预设的第二标识和规则从裁判文书文本中提取裁判结果段落,将裁判结果段落进行分句,逐句检索并保留不包含停止标识的句子再清洗;
S103、将S101步骤提取的当事人和当事人法律地位作为参数带入文书关键词库构建得到裁判结果提取规则,将S102步骤中所得到的裁判结果段落分句后,由提取规则对每一个分句分别关联出该分句提及到的当事人对应的裁判结果和该分句中所提及金额;
S104、将S103步骤中每个当事人关联得到的裁判结果再进行结果映射,去重、合并得到各当事人在该案中对应的法院支持该当事人的裁判结果;
S105、将S103步骤中每个当事人关联得到的所有金额分别进行清洗、转换、根据规则去重、计算加总后得到该当事人在该案中法院所支持的涉案标的。


2.如权利要求1所述的自动提取裁判文书涉案标的和裁判结果的方法,其特征在于:在S101步骤中,根据司法诉讼中当事人法律地位标识,全文本检索涉案当事人所在裁判文书文本中位置,提取该位置对应段落,对其分句并根据停止标识对句子进行清洗得到该案中所有涉案当事人和当事人法律地位。


3.如权利要求2所述的自动提取裁判文书涉案标的和裁判结果的方法,其特征在于:在S102步骤中,
根据“裁定如下”、“判决如下”或其变体作为第二标识的起始标识,“法官署名”段落或其变体作为第二标识的结束标识,提取起始标识和结束标识之间的内容作为裁判结果段落。


4.如权利要求3所述的自动提取裁判文书涉案标的和裁判结果的方法,其特征在于,在S103步骤中,根据以下分类和规则识别带入参数:
优先识别裁判结果是否提及具体当事人及其当事人法律地位,若有结果,则将具体当事人及其对应的法律地位带入到当事人项及对应的法律地位项中,若无结果,则识别是否裁判结果是否提及具体当事人,若有结果,则将具体当事人带入到当事人项中,若无结果,则识别裁判结果是否提及当事人法律地位,若有结果,则将具体当事人法律地位带入到法律地位项,若以上皆无结果,则当事人及法律地位项输入参数均为空。


5.一种自动提取裁判文书涉案标的和裁判结果的装置,包括...

【专利技术属性】
技术研发人员:申庆忠刘刚谭焕云黄元庆邓大成
申请(专利权)人:中证信用增进股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1