担保信息获取方法、装置、存储介质及电子设备制造方法及图纸

技术编号:32890691 阅读:14 留言:0更新日期:2022-04-02 12:34
本公开提供一种担保信息获取方法、装置、存储介质及电子设备。先获取待处理的裁判文书;基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;提取出所述待处理文本中所包括的实体;基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。本公开从裁判文书这一特定文本类型中进行担保风险信息的挖掘,依据其相关文本特征实现了结构化担保信息的抽取,弥补了中小企业担保信息无从获取,风险难以评估的问题。估的问题。估的问题。

【技术实现步骤摘要】
担保信息获取方法、装置、存储介质及电子设备


[0001]本公开涉及数据处理
,尤其涉及一种担保信息获取方法、装置、存储介质及电子设备。

技术介绍

[0002]担保业务对于企业来说具有一定风险,一旦被担保方无力偿还到期债务,担保方就不得不承担连带责任而负责清偿债务。担保风险是评估一家企业整体风险的重要维度之一。
[0003]目前来说,担保信息的来源目前主要由上市公司披露,而中小企业的担保信息目前少有公开渠道获取。

技术实现思路

[0004]鉴于以上现有技术的缺点,本公开的目的在于提出一种担保信息获取方法、装置、存储介质及电子设备,用于高效准确地挖掘不同企业的担保信息。
[0005]第一方面,本公开提供一种担保信息获取方法,包括:获取待处理的裁判文书;基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;提取出所述待处理文本中所包括的实体;基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。
[0006]可选的,所述基于案由约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书中的案由字段进行识别,以确定所述裁判文书的案由类目;至少提取出案由类目为借款合同类目的裁判文书,作为待处理文本。
[0007]可选的,述基于关键词约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书进行全文检索,若检索出涉及担保信息的指定关键词,则将所述裁判文书作为待处理文本。
[0008]可选的,所述涉及担保信息的指定关键词至少包括“担保”、“责任保证”、“连带责任”中的一个或多个。
[0009]可选的,所述基于段落约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书进行结构化处理,所述结构化处理后的裁判文书至少包括当事人信息文本块、原告诉称文本块、被告辩称文本块、审理经过文本块、本院查明文本块,以及审判结果文本块中的一个或多个文本块;对结构化处理后的裁判文书进行筛选处理,以保留其中的审理经过文本块、本院查明文本块和审判结果文本块作为待处理文本。
[0010]可选的,所述实体包括企业实体和/或个人实体,提取所述待处理文本中所包括的
实体,包括:采用实体识别模型,识别出所述待处理文本中提及的实体全称;获取第一类正则表达式,所述第一类正则表达式是根据实体全称和实体简称在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第一类正则表达式进行正则匹配,以确定实体全称和实体简称的映射对。
[0011]可选的,述担保信息中还包括保证类型,在确定保证类型时执行以下步骤:当所述待处理文本的文本内容命中关键词“连带责任”时,将所述保证类型确定为连带责任保证;当所述待处理文本的文本内容未命中关键词“连带责任”时,将所述保证类型确定为一般责任保证。
[0012]可选的,所述基于所述实体从所述待处理文本中提取出担保信息,包括:获取第二类正则表达式,所述第二类正则表达式是根据担保方、被担保方以及债权人在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第二类正则表达式和所述实体进行正则匹配,以确定与担保方相匹配的实体、与被担保方相匹配的实体以及与债权人相匹配的实体;将所述正则匹配中所得到的实体确定为担保信息中的对应的担保方、被担保方和债权人。
[0013]可选的,所述基于所述实体从所述待处理文本中提取出担保信息,包括:获取第三类正则表达式,所述第三类正则表达式是根据符合条件的金额信息在所述待处理文本中的表述格式所确定的;基于所述第三类正则表达式在所述待处理文本中进行正则匹配,以提取出符合条件的金额信息;将中文格式的所述金额信息和/或中文、数字混合格式的所述金额信息转为以元为单位的金额数值;从各个所述金额数值中提取出最大的一个金额数值,确定为担保信息中的被保证债权本金。
[0014]可选的,所述担保信息中共包括保证类型、担保方、被担保方、债权人以及被保证债权本金五个维度的数据,所述方法还包括:对所述担保信息进行过滤处理,并保留五个所述维度的数据均不为空的担保信息作为有效担保信息。
[0015]第二方面,基于本公开第一方面所述的担保信息获取方法,本公开的实施例还提供一种担保信息获取装置,包括:文书获取模块,用于获取待处理的裁判文书;文本确定模块,用于基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;实体提取模块,用于提取出所述待处理文本中所包括的实体;担保信息确定模块,用于基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。
[0016]可选的,所述文本确定模块,在基于案由约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书中的案由字段进行识别,以确定所述裁判文书的案由类目;至少提取出案由类目为借款合同类目的裁判文书,作为待处理文本。
[0017]可选的,所述文本确定模块,在基于关键词约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书进行全文检索,若检索出涉及担保信息的指定关键词,则将所述裁判文书作为待处理文本。
[0018]可选的,所述涉及担保信息的指定关键词至少包括“担保”、“责任保证”、“连带责任”中的一个或多个。
[0019]可选的,所述文本确定模块,在所述基于段落约束规则提取出所述裁判文书中的待处理文本时,用于:对所述裁判文书进行结构化处理,所述结构化处理后的裁判文书至少包括当事人信息文本块、原告诉称文本块、被告辩称文本块、审理经过文本块、本院查明文本块,以及审判结果文本块中的一个或多个文本块;对结构化处理后的裁判文书进行筛选处理,以保留其中的审理经过文本块、本院查明文本块和审判结果文本块作为待处理文本。
[0020]可选的,所述实体包括企业实体和/或个人实体,所述实体提取模块,在提取所述待处理文本中所包括的实体时,用于:采用实体识别模型,识别出所述待处理文本中提及的实体全称;获取第一类正则表达式,所述第一类正则表达式是根据实体全称和实体简称在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第一类正则表达式进行正则匹配,以确定实体全称和实体简称的映射对。
[0021]可选的,所述担保信息中还包括保证类型,所述担保信息确定模块,在确定保证类型时,用于:当所述待处理文本的文本内容命中关键词“连带责任”时,将所述保证类型确定为连带责任保证;当所述待处理文本的文本内容未命中关键词“连带责任”时,将所述保证类型确定为一般责任保证。
[0022]可选的,所述担保信息确定模块,在基于所述实体从所述待处理文本中提取出担保信息时,用于:获取第二类正则表达式,所述第二类正则表达式是根据担保方、被担保方以及债权人在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第二类正则表达式和所述实体进行正则匹配,以确定与担保方相匹配的实体、与被担保方相匹配的实体以及与债权本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种担保信息获取方法,其特征在于,包括:获取待处理的裁判文书;基于案由约束规则、关键词约束规则和段落约束规则中的一项或多项规则提取出所述裁判文书中的待处理文本;提取出所述待处理文本中所包括的实体;基于所述实体从所述待处理文本中提取出担保信息,所述担保信息至少包括担保方、被担保方和债权人。2.根据权利要求1所述的担保信息获取方法,其特征在于,所述基于案由约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书中的案由字段进行识别,以确定所述裁判文书的案由类目;至少提取出案由类目为借款合同类目的裁判文书,作为待处理文本。3.根据权利要求1所述的担保信息获取方法,其特征在于,所述基于关键词约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书进行全文检索,若检索出涉及担保信息的指定关键词,则将所述裁判文书作为待处理文本。4.根据权利要求3所述的担保信息获取方法,其特征在于,所述涉及担保信息的指定关键词至少包括“担保”、“责任保证”、“连带责任”中的一个或多个。5.根据权利要求1所述的担保信息获取方法,其特征在于,所述基于段落约束规则提取出所述裁判文书中的待处理文本,包括:对所述裁判文书进行结构化处理,所述结构化处理后的裁判文书至少包括当事人信息文本块、原告诉称文本块、被告辩称文本块、审理经过文本块、本院查明文本块,以及审判结果文本块中的一个或多个文本块;对结构化处理后的裁判文书进行筛选处理,以保留其中的审理经过文本块、本院查明文本块和审判结果文本块作为待处理文本。6.根据权利要求1所述的担保信息获取方法,其特征在于,所述实体包括企业实体和/或个人实体,提取所述待处理文本中所包括的实体,包括:采用实体识别模型,识别出所述待处理文本中提及的实体全称;获取第一类正则表达式,所述第一类正则表达式是根据实体全称和实体简称在所述待处理文本中的表述格式所确定的;在所述待处理文本中,基于所述第一类正则表达式进行正则匹配,以确定实体全称和实体简称的映射对。7.根据权利要求1所述的担保信息获取方法,其特征在于,所述担保信息中还包括保证类型,在确定保证类型时执行以下步骤:当所述待处理文本的文本内容命中关键词“连带责任”时,将所述保证类型确定为连带责任保证;当所述待处理文本的文本内容未命中关键词“连带责任”时,将所述保证类型确定为一般责任保证。8.根据权利要求1所述...

【专利技术属性】
技术研发人员:冷小萱
申请(专利权)人:北京金堤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1