法律要素处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26846970 阅读:17 留言:0更新日期:2020-12-25 13:10
本发明专利技术涉及大数据处理技术领域,提供一种法律要素处理方法、装置、电子设备及存储介质,该方法包括:获取法律图像文件;对法律图像文件进行光学字符识别OCR识别,获得法律文书;将法律文书输入至智能编目模型,获得法律文书的多个类别文书;将每个类别文书输入至要素抽取模型,获得类别文书中的第一法律要素;从第一法律要素中提取事件信息;判断事件信息的事件类型是否属于重点关注事件类型;若事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与第一法律要素相关的关联法律要素;输出第一法律要素以及关联法律要素。本发明专利技术可应用在智慧政务、智慧法律等需要进行法律要素处理的领域,从而推动智慧城市的发展。

【技术实现步骤摘要】
法律要素处理方法、装置、电子设备及存储介质
本专利技术涉及大数据处理
,尤其涉及一种法律要素处理方法、装置、电子设备及存储介质。
技术介绍
随着互联网+和司法行业的信息化,法院等司法机关积累了大量的卷宗数据,但现阶段这些卷宗均以图片等非结构化数据的方式进行存储,停留在存档留存使用。现有技术中,通常是采用正则表达式去匹配以提取非结构化数据,然而,这些以图片形式存在的非结构化数据却很难用正则表达式去匹配。因此,如何提取图片形式的非结构化数据是一个亟待解决的技术问题。
技术实现思路
鉴于以上内容,有必要提供一种法律要素处理方法、装置、电子设备及存储介质,能够提高要素提取的效率。本专利技术的第一方面提供一种法律要素处理方法,所述方法包括:获取法律图像文件;对所述法律图像文件进行光学字符识别OCR识别,获得法律文书;将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书;将每个所述类别文书输入至要素抽取模型,获得所述类别文书中的第一法律要素;从所述第一法律要素中提取事件信息;判断所述事件信息的事件类型是否属于重点关注事件类型;若所述事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与所述第一法律要素相关的关联法律要素;输出所述第一法律要素以及所述关联法律要素。在一种可能的实现方式中,所述将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书包括:将所述法律文书输入至预先训练的智能编目模型;获取所述法律文书任意相邻的两页的相关度;若所述相关度大于预设相关度阈值,将所述相邻的两页划分为一类文书;识别每类文书的标题行,并统计每类文书的页码范围;根据每类文书的标题行以及所述页码范围,生成所述法律文书的多个类别文书。在一种可能的实现方式中,所述法律要素处理方法还包括:接收第一用户对所述多个类别文书的第一反馈信息;若所述第一反馈信息表明所述多个类别文书中存在分类错误的类别文书,获取所述第一用户对所述分类错误的类别文书进行修改后的目标类别文书;判断当前时间是否处于预设的低频时间范围内;若所述当前时间处于预设的低频时间范围内,使用所述目标类别文书对所述智能编目模型进行优化训练,获得优化后的智能编目模型。在一种可能的实现方式中,所述法律要素处理方法还包括:接收第二用户对所述第一法律要素的第二反馈信息;若所述第二反馈信息表明所述第一法律要素中存在标注错误的法律要素,获取所述第二用户对所述标注错误的法律要素进行修改后的目标法律要素;判断当前时间是否处于预设的低频时间范围内;若所述当前时间不处于预设的低频时间范围内,判断所述目标法律要素是否属于重要法律要素列表中的法律要素;若所述目标法律要素属于重要法律要素列表中的法律要素,监测电子设备的剩余计算资源;若所述剩余计算资源超过预设资源阈值,使用所述目标法律要素对所述要素抽取模型进行优化训练,获得优化后的要素抽取模型。在一种可能的实现方式中,所述法律要素处理方法还包括:获取预设法律参数;判断所述预设法律参数与所述第一法律要素是否匹配;若所述预设法律参数中存在与所述第一法律要素不匹配的目标法律参数,从所述类别文书中查找与所述目标法律参数匹配的第二法律要素;若所述第二法律要素为所述要素抽取模型未提取的法律要素,判断所述第二法律要素是否属于所述类别文书的关键要素;若所述第二法律要素属于所述类别文书的关键要素,使用所述第二法律要素对所述要素抽取模型进行优化训练,获得优化后的要素抽取模型。在一种可能的实现方式中,所述法律要素处理方法还包括:对所述法律图像文件中的所述第一法律要素进行脱敏处理,获得脱敏图像;获取所述法律图像文件的文件标识;根据所述文件标识以及所述第一法律要素,生成第一签名;对所述第一签名进行加密,生成第一访问密钥;建立所述脱敏图像和所述第一访问密钥的绑定关系。在一种可能的实现方式中,所述法律要素处理方法还包括:接收针对所述脱敏图像的访问请求,所述访问请求携带有第二访问密钥;查询预设的绑定关系中所述脱敏图像对应的第一访问密钥;使用所述第一访问密钥,对所述第二访问密钥进行校验;若校验通过,输出所述脱敏图像中隐藏的所述第一法律要素。本专利技术的第二方面提供一种法律要素处理装置,所述装置包括:获取模块,用于获取法律图像文件;识别模块,用于对所述法律图像文件进行光学字符识别OCR识别,获得法律文书;输入模块,用于将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书;所述输入模块,还用于将每个所述类别文书输入至要素抽取模型,获得所述类别文书中的第一法律要素;提取模块,用于从所述第一法律要素中提取事件信息;判断模块,用于判断所述事件信息的事件类型是否属于重点关注事件类型;查询模块,用于若所述事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与所述第一法律要素相关的关联法律要素;输出模块,用于输出所述第一法律要素以及所述关联法律要素。本专利技术的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的法律要素处理方法。本专利技术的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的法律要素处理方法。由以上技术方案可知,本专利技术可应用在智慧政务、智慧法律等需要进行法律要素处理的领域,从而推动智慧城市的发展。本专利技术中,在对法律图像文件进行识别获得法律文书之后,可以通过智能编目模型以及要素抽取模型,自动化地对所述法律文书进行分类,同时获得每个类别文书的第一法律要素,此外,如果第一法律要素涉及到的事件信息的事件类型属于重点关注事件类型,还可以通过法律要素知识图谱查询与第一法律要素相关的关联法律要素,整个过程,不仅实现了自动化提取法律要素,提高了法律要素提取的效率,同时,还扩展了相关联的法律要素,使得法律要素提取的更全面,挖掘出的数据更有参考价值。附图说明图1是本专利技术公开的一种法律要素处理方法的较佳实施例的流程图。图2是本专利技术公开的一种法律要素处理装置的较佳实施例的功能模块图。图3是本专利技术实现法律要素处理方法的较佳实施例的电子设备的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发本文档来自技高网...

【技术保护点】
1.一种法律要素处理方法,其特征在于,所述法律要素处理方法包括:/n获取法律图像文件;/n对所述法律图像文件进行光学字符识别OCR识别,获得法律文书;/n将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书;/n将每个所述类别文书输入至要素抽取模型,获得所述类别文书中的第一法律要素;/n从所述第一法律要素中提取事件信息;/n判断所述事件信息的事件类型是否属于重点关注事件类型;/n若所述事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与所述第一法律要素相关的关联法律要素;/n输出所述第一法律要素以及所述关联法律要素。/n

【技术特征摘要】
1.一种法律要素处理方法,其特征在于,所述法律要素处理方法包括:
获取法律图像文件;
对所述法律图像文件进行光学字符识别OCR识别,获得法律文书;
将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书;
将每个所述类别文书输入至要素抽取模型,获得所述类别文书中的第一法律要素;
从所述第一法律要素中提取事件信息;
判断所述事件信息的事件类型是否属于重点关注事件类型;
若所述事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与所述第一法律要素相关的关联法律要素;
输出所述第一法律要素以及所述关联法律要素。


2.根据权利要求1所述的法律要素处理方法,其特征在于,所述将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书包括:
将所述法律文书输入至预先训练的智能编目模型;
获取所述法律文书任意相邻的两页的相关度;
若所述相关度大于预设相关度阈值,将所述相邻的两页划分为一类文书;
识别每类文书的标题行,并统计每类文书的页码范围;
根据每类文书的标题行以及所述页码范围,生成所述法律文书的多个类别文书。


3.根据权利要求1所述的法律要素处理方法,其特征在于,所述法律要素处理方法还包括:
接收第一用户对所述多个类别文书的第一反馈信息;
若所述第一反馈信息表明所述多个类别文书中存在分类错误的类别文书,获取所述第一用户对所述分类错误的类别文书进行修改后的目标类别文书;
判断当前时间是否处于预设的低频时间范围内;
若所述当前时间处于预设的低频时间范围内,使用所述目标类别文书对所述智能编目模型进行优化训练,获得优化后的智能编目模型。


4.根据权利要求1所述的法律要素处理方法,其特征在于,所述法律要素处理方法还包括:
接收第二用户对所述第一法律要素的第二反馈信息;
若所述第二反馈信息表明所述第一法律要素中存在标注错误的法律要素,获取所述第二用户对所述标注错误的法律要素进行修改后的目标法律要素;
判断当前时间是否处于预设的低频时间范围内;
若所述当前时间不处于预设的低频时间范围内,判断所述目标法律要素是否属于重要法律要素列表中的法律要素;
若所述目标法律要素属于重要法律要素列表中的法律要素,监测电子设备的剩余计算资源;
若所述剩余计算资源超过预设资源阈值,使用所述目标法律要素对所述要素抽取模型进行优化训练,获得优化后的要素抽取模型。


5.根据权利要求1所述的法律要素处理方法,其特征在于,所述法律要素处理方法还包括:...

【专利技术属性】
技术研发人员:于溦
申请(专利权)人:平安国际智慧城市科技股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1