【技术实现步骤摘要】
法律要素处理方法、装置、电子设备及存储介质
本专利技术涉及大数据处理
,尤其涉及一种法律要素处理方法、装置、电子设备及存储介质。
技术介绍
随着互联网+和司法行业的信息化,法院等司法机关积累了大量的卷宗数据,但现阶段这些卷宗均以图片等非结构化数据的方式进行存储,停留在存档留存使用。现有技术中,通常是采用正则表达式去匹配以提取非结构化数据,然而,这些以图片形式存在的非结构化数据却很难用正则表达式去匹配。因此,如何提取图片形式的非结构化数据是一个亟待解决的技术问题。
技术实现思路
鉴于以上内容,有必要提供一种法律要素处理方法、装置、电子设备及存储介质,能够提高要素提取的效率。本专利技术的第一方面提供一种法律要素处理方法,所述方法包括:获取法律图像文件;对所述法律图像文件进行光学字符识别OCR识别,获得法律文书;将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书;将每个所述类别文书输入至要素抽取模型,获得所述类别文书中的第一法律要素;从所述第一法律要素中提取事件信息;判断所述事件信息的事件类型是否属于重点关注事件类型;若所述事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与所述第一法律要素相关的关联法律要素;输出所述第一法律要素以及所述关联法律要素。在一种可能的实现方式中,所述将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书包括: ...
【技术保护点】
1.一种法律要素处理方法,其特征在于,所述法律要素处理方法包括:/n获取法律图像文件;/n对所述法律图像文件进行光学字符识别OCR识别,获得法律文书;/n将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书;/n将每个所述类别文书输入至要素抽取模型,获得所述类别文书中的第一法律要素;/n从所述第一法律要素中提取事件信息;/n判断所述事件信息的事件类型是否属于重点关注事件类型;/n若所述事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与所述第一法律要素相关的关联法律要素;/n输出所述第一法律要素以及所述关联法律要素。/n
【技术特征摘要】
1.一种法律要素处理方法,其特征在于,所述法律要素处理方法包括:
获取法律图像文件;
对所述法律图像文件进行光学字符识别OCR识别,获得法律文书;
将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书;
将每个所述类别文书输入至要素抽取模型,获得所述类别文书中的第一法律要素;
从所述第一法律要素中提取事件信息;
判断所述事件信息的事件类型是否属于重点关注事件类型;
若所述事件信息的事件类型属于重点关注事件类型,通过法律要素知识图谱查询与所述第一法律要素相关的关联法律要素;
输出所述第一法律要素以及所述关联法律要素。
2.根据权利要求1所述的法律要素处理方法,其特征在于,所述将所述法律文书输入至预先训练的智能编目模型,获得所述法律文书的多个类别文书包括:
将所述法律文书输入至预先训练的智能编目模型;
获取所述法律文书任意相邻的两页的相关度;
若所述相关度大于预设相关度阈值,将所述相邻的两页划分为一类文书;
识别每类文书的标题行,并统计每类文书的页码范围;
根据每类文书的标题行以及所述页码范围,生成所述法律文书的多个类别文书。
3.根据权利要求1所述的法律要素处理方法,其特征在于,所述法律要素处理方法还包括:
接收第一用户对所述多个类别文书的第一反馈信息;
若所述第一反馈信息表明所述多个类别文书中存在分类错误的类别文书,获取所述第一用户对所述分类错误的类别文书进行修改后的目标类别文书;
判断当前时间是否处于预设的低频时间范围内;
若所述当前时间处于预设的低频时间范围内,使用所述目标类别文书对所述智能编目模型进行优化训练,获得优化后的智能编目模型。
4.根据权利要求1所述的法律要素处理方法,其特征在于,所述法律要素处理方法还包括:
接收第二用户对所述第一法律要素的第二反馈信息;
若所述第二反馈信息表明所述第一法律要素中存在标注错误的法律要素,获取所述第二用户对所述标注错误的法律要素进行修改后的目标法律要素;
判断当前时间是否处于预设的低频时间范围内;
若所述当前时间不处于预设的低频时间范围内,判断所述目标法律要素是否属于重要法律要素列表中的法律要素;
若所述目标法律要素属于重要法律要素列表中的法律要素,监测电子设备的剩余计算资源;
若所述剩余计算资源超过预设资源阈值,使用所述目标法律要素对所述要素抽取模型进行优化训练,获得优化后的要素抽取模型。
5.根据权利要求1所述的法律要素处理方法,其特征在于,所述法律要素处理方法还包括:...
【专利技术属性】
技术研发人员:于溦,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。