裁判文书要素抽取方法、装置、设备及存储介质制造方法及图纸

技术编号:39396342 阅读:10 留言:0更新日期:2023-11-19 15:50
本申请提供一种裁判文书要素抽取方法、装置、设备及存储介质,方法包括:响应于用户端发送的裁判文书的要素抽取请求,调用实体抽取模型抽取所述裁判文书的原告标题和被告标题;将所述原告标题和所述被告标题输入到预设模板中,生成对应所述原告标题和所述被告标题的提示模板;根据所述提示模板的提示内容,抽取所述裁判文书中的原告信息和被告信息;根据所述原告信息和所述被告信息,生成所述裁判文书的关键要素。本申请具有的技术效果是:在处理新的数据集或领域时,无需更新和修改规则,减少了工作量。了工作量。了工作量。

【技术实现步骤摘要】
裁判文书要素抽取方法、装置、设备及存储介质


[0001]本申请涉及信息提取
,具体涉及一种裁判文书要素抽取方法、装置、设备及存储介质。

技术介绍

[0002]企业风险信息查询包含知识产权相关风险,而知识产权风险信息主要来源于知识产权裁判文书的关键信息,如原告标题、原告名称、原告地址、被告标题、被告名称、被告地址等。
[0003]目前通常采用规则抽取的方式抽取裁判文书的关键信息,规则抽取通过事先定义和编写规则,可以准确地抽取出关键信息。
[0004]但针对规则的编写,通常需要领域专家进行编写,这样的依赖性使得规则抽取方法在处理新的数据集或领域时需要不断更新和修改规则,工作量较大。

技术实现思路

[0005]本申请提供一种裁判文书要素抽取方法、装置、设备及存储介质,用于在处理新的数据集或领域时,无需更新和修改规则,减少了工作量。
[0006]第一方面,本申请提供了一种裁判文书要素抽取方法,方法包括:响应于用户端发送的裁判文书的要素抽取请求,调用实体抽取模型抽取所述裁判文书的原告标题和被告标题;将所述原告标题和所述被告标题输入到预设模板中,生成对应所述原告标题和所述被告标题的提示模板;根据所述提示模板的提示内容,抽取所述裁判文书中的原告信息和被告信息;根据所述原告信息和所述被告信息,生成所述裁判文书的关键要素。
[0007]通过采用上述技术方案,先通过实体抽取模型抽取裁判文书中的原告标题和被告标题,然后通过原告标题和被告标题构建提示模板,通过提示模板进行抽取裁判文书中的关键信息,整个过程无需过多人工参与,无需领域专家进行编写,即使在处理新的数据集或领域时也无需更新和修改规则,适用性强,可以适用于所有的裁判文书的关键要素提取。
[0008]可选的,所述响应于所述用户端发送的裁判文书的要素抽取请求,调用实体抽取模型抽取所述裁判文书的原告标题和被告标题之前,还包括:获取所述用户端输入的第一训练数据,根据所述第一训练数据,构建所述实体抽取模型。
[0009]通过采用上述技术方案,通过对用户端输入的大量的第一训练数据进行训练,得到实体抽取模型,便于后续通过实体抽取模型准确的抽取裁判文书中的原告标题和被告标题,从而准确的抽取裁判文书中的关键要素。
[0010]可选的,所述第一训练数据包括附带标注的数据,所述获取所述用户端输入的第一训练数据,根据所述第一训练数据,构建所述实体抽取模型,包括:获取所述用户端输入的所述附带标注的数据,所述附带标注的数据中包括被标注的原告标题和被标注的被告标题;调用预设抽取模型,抽取所述附带标注的数据中的所述被标注的原告标题和所述被标注的被告标题,得到所述原告标题和所述被告标题的种类;根据所述原告标题和所述被告
标题的种类,构建所述实体抽取模型。
[0011]通过采用上述技术方案,通过对用户端输入的大量的第一训练数据进行训练,得到实体抽取模型,便于后续通过实体抽取模型准确的抽取裁判文书中的原告标题和被告标题,从而准确的抽取裁判文书中的关键要素。
[0012]可选的,所述获取所述用户端输入的第一训练数据,根据所述第一训练数据,构建所述实体抽取模型之后,还包括:获取所述用户端输入的第二训练数据,通过所述实体抽取模型抽取所述第二训练数据,得到训练结果;发送所述训练结果至所述用户端,并接收所述用户端发送的第一反馈信息;根据所述第一反馈信息调节所述实体抽取模型。
[0013]通过采用上述技术方案,构建实体训练模型后,通过用户端输入的第二训练数据对实体训练模型进行训练,然后接收用户端发送的第一反馈信息,使得最终得到的实体训练模型更加适用于用户端,也使得后续通过实体抽取模型准确的抽取裁判文书中的原告标题和被告标题,从而准确的抽取裁判文书中的关键要素。
[0014]可选的,所述响应于所述用户端发送的裁判文书的要素抽取请求之后,还包括:获取预设模板;根据所述预设模板,判断所述裁判文书是否符合预设要求;若符合所述预设要求,则调用所述实体抽取模型抽取所述裁判文书的原告标题和被告标题;若不符合所述预设要求,则将所述裁判文书的内容进行删减或补充,得到新的裁判文书,并调用所述实体抽取模型抽取所述新的裁判文书的原告标题和被告标题。
[0015]通过采用上述技术方案,通过预设模块可以判断裁判文是否符合预设要求,根据是否符合预设要求,对裁判文书进行处理,使得实体抽取模型能够容易的从裁判文书中抽取原告标题和被告标题,使得后续通过实体抽取模型能够准确的抽取裁判文书中的原告标题和被告标题,从而准确的抽取裁判文书中的关键要素。
[0016]可选的,所述根据所述原告信息和所述被告信息,生成所述裁判文书的关键要素,包括:调用开源模型对所述原告信息和所述被告信息进行处理,生成文本信息,所述文本信息为所述裁判文书的关键要素。
[0017]通过采用上述技术方案,调用开源模型对原告信息和被告信息进行处理,便可以生成文本信息,整个过程无需过多人工参与,无需领域专家进行编写,即使在处理新的数据集或领域时也无需更新和修改规则,适用性强,可以适用于所有的裁判文书的关键要素提取。
[0018]可选的,所述裁判文书的关键要素包括原告关键要素和被告关键要素,所述根据所述原告信息和所述被告信息,生成所述裁判文书的关键要素,包括:抽取所述原告信息中的原告名称和原告地址,结合所述原告标题、所述原告名称及所述原告地址,生成原告关键要素;抽取所述被告信息中的被告名称和被告地址,结合所述被告标题、所述被告名称及所述被告地址,生成被告关键要素;结合所述原告关键要素和所述被告关键要素,生成所述裁判文书的关键要素。
[0019]通过采用上述技术方案,可以根据用户所需提取裁判文书中的关键要素,整个过程无需过多人工参与,无需领域专家进行编写,即使在处理新的数据集或领域时也无需更新和修改规则,适用性强,可以适用于所有的裁判文书的关键要素提取。
[0020]第二方面,本申请提供一种裁判文书要素抽取装置,所述装置包括:调用模块1、第一生成模块2、抽取模块3及第二生成模块4;其中,所述调用模块1用于响应于用户端发送的
裁判文书的要素抽取请求,调用实体抽取模型抽取所述裁判文书的原告标题和被告标题;所述第一生成模块2用于将所述原告标题和所述被告标题输入到预设模板中,生成对应所述原告标题和所述被告标题的提示模板;所述抽取模块3用于根据所述提示模板的提示内容,抽取所述裁判文书中的原告信息和被告信息;所述第二生成模块4根据所述原告信息和所述被告信息,生成所述裁判文书的关键要素。
[0021]通过采用上述技术方案,先通过实体抽取模型抽取裁判文书中的原告标题和被告标题,然后通过原告标题和被告标题构建提示模板,通过提示模板进行抽取裁判文书中的关键信息,整个过程无需过多人工参与,无需领域专家进行编写,即使在处理新的数据集或领域时也无需更新和修改规则,适用性强,可以适用于所有的裁判文书的关键要素提取。
[0022]第三方面,本申请提供一种电子设备,采用如下技术方案:包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.裁判文书要素抽取方法,其特征在于,应用于服务器,所述方法包括:响应于用户端发送的裁判文书的要素抽取请求,调用实体抽取模型抽取所述裁判文书的原告标题和被告标题;将所述原告标题和所述被告标题输入到预设模板中,生成对应所述原告标题和所述被告标题的提示模板;根据所述提示模板的提示内容,抽取所述裁判文书中的原告信息和被告信息;根据所述原告信息和所述被告信息,生成所述裁判文书的关键要素。2.根据权利要求1所述的裁判文书要素抽取方法,其特征在于,所述响应于所述用户端发送的裁判文书的要素抽取请求,调用实体抽取模型抽取所述裁判文书的原告标题和被告标题之前,还包括:获取所述用户端输入的第一训练数据,根据所述第一训练数据,构建所述实体抽取模型。3.根据权利要求2所述的裁判文书要素提取方法,其特征在于,所述第一训练数据包括附带标注的数据,所述获取所述用户端输入的第一训练数据,根据所述第一训练数据,构建所述实体抽取模型,包括:获取所述用户端输入的所述附带标注的数据,所述附带标注的数据中包括被标注的原告标题和被标注的被告标题;调用预设抽取模型,抽取所述附带标注的数据中的所述被标注的原告标题和所述被标注的被告标题,得到所述原告标题和所述被告标题的种类;根据所述原告标题和所述被告标题的种类,构建所述实体抽取模型。4.根据权利要求2所述的裁判文书要素提取方法,其特征在于,所述获取所述用户端输入的第一训练数据,根据所述第一训练数据,构建所述实体抽取模型之后,还包括:获取所述用户端输入的第二训练数据,通过所述实体抽取模型抽取所述第二训练数据,得到训练结果;发送所述训练结果至所述用户端,并接收所述用户端发送的第一反馈信息;根据所述第一反馈信息调节所述实体抽取模型。5.根据权利要求1所述的裁判文书要素提取方法,其特征在于,所述响应于所述用户端发送的裁判文书的要素抽取请求之后,还包括:获取预设模板;根据所述预设模板,判断所述裁判文书是否符合预设要求;若符合所述预设要求,则调用所述实体抽取模型抽取所述裁判文书的原告标题和被告标题;若不符合所述预设要求,则将所述裁判文书的内容进行删减或补充,得到新的裁判文书,并调用所述实...

【专利技术属性】
技术研发人员:黄威威张晗邹伟东许树淮包智洪英文
申请(专利权)人:企知道科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1