【技术实现步骤摘要】
文书的语义标签抽取、装置、电子设备及可读存储介质
本申请实施例涉及计算机领域中的深度学习技术,尤其涉及一种文书的语义标签抽取、装置、电子设备及可读存储介质。
技术介绍
法律文书中蕴含着丰富的知识,通过对法律文书的知识进行正确的归纳和抽取,能够加深对法律文书的理解,从而在检索相关性、推荐及辅助庭审等应用场景中发挥重要的作用。其中,归纳法律文书的语义标签,是一种重要的法律文书知识归纳和抽取方式。示例性的,对于“张三驾驶车辆A在路口发生交通事故”,可以将其归纳为“侵权人驾驶机动车”这一语义标签。现有技术中,可以通过多分类的方式抽取法律文书的语义标签。具体的,将每个语义标签作为分类目标,通过机器学习计算原文分类到每个语义标签的概率,所有语义标签的概率之和为1,将概率最高的一个或多个语义标签作为原文的语义标签。但是,使用现有技术的方法可能导致所抽取出的语义标签的准确率较低。
技术实现思路
本申请提供了一种文书的语义标签抽取、装置、电子设备及可读存储介质。根据本申请的一方面,提供了一种文书的语义标签抽取方法,包括:获取待抽取语义标签的目标文书;将所述目标文书输入目标抽取模型中,得到所述目标文书的语义标签,所述目标抽取模型通过对初始抽取模型进行训练得到,所述初始抽取模型用于执行语义标签识别任务以及角色信息识别任务,所述语义标签识别任务的结果和所述角色信息识别任务的结果用于调整所述初始抽取模型的参数;输出所述目标文书的语义标签。根据本申请的另一方面,提供了一种文书的语义标签抽取装置,包括: ...
【技术保护点】
1.一种文书的语义标签抽取方法,包括:/n获取待抽取语义标签的目标文书;/n将所述目标文书输入目标抽取模型中,得到所述目标文书的语义标签,所述目标抽取模型通过对初始抽取模型进行训练得到,所述初始抽取模型用于执行语义标签识别任务以及角色信息识别任务,所述语义标签识别任务的结果和所述角色信息识别任务的结果用于调整所述初始抽取模型的参数;/n输出所述目标文书的语义标签。/n
【技术特征摘要】 【专利技术属性】
1.一种文书的语义标签抽取方法,包括:
获取待抽取语义标签的目标文书;
将所述目标文书输入目标抽取模型中,得到所述目标文书的语义标签,所述目标抽取模型通过对初始抽取模型进行训练得到,所述初始抽取模型用于执行语义标签识别任务以及角色信息识别任务,所述语义标签识别任务的结果和所述角色信息识别任务的结果用于调整所述初始抽取模型的参数;
输出所述目标文书的语义标签。
2.根据权利要求1所述的方法,所述将所述目标文书输入目标抽取模型中,得到所述目标文书的语义标签之前,还包括:
将预先标注的训练文书输入所述初始抽取模型,得到初始抽取模型的语义标签识别任务的结果以及所述角色信息识别任务的结果;
根据所述训练文书的标注信息、所述初始抽取模型当前的参数、所述语义标签识别任务的结果以及所述角色信息识别任务的结果,调整所述初始抽取模型当前的参数。
3.根据权利要求2所述的方法,其中,所述根据所述训练文书的标注信息、所述初始抽取模型当前的参数、所述语义标签识别任务的结果以及所述角色信息识别任务的结果,调整所述初始抽取模型当前的参数,包括:
根据所述训练文书的标注信息、所述初始抽取模型当前的参数以及所述语义标签识别任务的结果,确定所述语义标签识别任务的损失信息;
根据所述训练文书的标注信息、所述初始抽取模型当前的参数以及所述角色信息识别任务的结果,确定所述角色信息识别任务的损失信息;
根据所述语义标签识别任务的损失信息以及所述角色信息识别任务的损失信息,调整所述初始抽取模型当前的参数。
4.根据权利要求3所述的方法,其中,所述根据所述语义标签识别任务的损失信息以及所述角色信息识别任务的损失信息,调整所述初始抽取模型当前的参数,包括:
将所述语义标签识别任务的损失信息与角色损失信息相加,得到所述初始抽取模型的损失信息,所述角色损失信息为所述角色信息识别任务的损失信息与预设权重值的乘积;
使用所述初始抽取模型的损失信息,调整所述初始抽取模型当前的参数。
5.根据权利要求4所述的方法,其特征在于,所述预设权重值为大于0且小于1的数值。
6.根据权利要求2-5任一项所述的方法,其中,所述将预先标注的训练文书输入所述初始抽取模型,得到初始抽取模型的语义标签识别任务的结果以及所述角色信息识别任务的结果,包括:
将所述训练文书输入所述初始抽取模型,由所述初始抽取模型生成所述初始抽取模型待学习的参数个数以及表征所述训练文书的向量,并以所述训练文书的向量和基于所述参数个数所得到的所述初始抽取模型当前的参数,分别作为所述语义标签识别任务的输入信息以及所述角色信息识别任务的输入信息,执行所述语义标签识别任务以及所述角色信息识别任务,得到所述语义标签识别任务的结果以及所述角色信息识别任务的结果。
7.根据权利要求6所述的方法,其中,所述由所述初始抽取模型生成所述初始抽取模型待学习的参数个数以及表征所述训练文书的向量,包括:
由所述初始抽取模型使用第一网络生成所述待学习的参数个数以及表征所述训练文书的向量集合,所述向量集合包括至少一个向量,每个向量对应至少一个子参数,各向量的子参数之和为所述待学习的参数个数。
8.根据权利要求7所述的方法,其中,所述第一网络为长短期记忆网络LSTM。
技术研发人员:杨天行,彭彬,杨晨,张一麟,宋勋超,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。