事件抽取、模型训练方法、装置、设备和存储介质制造方法及图纸

技术编号:35157303 阅读:18 留言:0更新日期:2022-10-12 17:14
本发明专利技术实施例提供了一种事件抽取、模型训练方法、装置、设备和存储介质。所述事件抽取方法包括:获取事件描述文本中的子文本;将所述子文本分别输入到事件抽取模型中的第一神经网络和第二神经网络中,相应地得到所述子文本基于多个事件触发词类型的第一概率分布、以及所述子文本基于多个事件实体类型的第二概率分布,其中,所述第一神经网络和所述第二神经网络经由联合训练得到;至少根据所述第一概率分布和所述第二概率分布,对所述事件描述文本进行事件抽取。本发明专利技术实施例的方案提高了事件抽取的准确度。抽取的准确度。抽取的准确度。

【技术实现步骤摘要】
事件抽取、模型训练方法、装置、设备和存储介质


[0001]本专利技术实施例涉及计算机
,尤其涉及一种事件抽取、模型训练方法、装置、设备和存储介质。

技术介绍

[0002]智能司法为用户、企业和机构提供了强大的技术和数据支持。诸如裁判文书、庭审笔录、原始证据材料等法律文书的分析在自然语言处理技术在智能司法中的应用中是十分重要以及基本的能力。
[0003]法律文书的分析的关键在与可靠的事件抽取,现有技术中,存在一种用于司法场景的事件抽取产品,使用管道式系统来依次解决诸如事件类型预测、相应的触发词识别、实体识别、语义角色的识别等问题。
[0004]具体而言,该事件抽取产品对触发词对应的事件进行分类,然后依赖事件分类的结果再进行实体和论元的抽取。但是这样会导致前一个模块预测出的结果的误差传播到后续的任务中但无法被纠正,从而不能对进行事件进行高效抽取。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供一种事件抽取、模型训练方法、装置、设备和存储介质,以解决或缓解上述问题。
[0006]根据本专利技术实施例的第一方面,提供了一种事件抽取方法,包括:获取事件描述文本中的子文本;将所述子文本分别输入到事件抽取模型中的第一神经网络和第二神经网络中,相应地得到所述子文本基于多个事件触发词类型的第一概率分布、以及所述子文本基于多个事件实体类型的第二概率分布,其中,所述第一神经网络和所述第二神经网络经由联合训练得到;至少根据所述第一概率分布和所述第二概率分布,对所述事件描述文本进行事件抽取。
[0007]根据本专利技术实施例的第二方面,提供了一种模型训练方法,包括:获取训练样本,所述训练样本中包括事件描述文本;至少基于所述事件描述文本的子文本作为输入,并且基于所述子文本的事件触发词类型标签作为第一神经网路的输出,基于所述子文本的事件实体类型标签作为第二神经网络的输出,对事件抽取模型进行联合训练,所述事件抽取模型包括所述第一神经网络和所述第二神经网络。
[0008]根据本专利技术实施例的第三方面,提供了一种事件抽取装置,包括:获取模块,获取事件描述文本中的子文本;模型推理模块,将所述子文本分别输入到事件抽取模型中的第一神经网络和第二神经网络中,相应地得到所述子文本基于多个事件触发词类型的第一概率分布、以及所述子文本基于多个事件实体类型的第二概率分布,其中,所述第一神经网络和所述第二神经网络经由联合训练得到;事件抽取模块,至少根据所述第一概率分布和所述第二概率分布,对所述事件描述文本进行事件抽取。
[0009]根据本专利技术实施例的第四方面,提供了一种模型训练装置,包括:获取模块,获取
训练样本,所述训练样本中包括事件描述文本;训练模块,至少基于所述事件描述文本的子文本作为输入,并且基于所述子文本的事件触发词类型标签作为第一神经网路的输出,基于所述子文本的事件实体类型标签作为第二神经网络的输出,对事件抽取模型进行联合训练,所述事件抽取模型包括所述第一神经网络和所述第二神经网络。
[0010]根据本专利技术实施例的第五方面,提供了一种电子设备,所述设备包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或第二方面所述的方法对应的操作。
[0011]根据本专利技术实施例的第六方面,提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或第二方面所述的方法。
[0012]在本专利技术实施例的方案中,由于第一神经网络和所述第二神经网络经由联合训练得到,因此子文本基于多个事件触发词类型的第一概率分布通过第一神经网络得到,子文本基于多个事件实体类型的第二概率分布通过第二神经网络得到,从而避免了对事件触发词类型和事件实体类型进行先后处理而导致的误差的积累,从而提高了事件抽取的准确度。
附图说明
[0013]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0014]图1为一个典型示例的司法文书服务平台的示意图;
[0015]图2为本专利技术的一个实施例的事件抽取方法的示意性流程图;
[0016]图3为本专利技术的另一实施例的事件抽取方法的示意性流程图;
[0017]图4为本专利技术的另一实施例的模型训练方法的示意性流程图;
[0018]图5为本专利技术的另一实施例的事件抽取装置的示意性框图;
[0019]图6为本专利技术的另一实施例的模型训练装置的示意性框图;以及
[0020]图7为本专利技术的另一实施例的电子设备的硬件结构。
具体实施方式
[0021]为了使本领域的人员更好地理解本专利技术实施例中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本专利技术实施例一部分实施例,而不是全部的实施例。基于本专利技术实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本专利技术实施例保护的范围。
[0022]下面结合本专利技术实施例附图进一步说明本专利技术实施例具体实现。
[0023]图1为一个典型示例的司法文书服务平台的示意图。裁判文书、庭审笔录、原始证据材料等文书的分析在自然语言处理技术在智能司法中的应用中是十分重要。基于自然语言处理技术构建了在司法文书服务平台中,该平台中包括上层应用和底层算法。底层算法加快对文书所提及的各种事实内容的结构化解析是诸如司法图谱生成、智能文答、证据链
生成等上游任务的基础。其中上层应用包括案件可视化、案件摘要、事实链生成、案件预测、案件摘要生成、事件知识问答等方面。底层算法包括要素抽取、事件抽取和诸如知识库的数据库支持等。
[0024]具体而言,事件抽取技术能够从裁判文书、案件卷宗等法律描述文本中,利用序列标注等自然语言处理技术抽取出独立的包含时间、人物、地点、描述的子事件,并根据子事件的时序关系、共指关因果关系等进行梳理,形成该法律文本对应的案件时间线和证据链,能够帮助用户快速理清案情,理解案情的发展。因此,事件抽取的任务在司法文书的解析中是至关重要的一环
[0025]在司法文书的解析及分析方向,由于需要很强的专业知识壁垒,并且将算法结合文书特有的特点,因此进行事件抽取的难度更大。
[0026]另外,除了司法文书处理方面,事件抽取在其它行业如新闻、金融也都有较为普遍的应用。
[0027]图2为本专利技术的一个实施例的事件抽取方法的示意性流程图。本专利技术实施例的方案可以适用于任意适当的具有数据处理能力的电子设备,包括但不限于:服务器、移动终端(如手机、PAD等)和PC机等。图1的事件抽取方法,包括:
[0028]210:获取事件描述文本中的子文本。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件抽取方法,包括:获取事件描述文本中的子文本;将所述子文本分别输入到事件抽取模型中的第一神经网络和第二神经网络中,相应地得到所述子文本基于多个事件触发词类型的第一概率分布、以及所述子文本基于多个事件实体类型的第二概率分布,其中,所述第一神经网络和所述第二神经网络经由联合训练得到;至少根据所述第一概率分布和所述第二概率分布,对所述事件描述文本进行事件抽取。2.根据权利要求1所述的方法,其中,所述子文本为所述事件描述文本中的文本字符,所述至少根据所述第一概率分布和所述第二概率分布,对所述事件描述文本进行事件抽取,包括:分别根据所述第一概率分布和所述第二概率分布,进行字符合并,得到事件触发词和事件实体;至少根据所述事件触发词和所述事件实体,对所述事件描述文本进行事件抽取。3.根据权利要求2所述的方法,其中,所述获取事件描述文本中的子文本,包括:获取所述事件描述文本中的文本句,所述文本句中包括所述文本字符,所述方法还包括:将所述文本句输入到所述事件抽取模型中的第三神经网络,得到所述文本句基于多个抽取事件个数的第三概率分布,其中,所述第一神经网络、所述第二神经网络和所述第三神经网络经由联合训练得到;根据所述第三概率分布,确定所述文本句对应的抽取事件个数,所述至少根据所述事件触发词和所述事件实体,对所述事件描述文本进行事件抽取,包括:根据所述事件触发词、所述事件实体和所述抽取事件个数,对所述事件描述文本进行事件抽取。4.根据权利要求3所述的方法,其中,所述获取所述事件描述文本中的文本句,包括:对所述事件描述文本进行分句处理,得到多个所述文本句,所述将所述子文本分别输入到事件抽取模型中的第一神经网络和第二神经网络中,包括:确定多个所述子文本中的当前所述文本;如果未遍历多个所述子文本,则将当前所述子文本分别输入到事件抽取模型中的第一神经网络和第二神经网络中,直到遍历多个所述子文本。5.根据权利要求3所述的方法,其中,所述根据所述事件触发词、所述事件实体和所述抽取事件个数,对所述事件描述文本进行事件抽取,包括:根据所述事件触发词、所述事件实体和所述抽取事件个数,进行事件抽取,得到所述事件描述文本中的多个事件;根据所述多个事件的时间顺序进行排列,得到事件抽取文本。6.根据权利要求3所述的方法,其中,所述获取所述事件描述文本中的文本句,包括:将所述事件描述文本输入到双向编解码器模型中,得到包括句首标记符号和句尾标记
符号的文本句;将所述文本句在所述句首标记符号与所述句尾标记符号之间的部分切分为所述子文本。7.一种模型训练方法,包括:获取训...

【专利技术属性】
技术研发人员:魏梦溪张雅婷
申请(专利权)人:阿里巴巴新加坡控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1